,

Operator site: – skąd ta kolejność wyników?

W jednym z najnowszych filmów wideo w kanale YouTube GoogleWebmasterHelp Matt Cutts odpowiedział na pytanie w jaki sposób ustalana jest kolejność wyników wyszukiwania przy wykorzystaniu operatora site: (np. site:example.com). Zadający pytanie internauta na podstawie własnego doświadczenia zauważył, że strony wyświetlane w tych wynikach jako pierwsze posiadają większy ruch z wyników wyszukiwania. Według Matta Google używa kombinacji kilku czynników, np.:

  • pewnej przybliżonej (okrojonej) wersji PageRank, ale nie jest to dokładna kolejność według jego wartości
  • być może znaczenie ma długość adresów URL – te które wydają się być adresami URL strony głównej lub te o katalog niżej w strukturze traktowane są jako najważniejsze (tak czy owak wydają się przyciągać najwięcej linków do witryny).

Jest to połączenie różnych czynników mające na celu wywindowanie stron, które Google uważa za użyteczne – zgodnie z PageRank lub położeniem strony blisko strony głównej. Matt mówi kilka razy o długości adresów URL, a nie konkretnie o położeniu w strukturze witryny.

Powiązanie właściwości strony i pozycji w wynikach zapytania z operatorem site:

W ramach testu pobieżnie sprawdziłem jakie jest powiązanie pozycji w wynikach wyszukiwania Google (z operatorem site:) dla popularnej witryny w stosunku do następujących wskaźników strony:

  • liczby odwiedzin z ostatniego miesiąca
  • wartości Toolbar PageRank
  • poziomu zagłębienia w strukturze logicznej witryny (część podkategorii i produktów jest linkowana ze strony głównej, ale nie było brane to pod uwagę)
  • długości względnego adresu URL.

Cechy charakterystyczne witryny:

  • liczba odwiedzin witryny w miesiącu na poziomie 50-80 tys.
  • Toolbar PageRank strony głównej: 5
  • maksymalnie 4-5 poziomów zagłębienia w strukturze witryny (poziom strony głównej to 0)
  • małe zróżnicowanie długości adresów URL (adresy URL nie odzwierciedlają poziomu zagłębienia podstron).

Poniższe wykresy przedstawiają powiązanie pozycji w wynikach wyszukiwania z poszczególnymi właściwościami podstron w wartościach liczbowych oraz pokazują krzywe regresji liniowej.

Liczba odwiedzin strony z ostatniego miesiąca a pozycja w SERP na zapytanie z operatorem site:
Liczba odwiedzin a pozycja w SERP

Wartość Toolbar PageRank strony a pozycja w SERP na zapytanie z operatorem site:
Wartość Toolbar PageRank a pozycja w SERP

Poziom zagłębienia strony w strukturze witryny a pozycja w SERP na zapytanie site:
Poziom zagłębienia w strukturze witryny a pozycja w SERP

Liczba znaków względnego adresu URL strony a pozycja w SERP na zapytanie z operatorem site:
Liczba znaków adresu URL a pozycja w SERP

Wykresy wydają się wskazywać na pewne zależności między wybranymi czynnikami a pozycją w wynikach wyszukiwania, ale nie można określić jednoznacznie co ma wpływ, choćby z powodu na korelację tych cech (np. PageRank jest powiązany z poziomem zagłębienia). Wyniki wyszukiwania z operatorem site: odzwierciedlają w jakimś stopniu jak wyszukiwarka widzi wagę poszczególnych stron w witrynie, ale czy Google zależy na przekazaniu dokładnych informacji? Patrząc na estymację liczby znalezionych wyników w SERP z pewnością nie.

W filmie wideo „How are site: results ranked?” można dokładnie wsłuchać się w wypowiedź Matta Cuttsa – może jest tam jakiś przekaz podprogowy?:

Kolejność wyników jest stosunkowo dobrym przybliżeniem stron ze względu na ich ważność (?), ale nie jest to na pewno perfekcyjna lista.