Operator site: – skąd ta kolejność wyników?
W jednym z najnowszych filmów wideo w kanale YouTube GoogleWebmasterHelp Matt Cutts odpowiedział na pytanie w jaki sposób ustalana jest kolejność wyników wyszukiwania przy wykorzystaniu operatora site: (np. site:example.com). Zadający pytanie internauta na podstawie własnego doświadczenia zauważył, że strony wyświetlane w tych wynikach jako pierwsze posiadają większy ruch z wyników wyszukiwania. Według Matta Google używa kombinacji kilku czynników, np.:
- pewnej przybliżonej (okrojonej) wersji PageRank, ale nie jest to dokładna kolejność według jego wartości
- być może znaczenie ma długość adresów URL – te które wydają się być adresami URL strony głównej lub te o katalog niżej w strukturze traktowane są jako najważniejsze (tak czy owak wydają się przyciągać najwięcej linków do witryny).
Jest to połączenie różnych czynników mające na celu wywindowanie stron, które Google uważa za użyteczne – zgodnie z PageRank lub położeniem strony blisko strony głównej. Matt mówi kilka razy o długości adresów URL, a nie konkretnie o położeniu w strukturze witryny.
Powiązanie właściwości strony i pozycji w wynikach zapytania z operatorem site:
W ramach testu pobieżnie sprawdziłem jakie jest powiązanie pozycji w wynikach wyszukiwania Google (z operatorem site:) dla popularnej witryny w stosunku do następujących wskaźników strony:
- liczby odwiedzin z ostatniego miesiąca
- wartości Toolbar PageRank
- poziomu zagłębienia w strukturze logicznej witryny (część podkategorii i produktów jest linkowana ze strony głównej, ale nie było brane to pod uwagę)
- długości względnego adresu URL.
Cechy charakterystyczne witryny:
- liczba odwiedzin witryny w miesiącu na poziomie 50-80 tys.
- Toolbar PageRank strony głównej: 5
- maksymalnie 4-5 poziomów zagłębienia w strukturze witryny (poziom strony głównej to 0)
- małe zróżnicowanie długości adresów URL (adresy URL nie odzwierciedlają poziomu zagłębienia podstron).
Poniższe wykresy przedstawiają powiązanie pozycji w wynikach wyszukiwania z poszczególnymi właściwościami podstron w wartościach liczbowych oraz pokazują krzywe regresji liniowej.
Liczba odwiedzin strony z ostatniego miesiąca a pozycja w SERP na zapytanie z operatorem site:
Wartość Toolbar PageRank strony a pozycja w SERP na zapytanie z operatorem site:
Poziom zagłębienia strony w strukturze witryny a pozycja w SERP na zapytanie site:
Liczba znaków względnego adresu URL strony a pozycja w SERP na zapytanie z operatorem site:
Wykresy wydają się wskazywać na pewne zależności między wybranymi czynnikami a pozycją w wynikach wyszukiwania, ale nie można określić jednoznacznie co ma wpływ, choćby z powodu na korelację tych cech (np. PageRank jest powiązany z poziomem zagłębienia). Wyniki wyszukiwania z operatorem site: odzwierciedlają w jakimś stopniu jak wyszukiwarka widzi wagę poszczególnych stron w witrynie, ale czy Google zależy na przekazaniu dokładnych informacji? Patrząc na estymację liczby znalezionych wyników w SERP z pewnością nie.
W filmie wideo „How are site: results ranked?” można dokładnie wsłuchać się w wypowiedź Matta Cuttsa – może jest tam jakiś przekaz podprogowy?:
Kolejność wyników jest stosunkowo dobrym przybliżeniem stron ze względu na ich ważność (?), ale nie jest to na pewno perfekcyjna lista.