Kolejna relacja z wywiadu Matta Cuttsa z dnia 9 czerwca 2010.

Relacja z wywiadu z 14 marca

Wywiad porusza zagadnienia związane z nagłówkiem If-Modified-Since, kodem odpowiedzi http 503, przekierowaniami wielokrotnymi oraz wyborem adresów URL do indeksowania. W wywiadzie poruszona została również kwestia serwisów wielojęzycznych i ich widoczności dla Google, a także zależność pomiędzy liczbą linków wychodzących a PageRankiem.

Główne zagadnienia

Nagłówek If-Modified-Since:

 • Nagłówek If-Modified-Since nakazuje serwerowi przesłać dokument tylko, jeżeli został on zmodyfikowany od podanej daty. Jeżeli dokument się nie zmienił serwer powinien wysłać przeglądarce kod odpowiedzi 304 (Not Modified).
 • Nagłówek If-Modified-Since może być używany do ręcznego powiadamiania Google czy zawartość danej strony zmieniła się, czy nie.
 • Google zaczął wykorzystywać nagłówek If-Modified-Since w 2003 roku kiedy przepustowość łącza internetowego miała duże znaczenie. Jednak obecnie nie jest on już tak istotny.
 • Stosowanie nagłówka If-Modified-Since jest nadal dobrą, zalecaną praktyką, lecz nie koniecznie pomaga w szybszym zindeksowaniu stron.

Kod odpowiedzi HTTP 503:

 • Kod HTTP 503 (Service Unavailable) to kod błędu wewnętrznego, który informuje, że usługa jest niedostępna ze względu na przeciążenie serwera.
 • Kod 503 pomaga uniknąć zindeksowania strony w trakcie budowy lub podczas problemów z serwerem. Zagrożenie dotyczy szczególnie dużych popularnych serwisów.
 • Nie można określić kiedy robot wyszukiwarki powinien ponownie odwiedzić stronę i ją zindeksować, ale otrzymując kod 503 dostanie informację, że nie powinien indeksować aktualnej zawartości strony lecz powróci później.
 • Należy używać kodu statusu 503 zamiast strony informującej o napotkanym błędzie, (np. przeciążeniu serwera) posiadającej status HTTP 200 (OK). Związane jest to z tym, że robot może zindeksować taką stronę ponieważ kod HTTP sugeruje, że funkcjonuje ona prawidłowo. Natomiast jeżeli robot otrzyma kod 503, to odłoży indeksowanie na później.

Wybór adresów URL do indeksowania:

 • Ponieważ Google indeksuje strony w kolejności określonej przez PageRank, to najpierw otrzymuje najlepszą zawartość, unikając stron słabej jakości, czy zawierających spam.
 • Największym problemem jest znajdowanie treści duplikowanych lub poprzednio zbanowanych. Aktualnie około 28% zawartości jaką widzi Google jest duplikatem.
 • Ważne jest rozróżnienie popularności treści od jej jakości. Ruch nie jest znaczącym współczynnikiem pozycji w wynikach wyszukiwania, a PageRank stron nie odzwierciedla ich popularności.

Przekierowania wielokrotne:

 • Łączenie przekierowań w łańcuch przekierowań jest bardzo złą praktyką.
 • Google radzi sobie z jednym przekierowaniem lub przekierowaniem podwójnym. Treść, która jest dostępna po liczbie kolejnych przekierowań większej niż dwa, prawdopodobnie nie będzie śledzona.
 • Przekierowania 302 powinny być stosowane wyłącznie do przekierowań tymczasowych.

Adres URL – zamykający ukośnik:

 • Zalecane jest stosowanie ukośnika zamykającego adres URL (np. example.com/folder/ zamiast example.com/folder), ponieważ wskazuje on, że adres URL jest folderem, a nie dokumentem. Mimo tego, Google dosyć dobrze radzi sobie z rozróżnianiem tych elementów, więc nie jest to aż tak bardzo istotne.

Indeksowanie z różnych lokalizacji geograficznych:

 • Zagadnienie dotyczy serwisów wielojęzycznych i ich widoczności dla Google.
 • Roboty Google indeksują strony z jednej puli adresów IP na całym świecie, ponieważ istnieje jeden globalny indeks, i nie obliczają one różnych wskaźników dla różnych krajów.
 • Nie należy przesyłać znacznie różniącej się zawartości użytkownikom z różnych krajów w oparciu o ich adres IP. Np. treści polskiej dla użytkowników z adresów IP zlokalizowanych w Polsce. Googlebot może nie zobaczyć takiej zawartości, ponieważ posiada IP z innego zakresu.
 • Należy kierować początkowo wszystkich użytkowników do tej samej zawartości i zezwalać im na nawigację do obszarów serwisu skierowanych dla danej lokalizacji geograficznej.
 • Dopóki Google nie będzie sobie dobrze radził z obsługą menu rozwijanego, JavaScriptem, itp. zaleca się stosowanie linków statycznych do takiej nawigacji.

Liczba linków wychodzących a PageRank:

 • W oryginalnym (pierwotnym) algorytmie PageRank wartość (głosy) przechodziły do innych stron według prostego wzoru – przesyłany PageRank (Passable PR) był dzielony przez liczbę linków wychodzących.
 • Obecnie algorytm PageRank jest bardziej cykliczną, iteracyjna analizą i liczba linków wychodzących nie ma aż takiego znaczenia, jak się powszechnie sądzi.
 • Nie ma potrzeby gromadzenia całej wartości linków we własnym serwisie (w sensie unikania linkowania zewnętrznego jako osłabiającego wartość witryny).
 • W rzeczywistości linkowanie zewnętrzne może przynieść pewne korzyści (a przynajmniej nie w jego ograniczaniu tkwi siła budowania linkowania).
 • Serwisy linkujące do innych witryn są częściej same z nich linkowane, co jest korzystne ze względu na iteracyjny charakter algorytmu PageRank.

Źródło: http://www.seomoz.org/blog/whiteboard-interview-googles-matt-cutts-on-redirects-trust-more