Kolejna relacja z wywiadu Matta Cuttsa z dnia 9 czerwca 2010.

Relacja z wywiadu z 14 marca

Wywiad porusza zagadnienia związane z nagłówkiem If-Modified-Since, kodem odpowiedzi http 503, przekierowaniami wielokrotnymi oraz wyborem adresów URL do indeksowania. W wywiadzie poruszona została również kwestia serwisów wielojęzycznych i ich widoczności dla Google, a także zależność pomiędzy liczbą linków wychodzących a PageRankiem.

Główne zagadnienia

Nagłówek If-Modified-Since:

  • Nagłówek If-Modified-Since nakazuje serwerowi przesłać dokument tylko, jeżeli został on zmodyfikowany od podanej daty. Jeżeli dokument się nie zmienił serwer powinien wysłać przeglądarce kod odpowiedzi 304 (Not Modified).
  • Nagłówek If-Modified-Since może być używany do ręcznego powiadamiania Google czy zawartość danej strony zmieniła się, czy nie.
  • Google zaczął wykorzystywać nagłówek If-Modified-Since w 2003 roku kiedy przepustowość łącza internetowego miała duże znaczenie. Jednak obecnie nie jest on już tak istotny.
  • Stosowanie nagłówka If-Modified-Since jest nadal dobrą, zalecaną praktyką, lecz nie koniecznie pomaga w szybszym zindeksowaniu stron.

Kod odpowiedzi HTTP 503:

  • Kod HTTP 503 (Service Unavailable) to kod błędu wewnętrznego, który informuje, że usługa jest niedostępna ze względu na przeciążenie serwera.
  • Kod 503 pomaga uniknąć zindeksowania strony w trakcie budowy lub podczas problemów z serwerem. Zagrożenie dotyczy szczególnie dużych popularnych serwisów.
  • Nie można określić kiedy robot wyszukiwarki powinien ponownie odwiedzić stronę i ją zindeksować, ale otrzymując kod 503 dostanie informację, że nie powinien indeksować aktualnej zawartości strony lecz powróci później.
  • Należy używać kodu statusu 503 zamiast strony informującej o napotkanym błędzie, (np. przeciążeniu serwera) posiadającej status HTTP 200 (OK). Związane jest to z tym, że robot może zindeksować taką stronę ponieważ kod HTTP sugeruje, że funkcjonuje ona prawidłowo. Natomiast jeżeli robot otrzyma kod 503, to odłoży indeksowanie na później.

Wybór adresów URL do indeksowania:

  • Ponieważ Google indeksuje strony w kolejności określonej przez PageRank, to najpierw otrzymuje najlepszą zawartość, unikając stron słabej jakości, czy zawierających spam.
  • Największym problemem jest znajdowanie treści duplikowanych lub poprzednio zbanowanych. Aktualnie około 28% zawartości jaką widzi Google jest duplikatem.
  • Ważne jest rozróżnienie popularności treści od jej jakości. Ruch nie jest znaczącym współczynnikiem pozycji w wynikach wyszukiwania, a PageRank stron nie odzwierciedla ich popularności.

Przekierowania wielokrotne:

  • Łączenie przekierowań w łańcuch przekierowań jest bardzo złą praktyką.
  • Google radzi sobie z jednym przekierowaniem lub przekierowaniem podwójnym. Treść, która jest dostępna po liczbie kolejnych przekierowań większej niż dwa, prawdopodobnie nie będzie śledzona.
  • Przekierowania 302 powinny być stosowane wyłącznie do przekierowań tymczasowych.

Adres URL – zamykający ukośnik:

  • Zalecane jest stosowanie ukośnika zamykającego adres URL (np. example.com/folder/ zamiast example.com/folder), ponieważ wskazuje on, że adres URL jest folderem, a nie dokumentem. Mimo tego, Google dosyć dobrze radzi sobie z rozróżnianiem tych elementów, więc nie jest to aż tak bardzo istotne.

Indeksowanie z różnych lokalizacji geograficznych:

  • Zagadnienie dotyczy serwisów wielojęzycznych i ich widoczności dla Google.
  • Roboty Google indeksują strony z jednej puli adresów IP na całym świecie, ponieważ istnieje jeden globalny indeks, i nie obliczają one różnych wskaźników dla różnych krajów.
  • Nie należy przesyłać znacznie różniącej się zawartości użytkownikom z różnych krajów w oparciu o ich adres IP. Np. treści polskiej dla użytkowników z adresów IP zlokalizowanych w Polsce. Googlebot może nie zobaczyć takiej zawartości, ponieważ posiada IP z innego zakresu.
  • Należy kierować początkowo wszystkich użytkowników do tej samej zawartości i zezwalać im na nawigację do obszarów serwisu skierowanych dla danej lokalizacji geograficznej.
  • Dopóki Google nie będzie sobie dobrze radził z obsługą menu rozwijanego, JavaScriptem, itp. zaleca się stosowanie linków statycznych do takiej nawigacji.

Liczba linków wychodzących a PageRank:

  • W oryginalnym (pierwotnym) algorytmie PageRank wartość (głosy) przechodziły do innych stron według prostego wzoru – przesyłany PageRank (Passable PR) był dzielony przez liczbę linków wychodzących.
  • Obecnie algorytm PageRank jest bardziej cykliczną, iteracyjna analizą i liczba linków wychodzących nie ma aż takiego znaczenia, jak się powszechnie sądzi.
  • Nie ma potrzeby gromadzenia całej wartości linków we własnym serwisie (w sensie unikania linkowania zewnętrznego jako osłabiającego wartość witryny).
  • W rzeczywistości linkowanie zewnętrzne może przynieść pewne korzyści (a przynajmniej nie w jego ograniczaniu tkwi siła budowania linkowania).
  • Serwisy linkujące do innych witryn są częściej same z nich linkowane, co jest korzystne ze względu na iteracyjny charakter algorytmu PageRank.

Źródło: http://www.seomoz.org/blog/whiteboard-interview-googles-matt-cutts-on-redirects-trust-more

0 komentarzy:

Dodaj komentarz

Chcesz się przyłączyć do dyskusji?
Feel free to contribute!

Dodaj komentarz