Zapoznanie się z funkcjonowaniem protokołu HTTP i obsługiwanymi przez niego kodami może ułatwić zrozumienie niektórych błędów indeksowania stron. Podczas każdej próby odwiedzenia adresu URL (np. przez przeglądarkę internetową lub przez robota wyszukiwarki) wysyłane jest żądanie udostępnienia strony witryny. Serwer WWW w odpowiedzi na żądanie zwraca kod stanu HTTP, który dostarcza informację na temat żądanej strony.

Wielu z nas nie raz zadawało sobie pytanie, czy widoczności witryny w wynikach wyszukiwania Google można zostać zagrożona jeśli jest ona niedostępna, wówczas gdy Googlebot próbuje ją odnaleźć. Bywają bowiem czasami takie sytuację, w przypadku których nie da się uniknąć pewnych przestojów, np. podczas aktualizacji witryny. Kiedy tego typu awarie nie zostaną wyraźnie oznaczone, mogą negatywnie wpłynąć na reputację witryny. I mimo, że Google nie może zagwarantować, że dana witryna będzie indeksowana i umieszczona w rankingu, to istnieją metody radzenia sobie z planowanymi przestojami witryny w sposób, który zazwyczaj nie będzie negatywnie wpływał na jej widoczności w wynikach wyszukiwania.

Na przykład, zamiast zwracać kod odpowiedzi HTTP 404 (Nie znaleziono) albo pokazywać stronę z kodem stanu 200 (OK), kiedy nastąpi żądanie strony, lepiej zwrócić kod 503 (usługa niedostępna), informujący roboty wyszukiwarek internetowych, że przestoje są tymczasowe. Kod ten umożliwia jednoczesne poinformowanie użytkowników oraz botów o przewidywanym czasie awarii i terminie, kiedy strona zostanie uruchomiony ponownie. Dlatego kiedy znana jest długość przerwy w sekundach lub data i godzina, kiedy szacowany czas przestoju się skończy warto określić to w opcjonalnym nagłówku Retry-After, który Googlebot może wykorzystać w celu określenia, kiedy dany adres URL ma zostać ponownie uruchomiony przez robota.

Kod HTTP 503 może być również doskonałym rozwiązaniem w wielu innych sytuacjach. Często można spotkać witryny, które zwracają kod 200 (OK) mimo błędów serwera, przestojów, przekroczenia przepustowości lub czasowego wykorzystania strony zastępczej („Under Construction”). Kod HTTP 503 daje webmasterom możliwość rozwiązania wszystkich tych sytuacji. Ważne jest jednak, aby nie traktować go jako stałego rozwiązania, gdyż może to być ostatecznie postrzegane jako znak, że serwer jest trwale niedostępny i może prowadzić do usuwania takich adresów URL z indeksu Google.

W przypadku kodu HTTP 503, podobnie jak dla kodu błędu 404 dobrym pomysłem jest utworzenie strony przydatnej dla użytkowników, na której można by umieścić wyjaśnienie sytuacji i poinformować kiedy strona będzie dostępna.

Podsumowując, kod HTTP 503 to kod błędu wewnętrznego, który informuje, że usługa jest niedostępna ze względu na przeciążenie serwera. Pomaga on uniknąć zindeksowania strony w trakcie budowy lub podczas problemów z serwerem. Zagrożenie dotyczy szczególnie dużych popularnych serwisów. Kod HTTP 503 powinien być używany zamiast strony informującej o napotkanym błędzie, (np. przeciążeniu serwera) posiadającej status HTTP 200 (OK). Związane jest to z tym, że robot może zindeksować taką stronę gdyż jej kod HTTP sugeruje, że funkcjonuje ona prawidłowo. Jeśli natomiast otrzyma kod 503 to będzie wiedział, że nie powinien indeksować aktualnej zawartości strony lecz powróci później.

Więcej informacje dotyczących kodów HTTP można znaleźć na stronie.

(Źródło: http://googlewebmastercentral.blogspot.com/2011/01/how-to-deal-with-planned-site-downtime.html)

0 komentarzy:

Dodaj komentarz

Chcesz się przyłączyć do dyskusji?
Feel free to contribute!

Dodaj komentarz