Stan indeksowaniaGoogle dodało do swoich narzędzi dla webmasterów kolejną przydatną funkcjonalność – Stan indeksowania. Są to statystyki pokazujące ile podstron serwisu internetowego zostało dodanych do indeksu wyszukiwarki Google. Czy nadal trzeba przekonywać, że Google Webmaster Tools bardzo pomagają w optymalizacji pod kątem wyszukiwarek internetowych?

Stan indeksowania

Raport Stan indeksowania został umieszczony w sekcji Kondycja narzędzi dla webmasterów Google i posiada dwa widoki – Podstawowy i Zaawansowany.

Widok podstawowy

Stan indeksowania - widok podstawowy

Stan indeksowania - widok podstawowy

Legenda podaje liczbę aktualnie zaindeksowanych stron, a wykres prezentuje cotygodniowe dane stanu indeksowania witryny z ostatniego roku. Liczba Zaindeksowano łącznie jest prawie zawsze znacznie mniejsza niż liczba adresów URL pobranych przez Google, ponieważ nie uwzględnia stron, które zostały rozpoznane jako powielone, niekanoniczne lub mniej przydatne albo, na których umieszczono metatag noindex.

Liczba zaindeksowanych stron nie musi pokrywać się z liczbą stron prezentowanych w wynikach wyszukiwania, ponieważ nie jest pomniejszana o tymczasowe filtry. Filtrowanie wyników wyszukiwania obejmuje strony usunięte ze względów prawnych lub na prośbę webmastera, wyniki z witryn, które są niedostępne oraz ręczne działania przeciwko spamowi.

Wykres stale pnący się do góry wskazuje, że nowe podstrony są na bieżąco dodawane do indeksu Google. Bardziej szczegółowe dane można znaleźć w zakładce Zaawansowane.

Widok zaawansowany

Stan indeksowania - widok zaawansowany

Stan indeksowania - widok zaawansowany

W wersji zaawansowanej wykres prezentuje liczby:

  • Zaindeksowano kiedykolwiek – liczba wszystkich podstron kiedykolwiek pobranych przez Google
  • Zaindeksowano łącznie – liczba podstron znajdujących się aktualnie w indeksie Google
  • Niewybrane – liczba stron, które nie są indeksowane z powodu przekierowania na inny adres URL lub dużego podobieństwa do innych stron
  • Zablokowane w pliku robots.txt – liczba stron, których Google nie może pobierać z powodu zablokowania w pliku robots.txt.

Po co mi te dane?

Dane na temat stanu indeksowania mogą być wykorzystane do identyfikowania różnych problemów związanych z indeksowaniem serwisu internetowego.

Na przykład nagły spadek liczby zaindeksowanych stron może wskazywać na błąd w serwisie – błąd serwera, zablokowanie dostępu robotom wyszukiwarek przez przypadkowe wstawienie meta=”noindex” lub wpisu w pliku robots.txt.

Z kolei zmiana struktury serwisu bez prawidłowej konfiguracji przekierowań 301 może spowodować spadek liczby zaindeksowanych stron lub nagły wzrost liczby Niewybrane.

Duży poziom stron nieuwzględnianych w indeksie może również oznaczać, że w witrynie występuje problem powielania treści.

Wszystkie te informacje mogą pomóc w optymalizacji pobierania i indeksowania serwisu przez Google. Dokładny opis funkcjonalności Stan indeksowania można znaleźć w artykule pomocy narzędzi dla webmasterów Google.

7 komentarzy:
  1. Obrazy-Malarstwo
    Obrazy-Malarstwo says:

    Dzięki za wpis. Właśnie szukałem informacji na ten temat.
    Wydaje mi się, że Google podaje mylące informacje i niedokładnie wyjaśnia o co chodzi. Sprawdziłem ilość URLi zaindeksowanych – wyskakujących w wynikach wyszukiwania. Jest ich sporo. Tymczasem zaindeksowanych stron 27. Prawdopodobnie przez to, że większość to strony obrazka z krótkim opisem i większość tekstu na stronie powtarza się (menu + nazwa strony). Nie do końca rozumiem na czym polega odróżnianie zaindeksowanych stron od zaindeksowanych URLi, skoro wyszukiwarka i tak pokazuje wszystko po wpisaniu site:www.mojastrona.com to znaczy, że to wszystko jest dostępne w wynikach?

  2. Przemek Sztal
    Przemek Sztal says:

    Po pierwsze:

    W niektórych przypadkach Google może tworzyć wyniki wyszukiwania, stosując filtry, które mogą wpłynąć na widoczność wyników. Filtrowanie obejmuje strony usunięte ze względów prawnych lub na prośbę webmastera, wyniki z witryn, które według nas są obecnie niedostępne (wyłączone), oraz wyniki usunięte w efekcie ręcznego działania przeciwko spamowi. (…) Z tego powodu wyniki wyszukiwania mogą nie w pełni odzwierciedlać dane widoczne w Stanie indeksowania.

    Po drugie:
    Porównując na własne potrzeby liczbę Zaindeksowano łącznie z liczbą wyników dla operatora site:, zastanawiam się czy Zaindeksowano łącznie nie zawiera również liczby zaindeksowanych grafik (są to odrębne URLe).

    Po trzecie: Trzeba pamiętać, że w przypadku operatora site: Google zawsze zastrzegało, że prezentowane informacje są orientacyjne. Operator z założenia ma służyć przeszukiwaniu konkretnych adresów pod kątem frazy, a nie sprawdzaniu indeksu, więc nie ma oczekiwać, że Google jest zainteresowane prezentowaniem dokładnych danych.

    @Obrazy-Malarstwo:
    Poprosimy o zrzut ekranu z GWT (raport zaawansowany). To ciekawy przypadek, bo zwykle liczba Zaindeksowano łącznie jest większa niż site: (liczba wyników realnie pokazywanych, a nie sugerowanych w podpowiedzi pod polem wyszukiwania).

  3. Przemek Sztal
    Przemek Sztal says:

    @Obrazy Malarstwo: Czyli w tej chwili liczba zaindeksowano łącznie jest większa niż zwracana poleceniem site:.
    To prawda, że takie informacje mogą prowadzić do konsternacji. Trzeba sprawdzić różne aspekty, które mogą powodować taki stan rzeczy i jeśli wszystko jest skonfigurowane w serwisie poprawnie nie przejmować się zbytnio liczbami. Poza tym od samych liczb ważniejsze są ich nagłe skoki, które mogą sugerować jakiś problem w witrynie po wprowadzonych zmianach.
    W liczbie Niewybrane zawierają się także adresy, które zostały przekierowane na inny URL, stąd ich liczba może być duża. W przypadku serwisu obrazy-malarstwo.pl sporym błędem jest występowanie dwóch wersji adresów: z www i bez www. Powinno zostać skonfigurowane przekierowanie 301 na jedną z tych wersji.

Dodaj komentarz

Chcesz się przyłączyć do dyskusji?
Feel free to contribute!

Dodaj komentarz