Klasyfikacja dokumentów internetowychW kontekście testów nowego układu linków do podstron na blogu SEO by the Sea pojawił się wpis o zaktualizowanym patencie zgłoszonym przez Google: „Methods and Apparatus for Serving Relevant Advertisements”. Patent dotyczy reklam AdSense, ale pokazuje w jaki sposób Google może klasyfikować strony według kategorii tematycznych.

W jaki sposób może być ustalana tematyka strony

  1. Każde wyrażenie na stronie może zostać oznaczone jako jej potencjalny temat.
  2. Może być stosowane podejście oparte o wartość progową – jeśli termin pojawia się więcej niż określona liczba razy, to przypuszczalnie może być tematem strony.
  3. Zwroty, które pojawiają się na stronie częściej niż inne, mogą otrzymać większą wagę przy określaniu tematyki.
  4. Zwroty na stronie, które nie pojawiają się często w Internecie, mogą otrzymać większą wagę niż te, które występują częściej w dokumentach internetowych. Na przykład słowo „lub” pojawia się dużo częściej niż słowo „kot”. Jeśli na stronie pojawią się jednocześnie słowa „lub” i „kot”, to słowo „kot” może otrzymać większą wagę w ocenie potencjalnego tematu strony.
  5. Niezależnie od wybranego sposobu przypisywania wagi tekstowi na stronie, tylko najwyżej ocenione zwroty mogą być uznane za tematy strony.
  6. Tekst odnośnika prowadzącego do strony może służyć do określenia jej kategorii. Na przykład strona, która jest podlinkowana frazą „przebieg ciąży” może być postrzegana jako strona o macierzyństwie.
  7. Tytuł strony może zostać uznany jako jej temat.
  8. Jeśli strona o określonym temacie linkuje do strony, która jest klasyfikowana, to link może być wskazówką, że strony dotyczą podobnej tematyki.
  9. Zapytania na które strona najczęściej rankuje w wynikach wyszukiwania mogą być wykorzystane jako temat strony.
  10. Tematy stron, które są powiązane na przykład poprzez umieszczenie w tym samym katalogu, mogą być przypisane stronie klasyfikowanej.
  11. Historia wyszukiwań użytkowników, którzy odwiedzili stronę, może być wykorzystywana do określenia jej tematyki.

Wykorzystanie pojedynczych czynników kategoryzacji strony mogłoby być mylące, ale w połączeniu i ocenie ich zgodności dają one efektywny sposób określania tematyki dokumentu. Dobór tytułów, tekstów odnośników, słów kluczowych i tekstów determinuje jaką tematykę algorytm przypisze stronie i pod tym kątem powinna być postrzegana optymalizacja SEO on-site.

Źródło obrazka: www.cpcstrategy.com/blog/2010/11/what-is-data-feed-categorization/