Farmy treści – plaga wyników wyszukiwania

Anglojęzyczne blogi związane z branżą marketingu internetowego pękają w szwach od artykułów poświęconych farmom treści i najnowszej dużej aktualizacji algorytmu Google. Ten wpis to podsumowanie nastrojów, analiz i wniosków, które można było znaleźć w ostatnich dniach pod hasłem Panda aka Farmer Update.

Farmy treści powstają jako odpowiedź na popularne wyszukiwania z różnych dziedzin. Generowana treść (ręcznie, ale automatyzm procesu pozwala na takie określenie) jest nakierowana na takie zapytania, co pozwala pojawiać się wysoko w wynikach wyszukiwania. Problemem z punktu widzenia użytkowników wyszukiwarki jest to, że zawartość powstaje szybko, małym nakładem kosztów, a co za tym idzie jej jakość jest zwykle bardzo słaba. Mechanizm powstawania takich treści dobrze opisuje artykuł Demand Media & Being “The Best Click” On Google. Krytyka farm treści pojawiła się nawet wewnątrz przedstawicieli mediów generujących takie słabej jakości strony. Dobrze przedstawia to artykuł na temat wypowiedzi dyrektora serwisu Mahalo. Dodatkowym problemem w przypadku takich witryn jest to, że ich wyeliminowanie nie musi być jednoznacznie korzystne dla użytkowników, bowiem zdarza się, że w natłoku treści słabej jakości znajdują się wartościowe artykuły, które zasługują na pojawienie się w czołówce wyników wyszukiwania. Warto podkreślić najnowszą wypowiedź Google w tej kwestii:

it’s important for webmasters to know that low quality content on part of a site can impact a site’s ranking as a whole

Należy być więc bardzo ostrożnym, nawet jeśli posiada się w witrynie strony wartościowe. Google radzi, aby usunąć te, które są kiepskiej jakości lub przenieść je do innej domeny.

W ostatnim czasie poziom narzekań na farmy treści stale się nasilał. W styczniu Google obiecało, że podejmie działania przeciwko farmom treści okupującym wyniki wyszukiwania, a 24 lutego ogłosiło wprowadzenie zmian w swoim algorytmie, które mają na celu realizację obietnicy. Podobno opracowywanie zmian trwało od stycznia ubiegłego roku. Interesujące może być to, że w wywiadzie dla magazynu Wired Amit Singhal wskazał, iż na zwiększenie widoczności stron ze słabej jakości treścią w wynikach wyszukiwania wpływ miała aktualizacja Caffeine, zwiększająca szybkość indeksowania stron. Google stale wprowadza zmiany w swoim algorytmie, ale zwykle są tak subtelne, że dostrzegają je nieliczni. Tym razem jest inaczej, ponieważ według Google zmiana wpłynęła na 11.8% wyników wyszukiwania w USA. Na razie zmiana dotyczy tylko USA, ale planowane jest jej wprowadzenie w innych regionach.

Oficjalnie Google nie potwierdza, że zmiana algorytmiczna jest nakierowana konkretnie na farmy treści. Obserwując dyskusje internautów można dojść do wniosku, że zmiana dotknęła witryny kopiujące zawartość i te z małym odsetkiem własnych, oryginalnych treści oraz właśnie farmy treści z niskiej jakości zawartością. Google unika stwierdzenia, że zmiana miała na celu wyeliminowanie farm treści z wyników wyszukiwania, ale raczej używa opisowego określenia – niskiej jakości powierzchowna zawartość, zapewne dlatego, aby uniknąć zarzutów, że dotknięte zostały nie tylko farmy treści. Zresztą te rodzaje witryn zostały wymienione w artykule poprzedzającym wprowadzenie zmian o spamie w wynikach wyszukiwania. Jeszcze przed aktualizacją Panda Matt Cutts na swoim blogu ogłosił, że zmiana dotycząca witryn z małą ilością oryginalnych treści weszła w życie. Jak napisał, dotknęła ona ponad 2% zapytań, ale tylko dla mniej niż 0.5% ta zmiana jest zauważalna. Jest to więc szereg następujących po sobie kompleksowych działań.

Elementy aktualizacji Panda

W połowie lutego Google ogłosiło możliwość blokowania stron w wynikach wyszukiwania Google za pomocą rozszerzenia dla przeglądarki Chrome, informując, że dane o zablokowanych stronach będę przesyłane do Google i mogą posłużyć jako potencjalny czynnik rankingu wyników wyszukiwania. W oficjalnym poście Google ogłaszającym wprowadzenie Panda Update można znaleźć zastrzeżenie, że dane zebrane na podstawie rozszerzenia Personal Blocklist nie zostały wykorzystane przy wprowadzaniu aktualizacji Panda. Dodano, że z grupy witryn najczęściej oznaczanych jako spam przez użytkowników narzędzia 84% zostało dotkniętych wprowadzonymi zmianami, co ma potwierdzać skuteczność zmian i ich pozytywny efekt dla użytkowników.

Po ogłoszeniu wprowadzenia aktualizacji przeprowadzono liczne testy mające pokazać, kto stracił, a kto zyskał. Ponieważ zmiana dotyczyła USA, to podawanie konkretnych witryn mija się z celem. Efekty tych testów zbierają artykuły Number Crunchers: Who Lost In Google’s “Farmer” Algorithm Change? i More Farmer Update Winners, Losers: Wikihow, Blippr & Yahoo Answers.

W zespole SEOmoz również starano się przeanalizować efekt wprowadzonej zmiany. Obserwacja witryn, których w dużym stopniu dotyczyła zmiana doprowadziła do kilku ciekawych wniosków:

  • lepsze pozycje osiągają witryny z mniejszą liczbą bloków reklam, które są mniej inwazyjne
  • witryny, których design można opisać jako bardziej nowoczesny i atrakcyjny wydają się zyskiwać
  • zwyciężyły witryny z bogatszą, bardziej wiarygodną treścią generowaną przez użytkowników (UGC) nad witrynami z treścią użytkowników zbudowaną sztucznie pod kątem SEO
  • strony z mniej użyteczną, mniej czytelną i trudniej dostępną zawartością prawdopodobnie straciły.

W podsumowaniu autorzy jako potencjalne czynniki wykorzystane w aktualizacji wymieniają:

  • dane użytkowników – czynniki takie jak współczynnik kliknięć, czas spędzony na stronie, itp.
  • osoby oceniające jakość – wykorzystane do budowy systemu uczącego się (ang. machine learning)
  • analiza zawartości – algorytmy oceniające czytelność, unikatowość, a nawet atrakcyjność wizualną prezentacji treści.

Tom Critchlow z Distilled radzi właścicielom witryn dotkniętych aktualizacją lub tych, którzy obawiają się jej wprowadzenia w innych krajach:

  • Upewnić się, że zawartość jest unikalna i użyteczna. To zawsze miało znaczenie, ale wygląda na to, że Google zaostrzyło kurs wobec powielanych treści i stron ze słabą zawartością.
  • Upewnić się, że na górze strony (nad tzw. foldem) jest sporo wartościowej dla użytkowników zawartości. W celu sprawdzenia jak oceniają to użytkownicy można wykonać testy z losowymi osobami.
  • Pozbyć się agresywnych reklam i obrazków, które wyglądają jak bloki reklam. Bez względu na to czy jest to AdSense, banery, czy tylko duże obrazki wyglądające jak reklamy, należy upewnić się, że nie mają pierwszeństwa nad zawartością.
  • Przeprojektować witrynę, aby była dostosowana do trendu Web 2.0, ponieważ działania Google opierają się na tym, co ludzie chcą widzieć w wynikach wyszukiwania.
  • Sprawić, aby witryna wyglądała na bardziej zaufaną. Jest to dobre także ze względu na współczynnik konwersji. Należy posiadać dobre strony o firmie, polityce prywatności, stronę kontaktową itd.

Patrick Altoft podkreśla z kolei, że duże znaczenie może mieć czytelność zawartości. Jako przykład podaje witrynę ehow.com, która pomimo podobieństwa do innych farm treści nie ucierpiała znacząco. Autor jako czynnik odróżniający wskazuje dużo większą czytelność artykułów w witrynie eHow, która może sprawiać, że większa liczba użytkowników pozostanie na stronach i przeczyta wpis do końca. Według niego osoby oceniające mogły zostać wykorzystane do budowy i testowania systemu uczącego się, który jest częścią nowego algorytmu oceniającego czytelność stron.

Inni przegrani

Niedługo po ogłoszeniu aktualizacji pojawiły się wpisy na temat wartościowych witryn, które w jej wyniku straciły znaczną część ruchu. Spowodowało to, że zapowiedziano prace nad usprawnieniem zmian algorytmu, wykluczając jednocześnie ręczne modyfikowanie pozycji jako sposób na rozwiązanie problemu. Eric Ward w swoim poście zwraca uwagę na efekt pośredni jaki może wywołać aktualizacja Panda. Farmy treści są często wykorzystywane do linkowania innych stron z odpowiednim anchor tekstem. Wydaje się być dość oczywiste, że witryny opierające swoją strategię linkowania na takich serwisach mogą w drugiej kolejności ucierpieć na aktualizacji algorytmu – jeśli strona zostaje uznana za mało wartościową, to w naturalny sposób link na niej umieszczony powinien również stracić na wartości.

Przygotować się na Pandę

Google póki co nie ogłosiło wprowadzenia aktualizacji Panda w Polsce. Obawiającym się spadku ruchu w witrynach, kiedy zmiana dojdzie do skutku w polskiej wyszukiwarce, można polecić artykuł Your Site’s Traffic Has Plummeted Since Google’s Farmer/Panda Update. Now What?, który wyczerpująco opisuje sposoby ustalenia przyczyn spadków, analizy danych oraz metody wyjścia z kryzysu. Na podstawie analiz przegranych i wygranych na skutek zmian algorytmu można również zastanowić się jak skorzystać na aktualizacji Panda. Najwięksi przegrani, to witryny tworzące miliony stron zawierających zawartość niskiej jakości, stworzoną przede wszystkim w celu pozyskiwania ruchu z wyszukiwarek. Dlatego nie warto próbować pojawiać się w Top10 na wszystkie możliwe zapytania. Zamiast tego lepiej zostać autorytetem w danej branży, tworząc zawartość, która jest wartością dodaną. Postępując w ten sposób należy mieć na uwadze wyszukiwania z długiego ogona i zastanowić się jakie pytania mogą zadawać wyszukiwarce użytkownicy. Należy również wziąć pod uwagę na jakiej podstawie Google może oceniać jakość zawartości. Przecież teksty w farmach treści to treści unikalne, umieszczone w mocnej domenie, tyle że kiepskie jakościowo. W tej sytuacji to za mało. Co może być wyznacznikiem jakości? Znowu sprowadza się to do komunału, że chodzi o dobro i satysfakcję użytkowników wyszukiwarki.

Ilustracja od Panda electrique wykorzystana na licencji Creative Commons.

1 komentuj

Dodaj komentarz

Chcesz się przyłączyć do dyskusji?
Feel free to contribute!

Dodaj komentarz