Kopiowanie treści

Kolejny film z cyklu Matt Cutts radzi. Problem zarysowany przez internautę wygląda następująco:

Google indeksuje witrynę A co godzinę, a witrynę B raz dziennie. Witryna B zamieszcza artykuł, a witryna A kopiuje go, zmieniając czas utworzenia na wcześniejszy. Witryna A zostaje zindeksowana przez Googlebota jako pierwsza. Która zawartość jest dla Google oryginalna i będzie miała lepszą pozycję? Jeśli A, to jak to się ma do uczciwości względem witryny B?

Informowanie o nowej zawartości

Według Matta są sposoby, aby pomóc w zidentyfikowaniu oryginalnej treści przez wyszukiwarkę. Może to być tweet informujący o nowych treściach, dzięki któremu ludzie odnajdą artykuł i być może będą go linkowali. Wówczas Google będzie mogło na podstawie tych odnośników odkryć oryginalny artykuł jeszcze zanim pojawi się on w witrynie, która go nieuczciwie skopiowała. Innym sposobem jest podpięcie się do witryn takich jak PubSub, aby poinformować o nowym artykule czy wpisie na blogu. Można tu jeszcze wskazać inne witryny, takie jak Ping-o-Matic!, czy bijący szczyty popularności Facebook. Witryny te mają odmienne zastosowanie, ale idea ich wykorzystania jest taka sama – powiadomić internautów i wyszukiwarki o nowej zawartości w witrynie.

DMCA (Digital Millenium Copyright Act)

W opisanej sytuacji można również dochodzić swoich praw autorskich. Twórca artykułu może dokonać zgłoszenia na podstawie ustawy DMCA obowiązującej w USA poprzez formularz na stronie Usuwanie treści z Google. Zastosowanie narzędzia określa tekst umieszczony na stronie:

To narzędzie umożliwia wykonanie procedury zgłoszenia materiałów, które Twoim zdaniem w świetle obowiązującego prawa powinny zostać usunięte z usług Google. Wypełniając ten formularz, przekażesz nam wszystkie informacje potrzebne do zbadania tej konkretnej sprawy i rozwiązania jej w jak najkrótszym czasie.

Raport dotyczący spamu

Jeśli witryna zawiera treść generowaną automatycznie (de facto kopiowaną nieuczciwie i często nielegalnie z innych serwisów), to można także zgłosić raport dotyczący spamu, ponieważ nie jest to witryna dobrej jakości, a Google nie chce dodawać takich stron do swojego indeksu.

Podsumowanie

Google stara się ustalać na ile to możliwe, która z zawartości jest oryginalna, ale Matt nie obiecuje 100% skuteczności.

We try hard to find out who’s the original creator of the particular piece of content but I wouldn’t claim we’re perfect.

W połączeniu z sugerowanymi ręcznymi rozwiązaniami daje to podpowiedź, że Google tak naprawdę ma algorytmiczne trudności w kwestii ustalania oryginalnego źródła. Potwierdzają to eksperymenty z nowymi znacznikami meta syndication-source i original-source dla Google News, które pomagają określić oryginalne źródło treści.

Cała odpowiedź Matta Cuttsa w kanale pomocy dla webmasterów:

 

Źródło ilustracji: http://www.flickr.com/photos/carbonnyc/