Schema.org – wspólny standard dla danych strukturalnych
Kilka dni temu Google ogłosiło wprowadzenie Schema.org, czyli przygotowanego przez Google, Bing i Yahoo wspólnego standardu etykiet dla danych strukturalnych.
Roboty wyszukiwarek internetowych nie są w stanie odróżnić, co jest imieniem, a co jest nazwiskiem w profilu użytkownika, nie odróżniają komentarza produktu od zwykłego tekstu, nie są w stanie rozpoznać, czy liczba zamieszczona przy produkcie to cena, ilość ocen czy może liczba klientów, itp. Aby wyszukiwarka mogła wyświetlać takie dodatkowe dane w wynikach wyszukiwania, musi wiedzieć gdzie w kodzie strony ma ich szukać. Dodanie odpowiednich etykiet do danych strukturalnych umożliwia to zadanie. Poprzez wykorzystanie fragmentów sformatowanych zamieszcza się informacje semantyczne o zawartości strony. Informacje te ułatwiają przetwarzanie danych na stronie, czyli ich „zrozumienie” przez roboty wyszukiwarek.
Dzięki tego typu etykietom właściciele serwisów zawierających dane strukturalne – takich jak np. witryny poświęcone opiniom, mogą odpowiednio je oznaczać, aby wskazać, iż każdy oznaczony w ten sposób fragment strony stanowi określony typ danych, np. ocenę, nazwę restauracji lub adres. Stosowanie takich etykiet nie ma wpływu na wygląd treści bezpośrednio na stronie, pomaga natomiast wyszukiwarce poprawnie je rozpoznawać i prezentować w wynikach wyszukiwania.
W Google, wsparcie dla danych strukturalnych zostało wprowadzone już kilka lat temu. Jako pierwsze w 2009 r. zostały wprowadzone fragmenty sformatowane (opisy wzbogacone) dla wyników wyszukiwania opisujących ludzi lub zawierających opinie. Od tamtego czasu były systematycznie rozszerzane i jak do tej pory objęły dodatkowo następujące rodzaje danych: informacje o firmach, produkty, wydarzenia, przepisy kulinarne.
Dodanie fragmentów sformatowanych do stron wymaga jednak sporo czasu i wysiłku, rożne sposoby zwracania tych danych przez poszczególne wyszukiwarki jeszcze bardziej utrudnia to zadanie i właśnie dlatego wyszukiwarki: Google, Bing i Yahoo postanowiły opracować jeden wspólny schemat dla tego typu etykiet. Stosując się do standardów zawartych w projekcie Schema.org, właściciele witryn mogą ulepszać ich wygląd w wynikach wyszukiwania nie tylko Google, ale także Bing, Yahoo, a w przyszłości potencjalnie również innych wyszukiwarek.
Niewątpliwą zaletą nowego standardu Schema.org jest fakt, że uwzględnia on wiele nowych rodzajów etykiet (dodanych zostało ponad 100 nowych typów danych), a ponadto uwzględnia wszystkie funkcjonujące do tej pory w Google. Pełna lista typów danych uwzględnionych w Schema.org dostępna jest na stronie: schema.org/docs/full.html. Najpopularniejsze, nieuwzględnione do tej pory to: Książka, Film, Utwór muzyczny, a także nietekstowe obiekty takie jak Obrazek czy Video.
Do tej pory istniały trzy różne standardy organizowania danych strukturalnych: mikrodane, mikroformaty i RDFa. W Schema.org postanowiono skoncentrować się tylko na jednym z tych formatów, aby poprawić spójność pomiędzy poszczególnymi wyszukiwarkami. Wybrane zostały mikrodane z racji na to, że były najlepszym kompromisem pomiędzy szerokim zastosowanie RDFa, a prostotą mikroformatów.
Jednocześnie istotny jest fakt, ze Google nadal będzie wspierać pozostałe formaty. Zatem, jeżeli do strony dodane zostały etykiety fragmentów sformatowanych za pomocą mikroformatów lub RDFa, to nadal będą one obsługiwana. Jedna uwaga Google dotyczy tego, aby unikać mieszania różnych formatów w obrębie jednej strony internetowej, gdyż postępowanie takie może zmylić roboty.
Tak jak wspomniałam wcześniej Schema.org opiera się na mikrodanych. Każdy rodzaj danych opisany jest przez odpowiadające mu etykiety. Etykiety dla każdej z kategorii danych można znaleźć na odpowiadającej jej stronie w Schema.org. W celu implementacji mikrodanych na stronie wystarczy do znaczników zawierających dane strukturalne dodać odpowiedni zestaw atrybutów: itemscope, itemtype, itemprop z etykietami wskazanymi w schemacie. Poniżej przykład jak należałoby wzbogacić podstawowe informacje o Osobie:
<div itemscope itemtype="http://schema.org/Person">
<span itemprop="name">Jan Kowalski</span>
<div itemprop="address" itemscope itemtype="http://schema.org/PostalAddress">
<span itemprop="streetAddress"> ul. Zielona 10 </span>
<span itemprop="addressLocality"> Warszawa </span>
<span itemprop="postalCode"> 01-500 </span>
</div>
<span itemprop="telephone"> (048) 123-45-67 </span>
<span itemprop="jobTitle"> Architekt </span>
</div>
W tym prostym przykładzie najpierw użyty został atrybut itemscope, aby wskazać, że dany fragment tekstu zawiera dane strukturalne, następnie przy użyciu atrybutu itemtype wskazano, ze będzie to Osoba. Atrybut itemprop posłużył natomiast do określenia poszczególnych cech Osoby. Pełna listę etykiet opisujących cechy dla wybranego rodzaju danych strukturalnych można znaleźć na stronach Schema.org.
Dla tych, którzy chcieliby przetestować stronę, pod kątem tego czy etykiety fragmentów sformatowanych na niej umieszczone są poprawnie analizowane przez wyszukiwarkę mam niestety złą wiadomość. Narzędzie Rich Snippets Testing Tool nie obsługuje jak na razie nowych etykiet uwzględnionych w Schema.org. Pocieszeniem może być to, że Google zapowiedziało, iż możliwość taka pojawi się już wkrótce. Bez problemu można natomiast przetestować stronę wykorzystująca etykiety, które były obsługiwane do tej pory.
Strona projektu Schema.org oraz narzędzie do testowania fragmentów sformatowanych (opisów wzbogaconych) jest na razie dostępne wyłącznie w języku angielskim. Niemniej jednak Google pokazuje już opisy wzbogacone w wynikach wyszukiwania na całym świecie, zatem nie należy czekać z wdrożeniem ich na swojej stronie.
Zaletą przemawiającą za dodawaniem etykiet do danych strukturalnych jest to, że wzbogacony o dodatkowe dane wynik wyszukiwania ma o wiele większa szansę na kliknięcie przez potencjalnych użytkowników. Takie dodatkowe elementy zwracają uwagę szukających, co z kolei powoduje, że ilość odwiedzin na stronach wykorzystujących opisy wzbogacone może znacznie wzrosnąć. Zatem warto już teraz przejrzeć najnowszą listę znaczników w poszukiwaniu tych, które odpowiadają zawartości strony i nie zwlekać z ich dodaniem.
(Źródło: http://googlewebmastercentral.blogspot.com/2011/06/introducing-schemaorg-search-engines.html)