BiznesPolecane tematy
Czym jest Semantic Web i kto go stosuje
Semantic Web to technologia, która pozwala komputerom i programom lepiej rozumieć słowa zapisane przez człowieka. Przetwarza informacje tak, aby opisane przez ludzi przedmioty stały się rozpoznawalne i łatwe do określenia dla komputerów. Dane są przekazywane w taki sposób, by można było powiązać ich znaczenia między sobą w ramach odpowiedniego kontekstu. Działającymi na wyobraźnię przykładami wykorzystania tej technologii są Siri, GoogleNow czy GoogleGraph. Gartner uznał zaś Semantic Web za jedną z trzech najważniejszych technologii w latach 2013-2014.
Termin „Semantic Web” został ukuty przez Tima Bernersa-Lee, Jamesa Hendlera i Ore Lassile w ich przełomowym artykule „The Semantic Web”, opublikowanym w roku 2001 w Scientific American. Według autorów, Semantic Web wprowadza czytelne dla komputera metadane, które opisują treść stron internetowych w języku naturalnym. Znaczniki pozwalają na zautomatyzowaną organizację obiektów obecnych w treści i przeprowadzanie takich operacji, jak wnioskowanie.
Zapytania o technologię Semantic Web coraz częściej pojawiają się w konkretnych zleceniach dla firm, zajmujących się tymi rozwiązaniami. „Klienci chcą mieć obecnie inteligentne wyszukiwanie. Chodzi o to, aby – wchodząc na stronę – zamiast szukać po łańcuchach i stringach, odnajdywać informację inteligentnie, choć oczywiście stoją za tym te same łańcuchy i stringi” – mówi dr Mirosław Sopek, wiceprezes zarządu MakoLab SA, spółki rozwijającej technologię Semantic Web. „Każdy właściciel witryny, która ma więcej niż 1000 stron, powinien korzystać z inteligentnego wyszukiwania” – dodaje.
Jedną z pierwszych stron internetowych, w których zastosowano Semantic Web, jest witryna brytyjskiej stacji telewizyjnej BBC. Obecnie rośnie liczba dużych, polskich witryn, działających na bazie tej technologii, a jej wdrożenie w Polsce zapoczątkował serwis Wrota Małopolski. Dzięki zastosowaniu Semantic Web, łatwiej powiązać tematycznie teksty znajdujące się na serwisie z tymi, które akurat do sieci wrzucił dziennikarz; bowiem teksty połączone semantycznie, wyszukiwane są automatycznie.
Współczesna sieć powoli, lecz systematycznie, wyczerpuje swoje możliwości. Będąc przede wszystkim siecią plików, zawiera treść, która choć ma znaczenie dla użytkowników, pozwala na niewielki zakres systematycznej strukturyzacji i automatycznego wnioskowania na podstawie danych. Koncepcją, która przynosi obietnicę zmiany, jest Semantic Web.
To pierwsza korzyść wynikająca z zastosowania Semantic Web. Kolejna związana jest ze zmianą w wyszukiwarkach i pozycjonowaniu stron internetowych. Google, Yandex czy Bing coraz rzadziej dają się oszukiwać tzw. czarnemu SEO, korzystającemu z farm linków. Poprzez wykorzystanie Semantic Web wykrywają one obiekty strukturalne – artykuły, powiązane teksty, obiekty w wyszukiwarkach (np. opis strony). Strony zaś „zawiadamiają” o swojej zawartości dzięki semantycznym znacznikom. Rozwiązania Semantic Web stosuje się również w narzędziach do wyszukiwania dokumentacji medycznej.
Koszty tego typu rozwiązań są dość wysokie, dlatego wdrożenie Semantic Web rekomendowane jest w przypadku, gdy firma ma co najmniej kilkaset stron na serwisie. Mimo że oznakowanie jest stosunkowo tanie, to zapewnienie inteligentnego wyszukiwania wiąże się z wyższymi wydatkami, ze względu na konieczność zastosowania mechanizmu NLP (Natural Language Processing). On sam jest bardzo drogi. Tego typu rozwiązania to setki tysięcy dolarów.
Dlaczego warto inwestować w technologie semantyczne? Obecnie sieć zawiera niesamowitą ilość informacji, które muszą być ustrukturyzowane tak, aby można było po nie sięgnąć. Tradycyjne metody organizacji danych online, używane najpowszechniej od początku istnienia sieci do dziś, są oparte przede wszystkim na dokumentach lub plikach. To oznacza, że jakikolwiek proces strukturyzacji znaczenia musi być wykonywany ręcznie. Biorąc pod uwagę rozmiar sieci, jest to powolne, żmudne przedsięwzięcie, które nierzadko przynosi mizerne efekty. Wiele operacji, takich jak udzielanie odpowiedzi na nawet najprostsze pytania języka naturalnego, choć pozornie trywialnych, okazuje się w dużej mierze poza zasięgiem komputera.
W tradycyjnej sieci różnica między słowem „rower” a „motocykl” ogranicza się do liczby i kolejności znaków obecnych w tych słowach. W Semantic Web stają się one obiektami zaopatrzonymi w konkretne własności, takie jak: zastosowanie, rozmiar, waga, prędkość, napęd itp. To daje nam dane, z których można wnioskować automatycznie.
Dzieje się tak dlatego, że dotychczasowy internet to przede wszystkim sieć dokumentów. Jest to dość prosta sieć wzajemnie połączonych plików – a połączenia i relacje (bądź struktury połączeń) między nimi są określone przez człowieka. Oznacza to, że są one chaotyczne i arbitralne, nie pozwalając na systematyczne – nie mówiąc o automatycznych – analizy tworzące nową wiedzę. W tym miejscu Semantic Web wkracza ze swoją rewolucyjną ideą.
W tradycyjnej sieci różnica między słowem „rower” a „motocykl” ogranicza się do liczby i kolejności znaków obecnych w tych słowach. W Semantic Web stają się one obiektami zaopatrzonymi w konkretne własności, takie jak: zastosowanie, rozmiar, waga, prędkość, napęd itp. To daje nam dane, z których można wnioskować automatycznie.
„Współczesna sieć powoli, lecz systematycznie, wyczerpuje więc swoje możliwości. Zawiera treść, która ma znaczenie dla użytkowników, ale pozwala na niewielki zakres systematycznej strukturyzacji i automatycznego wnioskowania na podstawie danych” – tłumaczy dr Mirosław Sopek. Jest to stan rzeczy, który jest przyczyną ogromnych utrudnień w pozyskiwaniu wiedzy, w praktyce uniemożliwiając wiele operacji. Sieć przyszłości nie będzie już siecią konceptualnie neutralnych plików. Sieć przyszłości jest przede wszystkim siecią informacji posiadającej znaczenie.
Koncepcją, która przynosi obietnicę zmiany, jest właśnie Semantic Web. Jest ona siecią mającą znaczenie, które może być przetwarzane i analizowane samodzielnie przez komputery. Niesie to zasadnicze implikacje dla niemal każdej dziedziny działalności internetowej, ze szczególnymi korzyściami dla prowadzenia badań i biznesu. „W Semantic Web plik przestaje być podstawowym budulcem internetu, staje się nim znaczenie” – konkluduje Mirosław Sopek.
Przykład zastosowania Semantic Web Wyobraź sobie, że szukasz apteki, która jest otwarta w niedzielę do godziny 20. 00 i znajduje się w promieniu 2 km od naszej lokalizacji. Możesz skorzystać z serwisów mapowych i próbować znaleźć apteki ręcznie. Jest to jednak żmudny proces, ponieważ musisz przeszukiwać bazy danych map i wejść do każdego z wyników, aby sprawdzić, czy pokrywa się on z kryteriami, jakie Cię interesują. Co więcej, każda apteka ma inną stronę internetową.
Inną opcją jest użycie wyszukiwarki internetowej. Tyle tylko, że fraza „apteka otwarta w sobotę do 20.00 w promieniu 2 km od mojej lokalizacji” zwróci w dużej mierze niemające związku wyniki, z powodu działania samej wyszukiwarki. Dla tych mechanizmów jedyną relacją, jaka łączy słowa „otwarta” i „apteka”, jest relacja ciągów znaków w zapytaniu w stosunku do tych, które znajdują się w internecie.
W wyszukiwarce semantycznej, poszukiwany obiekt nie jest jednak tylko grupą liter ułożonych w określony sposób. „Apteka” będzie miała konkretne cechy. Jest to klasa obiektów, które mają wiele atrybutów, takich jak: godziny i dni otwarcia, lokalizacja, sieć i inne. Wyszukiwarka semantyczna „zrozumie”, że „otwarta o” odnosi się do godzin pracy, i że „w promieniu 2 kilometrów” to dystans do podanej lokalizacji obliczony na bazie lokalizacji apteki.
Wszystkie te operacje są wykonywane w czasie rzeczywistym i nie są oparte na żadnej stałej, przygotowanej wcześniej informacji. Wyszukiwarka nie szuka już pozbawionych znaczenia liter, ale skanuje klasę aptek i sprawdza, które obiekty należące do niej spełniają podane kryteria. To daje precyzyjne, przejrzyste odpowiedzi na pytania, które sformułowane są w języku, z którego korzystamy każdego dnia. Podczas gdy komputery i technologie sieciowe dają ogromne możliwości, odpowiadanie na tak proste zdanie jest nadal praktycznie niemożliwe. Semantic Web to zmieni.