MENU

Google stworzył narzędzie samodzielnie rozwiązujące problemy

1 marca 2017Polecane tematy, Programiści

Pod koniec 2016 roku Google ogłosił wdrożenie nowego systemu wielojęzycznego tłumaczenia maszynowego – Google Neural Machine Translation system (GNMT). Oprogramowanie uczenia maszynowego zastąpiło dotychczasowy system tłumaczący, który wykorzystywał zestaw wyrażeń i dedykowane słowniki.

Automatyczne tłumaczenie tekstu z jednego języka na drugi przez wiele lat działało w sposób słownikowy. Przeszukiwano więc na żywo wyrażenia ze słownika i wstawiano jego odpowiedniki. Jak wie każdy, kto z korzystał z narzędzi Google, niezbyt trafnie… przynajmniej w przypadku języka polskiej. Proces ten jest szybki i wystarczająco efektywny do tłumaczenia prostych tekstów. Tłumaczenie słownikowe ma jednak istotne wady. Po pierwsze gubi niuanse językowe. Po drugie, nie zawsze poprawnie posługuje się idiomami.

Maszyna stworzyła własny język, bo takiego działania wymagało zadanie

Klasyczny algorytm dopasowuje wyrazy ze słownika, a zatem wynik tego tłumaczenia będzie tak dobry, jak dobre są przykłady słownikowe. Nie mogą one jednak uwzględnić różnych wariantów. Nie rozróżniają struktur językowych i nie mogą wybrać właściwego wariantu, spośród wielu podobnych, obecnych w słownikach. Tłumaczenie – bazujące na metodach słownikowych – nie radzi sobie również w przypadku języków o bogatej fleksji. Do takich należą właśnie język polski, czeski lub rosyjski. Wyniki tłumaczenia są słabe, nie pasują nawet do mowy potocznej. Najważniejsza jednak słabość dotyczy nie tyle samego doboru wyrazów, co reakcji motorów tłumaczących na wyrazy, których w słowniku nie ma. Teksty o bogatym słownictwie – obfitujące w neologizmy – są praktycznie nieczytelne dla algorytmów słownikowych, które nie potrafią uczyć się na podstawie nowych tekstów.

Google Neural Machine Translation system potrafi uczyć się na podstawie przedstawianych tekstów. Potrafi ocenić ton wypowiedzi i znaczenie wyrażeń na podstawie kontekstu, uwzględniając przy tym inne słowa i wyrażenia znajduące się w tłumaczonym fragmencie. Charakteryzuje się również kreatywnością. GNMT utworzył samodzielnie własny, wewnętrzny język wyrażeń – interlingua. Służy on wyłącznie do tłumaczenia. Systemy nie były do takiego działania zaprogramowane, ale utworzyły ten język, ponieważ uznały, że jest to najsprawniejszy sposób rozwiązania, postawionego przed nimi problemu.

Nowa platforma o nazwie Google Neural Machine Translation system (GNMT) – pracująca od września 2016 roku – już na starcie zaczęła dystansować stare narzędzie. Jak informuje Google, GNMT potrafi uczyć się na podstawie przedstawianych tekstów. Potrafi ocenić ton wypowiedzi i znaczenie wyrażeń na podstawie kontekstu, uwzględniając przy tym inne słowa i wyrażenia znajduące się w tłumaczonym fragmencie. Charakteryzuje się też kreatywnością.

Stworzone przez Google systemy sztucznej inteligencji AI (Artificial Intelligence) w ciągu kilku tygodni utworzyły samodzielnie własny, wewnętrzny język wyrażeń. Został on nazywany przez Google – interlingua. Służy on wyłącznie do tłumaczenia. Systemy nie były do takiego działania zaprogramowane, ale utworzyły ten język, ponieważ uznały, że jest to najsprawniejszy sposób rozwiązania, postawionego przed nimi problemu. System ten posiada unikatową własność, bowiem umożliwia tłumaczenie wyrażeń w sposób, który nigdy dotąd nie był dostępny dla oprogramowania obsługującego tłumaczenie maszynowe.

Maszyna rozwiązująca problemy, których się nie uczyła

„Załóżmy, że uczymy wielojęzykowy system tłumaczenia między językami japońskim i angielskim oraz koreańskim i angielskim. Nasz system wielojęzykowy – o tym samym rozmiarze co pojedynczy GNMT – współdzieli swoje parametry, aby tłumaczyć wyrażenia między językami z różnych par. Uwspólnienie tych parametrów sprawia, że system może przenieść ‘wiedzę o tłumaczeniu’ z jednej pary na inne. Przenoszenie wiedzy oraz potrzeby tłumaczeń wymuszają na systemie lepsze wykorzystanie możliwości modelowania” – napisali na swoim blogu programiści Google – Mike Schuster, Nikil Thorat oraz Melvin Johnson.

„To zainspirowało nas do zadania ważnego pytania – czy możemy tłumaczyć teksty między jednym a innym językiem, nawet jeśli – w systemie tłumaczącym – nigdy nie programowano tej pary języków? Czy możemy tłumaczyć między koreańskim a japońskim nawet jeśli przykładów dla tej pary nigdy nie pokazywaliśmy systemowi? Odpowiedź jest twierdząca. Nowy system potrafi wygenerować rozsądne tłumaczenia między koreańskim a japońskim mimo to, że nigdy go tego nie uczyliśmy” – dodają.

Czy można tłumaczyć teksty między jednym a innym językiem, nawet jeśli – w systemie tłumaczącym – nigdy nie programowano tej pary języków? Czy możemy tłumaczyć między koreańskim a japońskim nawet jeśli przykładów dla tej pary nigdy nie pokazywaliśmy systemowi? Odpowiedź jest twierdząca. Google Neural Machine Translation system potrafi wygenerować rozsądne tłumaczenia między koreańskim a japońskim mimo to, że nigdy go tego nie uczono.

Platforma GMNT, dzięki elastyczności i samodzielnemu uczeniu umożliwia przeprowadzenie zadań, które wykraczają poza klasyczne tłumaczenie słownikowe. Takim zadaniem jest np. przetłumaczenie w obrębie pary języków, dla której nie przygotowano słownika.

Wewnętrzne życie maszyn 

Sukces samouczącej platformy przynosi ze sobą istotne pytanie. Czy system naprawdę rozpoznaje wspólne znaczenie wyrażeń określających to samo w podobny sposób, w różnych językach? Odpowiedź na to pytanie przyniosła analiza ruchu wewnętrznego dla każdej trójki parametrów podczas tłumaczenia między wszystkimi dostępnymi parami dla trójki języków: japońskiego, koreańskiego i angielskiego. W obrębie pojedynczej grupy widzimy wyrażenia o tym samym znaczeniu, ale zapisane w trzech różnych językach. Oznacza to, że maszyny przekazują sobie informację semantyczne zamiast zapamiętywania par tłumaczeń z jednego języka na drugi. Takie działanie sugeruje utworzenie sztucznego języka (interlingua), który w danej sieci AI służy do sprawnego tłumaczenia. Oznacza to, że system uczenia maszynowego samodzielnie rozwiązał problem tłumaczenia w sposób o wiele sprawniejszy, niż dotąd sądzono.

Podobne tematy:

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

« »