Programowanie

Polski zespół stworzył sieć neuronową, która uczy się grać w gry znane z platformy Atari

Piotr Waszczuk 20 listopada 2017

0 1 133 1 minuta czytania

Polski zespół stworzył sieć neuronową, która jest w stanie samodzielnie nauczyć się grania w proste gry. Oprogramowanie uruchomione rozwijane we współpracy z firmą Intel testowano m.in. na grach, takich jak: Breakout, River Raid i Space Invaders. Eksperymentalny projekt ma przysłużyć się rozwojowi robotyki i autonomicznych systemów, które będą wspierać ludzi w różnego rodzaju zadaniach.

Celem przeprowadzonego przez zespół firmy deepsense.ai i wzorowanego na eksperymencie przeprowadzonym w 2013 roku przez zespół DeepMind projektu było zweryfikowanie czy algorytmy sztucznej inteligencji oparte na możliwościach platformy Intel Xeon zdolne do samodzielnej nauki rozgrywania gier wideo będą w stanie na tych samych zasadach nauczyć się sterowania różnego rodzaju autonomicznymi pojazdami. Gry znane z platformy Atari wykorzystano na potrzeby nauczania sieci neuronowych metodą nagród i kar. „W deepsense.ai pracujemy nad podobnymi zagadnieniami, więc postanowiliśmy powtórzyć eksperyment DeepMind nieco go modyfikując. W naszym badaniu wykorzystaliśmy niekonwencjonalną infrastrukturę, opierając się na procesorach Xeon Intela” – wyjaśnia kierujący tym projektem w firmie deepsense.ai dr hab. Henryk Michalewski z wydziału Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego.

Zastosowany system nauki sieci neuronowej zakłada, że na początkowym etapie algorytm nie tylko „nie wie” jak grać, aby wygrywać – nie posiada też informacji na temat celu i reguł danej gry. Wykorzystany system kar i nagród w miarę kolejnych iteracji gry pozwala komputerowi zorientować się, jaki rodzaj działań zbliża osiągnięcie celu, a jaki – utrudnia osiągnięcie sukcesu, a także – doskonalić umiejętności gry. Stworzony przez Polaków algorytm potrzebował mniej niż doby, by opanować każdą z gier na mistrzowskim poziomie – i osiągać wyniki przewyższające możliwości ludzkich graczy. W przypadku uruchomienia algorytmu w środowisku klastrowym cały proces nauki w gry, takie jak: River Raid czy Breakout, został skrócony do kilkunastu minut.

Co ważne, oprogramowanie zostało uruchomione w oparciu o standardowy serwer z procesorem Intel Xeon i przy wykorzystaniu oprogramowania stworzonego we współpracy z inżynierami zatrudnionymi w gdańskim centrum badawczo-rozwojowym firmy Intel. Prace programistyczne koncentrowały się m.in. na rozwiązaniach pozwalających na optymalne wykorzystanie dostępnej mocy obliczeniowej. „Jednym z priorytetów Intela jest rozwój systemów sztucznej inteligencji, zdolnych ułatwiać życie jednostek, rozwiązywać problemy społeczne i unowocześniać pracę przedsiębiorstw. Już dziś uczenie maszynowe i głębokie rewolucjonizują sektory takie jak finanse i bankowość czy medycyna. Projekty prowadzone przez polskich naukowców i inżynierów wytyczają kierunki dalszego rozwoju prac nad możliwościami sztucznej inteligencji” – podkreśla Artur Długosz z Intela. Zdaniem ekspertów pierwsze powszechnie dostępne, oparte na analogicznych założeniach i wykorzystujące metodę nauczania sieci neuronowych w systemie nagród i kar, urządzenia dostosowane do wsparcia osób niepełnosprawnych trafią na rynek w ciągu najbliższej dekady.

Tagi