Programowanie

Polski zespół stworzył sieć neuronową, która uczy się grać w gry znane z platformy Atari

Polski zespół stworzył sieć neuronową, która jest w stanie samodzielnie nauczyć się grania w proste gry. Oprogramowanie uruchomione rozwijane we współpracy z firmą Intel testowano m.in. na grach, takich jak: Breakout, River Raid i Space Invaders. Eksperymentalny projekt ma przysłużyć się rozwojowi robotyki i autonomicznych systemów, które będą wspierać ludzi w różnego rodzaju zadaniach.

Polski zespół stworzył sieć neuronową, która uczy się grać w gry znane z platformy Atari

Celem przeprowadzonego przez zespół firmy deepsense.ai i wzorowanego na eksperymencie przeprowadzonym w 2013 roku przez zespół DeepMind projektu było zweryfikowanie czy algorytmy sztucznej inteligencji oparte na możliwościach platformy Intel Xeon zdolne do samodzielnej nauki rozgrywania gier wideo będą w stanie na tych samych zasadach nauczyć się sterowania różnego rodzaju autonomicznymi pojazdami. Gry znane z platformy Atari wykorzystano na potrzeby nauczania sieci neuronowych metodą nagród i kar. “W deepsense.ai pracujemy nad podobnymi zagadnieniami, więc postanowiliśmy powtórzyć eksperyment DeepMind nieco go modyfikując. W naszym badaniu wykorzystaliśmy niekonwencjonalną infrastrukturę, opierając się na procesorach Xeon Intela” – wyjaśnia kierujący tym projektem w firmie deepsense.ai dr hab. Henryk Michalewski z wydziału Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego.

Zastosowany system nauki sieci neuronowej zakłada, że na początkowym etapie algorytm nie tylko “nie wie” jak grać, aby wygrywać – nie posiada też informacji na temat celu i reguł danej gry. Wykorzystany system kar i nagród w miarę kolejnych iteracji gry pozwala komputerowi zorientować się, jaki rodzaj działań zbliża osiągnięcie celu, a jaki – utrudnia osiągnięcie sukcesu, a także – doskonalić umiejętności gry. Stworzony przez Polaków algorytm potrzebował mniej niż doby, by opanować każdą z gier na mistrzowskim poziomie – i osiągać wyniki przewyższające możliwości ludzkich graczy. W przypadku uruchomienia algorytmu w środowisku klastrowym cały proces nauki w gry, takie jak: River Raid czy Breakout, został skrócony do kilkunastu minut.

Co ważne, oprogramowanie zostało uruchomione w oparciu o standardowy serwer z procesorem Intel Xeon i przy wykorzystaniu oprogramowania stworzonego we współpracy z inżynierami zatrudnionymi w gdańskim centrum badawczo-rozwojowym firmy Intel. Prace programistyczne koncentrowały się m.in. na rozwiązaniach pozwalających na optymalne wykorzystanie dostępnej mocy obliczeniowej. “Jednym z priorytetów Intela jest rozwój systemów sztucznej inteligencji, zdolnych ułatwiać życie jednostek, rozwiązywać problemy społeczne i unowocześniać pracę przedsiębiorstw. Już dziś uczenie maszynowe i głębokie rewolucjonizują sektory takie jak finanse i bankowość czy medycyna. Projekty prowadzone przez polskich naukowców i inżynierów wytyczają kierunki dalszego rozwoju prac nad możliwościami sztucznej inteligencji” – podkreśla Artur Długosz z Intela. Zdaniem ekspertów pierwsze powszechnie dostępne, oparte na analogicznych założeniach i wykorzystujące metodę nauczania sieci neuronowych w systemie nagród i kar, urządzenia dostosowane do wsparcia osób niepełnosprawnych trafią na rynek w ciągu najbliższej dekady.

Tagi

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *