Analityka Polecane tematy

W jaki sposób Big Data może wesprzeć walkę z epidemią koronawirusa COVID-19

Mikołaj Marszycki 25 marca 2020

1 2 784 6 minut(y) czytania

Z dr. Franciszkiem Rakowskim z Interdyscyplinarnego Centrum Modelowania Matematycznego i Komputerowego Uniwersytetu Warszawskiego rozmawiamy o stworzeniu modelu matematycznego, który wspiera analizę rozprzestrzeniania się koronawirusa COVID-19; rządowym projekcie wykorzystania tego modelu; współpracy międzynarodowej; pomysłach, które spływają do resortu zdrowia; oraz wykorzystaniu analiz Big Data i Artificial Intelligence.

Czy mamy już wystarczająco dużo danych, aby móc uruchomić odpowiednie modele matematyczne do analizy epidemii koronawirusa, jak i sposobów rozprzestrzeniania się COVID-19?

Danych do stworzenia podstawowego modelu już mamy, więc oczywiście możemy go uruchomić. Bardziej jednak chodzi o to, że powinien następować nieustanny proces kalibracji oraz wzbogacania takiego modelu o jak najbardziej różnorodne, nowe informacje. Im bowiem więcej będzie walidacji, tym bardziej będzie on wiarygodny.

Jakiego rodzaju danymi zasila się taki model?

Są to dane dwojakiego rodzaju. Z jednej strony, socjodemograficzne i georeferencyjne czyli dane o strukturze socjodemograficznej państwa. Są to informacje o tym gdzie mieszkamy, jaka jest gęstość zaludnienia i skład gospodarstw domowych, czy też wszelkie informacje na temat miejsc spotkań. Te dane można otrzymać z Głównego Urzędu Statystycznego. Natomiast z drugiej strony, są to dane o transmisyjności wirusa czyli o samym procesie infekcji. Pobieramy je z publikacji naukowych i medycznych dotyczących koronawirusa.

No właśnie, czy naukowcy udostępniają sobie wzajemnie dane do analiz? Czy ICM ma dostęp do danych o zachorowaniach z całego świata?

Oczywiście! Istnieje współpraca w stałym kanale, czyli poprzez publikacje naukowe, które obecnie udostępniane są tzw. szybką ścieżką. Jeśli tylko ktoś, coś wynajdzie, odkryje czy opisze, co dotyczy koronawirusa, najczęściej praca taka nie przechodzi długotrwałego procesu recenzji tylko szybko – w przeciągu kilku dni – jest ona dostępna dla wszystkich naukowców. Wszyscy się starają, aby aktualne dane były szybko dostępne. Poza tym mamy dostęp do danych z World Health Organization – WHO czy European Centre for Disease Prevention and Control -ECDC. Ale większość danych bierze się jednak z publikacji naukowych i wiarygodnych portali o tematyce naukowej.

Jest to więc wzajemna wymiana informacji. Czy jednak istnieje jakaś współpraca paneuropejska dotycząca wykorzystania „naukowych” zasobów obliczeniowych do przyspieszenia analizy danych na temat koronawirusa?

Nic mi na ten temat nie wiadomo. Natomiast mamy taki pomysł, aby nasz model – który już istnieje – sprząc z innymi modelami tego typu. Będziemy teraz kontaktowali się z różnymi ośrodkami, które zajmują się takimi modelami poza granicami polski.

Rozumiem, że mówi Pan o tym modelu badającym rozprzestrzenianie się grypy?

Tak.

Czy powstanie na jego podstawie model matematyczny dotyczący koronawirusa?

Z punktu widzenia modeli matematycznych jest wszystko jedno czy to jest koronawirus, czy grypa. Ważne jest przede wszystkim to, że jest to choroba przenoszona drogą kropelkową. Wszystkie wirusy, które są przenoszone w ten sposób mogą być opisane przez tego typu model. Zatem nasz model dotyczący grypy jak najbardziej pasuje do koronawirusa.

Natomiast problemem jest fakt, iż został on zbudowany 10 lat temu i wszystkie dane socjodemograficzne muszą zostać uaktualnione, a sam model musi zostać rozszerzony. Ale zespół w ICM pracuje już nad tym, aby jak najszybciej go uaktualnić. Oczywiście nawet już na podstawie tych starszych danych będzie można publikować wyniki, które będą miały pewną wiarygodność.

To jest działanie na zlecenie rządu?

To jest działanie w ramach współpracy z Ministerstwem Zdrowia oraz Państwowym Zakładem Higieny.

W jaki sposób dostosowuje się w takim modelu parametry i zmienne, aby oddać dynamikę epidemii? W jaki sposób mógłby on realnie przyczynić się do walki z pandemią?

Modele tego typu zakładają pewną infekcyjność i na podstawie początkowego przebiegu epidemii – w którym nie zostały zastosowane żadne środki interwencyjne – można dopasować wyniki modelu do obserwacji, które już mamy. Następnie można zasymulować pewne interwencje administracyjne, tak jak to się dzieje obecnie, czyli zamykanie szkół, zakaz podróżowania, zgromadzeń itd. Model taki pokazuje jaka będzie dalsza dynamika rozprzestrzeniania się wirusa czy epidemii. Wskazuje też jakie są skutki i konsekwencje wprowadzenia pewnych obostrzeń ze strony władz i czy pewne obostrzenia są wystarczające, a być może nawet nadmiarowe.

Nadmiarowe?

Tak. Pojawia się choćby pytanie czy zamknięcie szkół było właściwe? Decyzja ta została podjęta intuicyjnie. Natomiast być może – podobnie jak w Korei Południowej – szkoły mogłyby być otwarte, a wystarczyłby jedynie bardzo silny nadzór nad wszystkimi podejrzanymi o zarażenie.

I co mówi na ten temat model matematyczny?

Nie odpowiedzieliśmy jeszcze na to pytanie. Jak już mówiłem prace obecnie trwają. Póki go nie przygotujemy, nie ma możliwości wyciągnięcia z niego żadnych wniosków.

Kiedy zatem będzie on gotowy?

Myślę, że w tej podstawowej wersji za ok. 2-3 tygodnie.

Jaka jest w ogóle „skuteczność” matematycznych modeli rozprzestrzeniania epidemii? Brytyjskiemu modelowi Fergusona zarzuca się choćby nieuwzględnienie testów na koronawirusa. Inni mówią, że nawet 80% przypadków nie jest uwzględniana, bo osoby te przechodzą chorobę właściwie bezobjawowo, we Włoszech więc nie byłoby 50 tys. przypadków, a np. 250-300 tys. osób z koronawirusem…

Podstawowa kwestia to fakt, że nie wiadomo jaka jest skuteczność takich modeli. A nie wiadomo z tego powodu, że parydygmat nauki ścisłej polega na tym, iż buduje się model matematycznie, a następnie waliduje się go na danych eksperymentalnych. Do tej pory nikt nie przeprowadził takiego eksperymentu pod tytułem pandemia. Jest to jedna z pierwszych sytuacji na świecie, w której taki model będzie mógł być zwalidowany i powiedzmy dopiero za sezon będziemy wiedzieli jaka jest jego rzeczywista skuteczność.

Z drugiej strony, jest wiele przesłanek mówiących o tym, że do pewnego stopnia ten model jest skuteczny. Natomiast nie może być on traktowany jako swego rodzaju wyrocznia przez osoby podejmujące ważne decyzje. To jest pewna część wachlarza informacji, które spływają do decydentów. Wyniki modelu są jednym z aspektów, które należy, a przynajmniej powinno się, wziąć pod uwagę. Modele matematyczne sprawdziły się w wielu dziedzinach, w związku z tym prawdopodobnie i w tej dziedzinie będą dość skuteczne. Ale powtarzam, nie można na nich polegać w sposób absolutny. Podobnie jak choćby w wypadku, gdy jedziemy na wycieczkę i sprawdzamy jaka będzie pogoda według modelu prognostycznego ICM. On się bardzo często sprawdza, ale nie mamy przecież do niego pretensji, że jednak nie zadziałał, bo akurat padał deszcz. Ludzie, którzy patrzą na wyniki modelu matematycznego epidemii muszą mieć umiejętność i świadomość korzystania z tych modeli, ich wyników oraz umiejętność przykładania odpowiedniej wiarygodności do ich wyników. Zresztą te wyniki obejmują róże aspekty, można się np. zapytać model o całkowitą liczbę osób, które zachorują. Można zadawać pytania ogólne lub szczegółowe, i w zależności jakie pytanie się zadaje, odpowiedź przychodzi z różną wiarygodnością.

Odnosząc się jeszcze do Pana pytanie o skuteczność takiego modelu, podstawową przesłanką jest fakt, że nasz świat jest opisywalny matematycznie. W końcu współczesna technologia, wiedza itd. polega na tym, że opisujemy je właśnie modelami matematycznymi. Inną przesłanką – zwłaszcza w wypadku epidemii – jest to, że globalne przebiegi epidemii rejestrowane w świecie zgadzają się z wynikami modelu w skali globalnej. Czyli można tak dopasować parametry, aby się to zgadzało. Jest to więc narzędzie właściwe.

Czy zatem kluczem do skuteczności jest dobre dopasowanie parametrów?

Tak, ale tylko w przypadku, gdy w czasie rzeczywistym prowadzona jest kalibracja i walidacja modelu, na podstawie danych, które się właśnie zbiera.

Eksperci z Uniwersytetu Oksfordzkiego badają obecnie możliwość wykonania aplikacji mobilnej do śledzenia w czasie rzeczywistym kontaktów osób zakażonych koronawirusem. Uważając, że takie rozwiązanie mogłoby przyczynić się do powstrzymania rozprzestrzeniania się COVID-19. Co Pan sądzi o takim projekcie?

To jest dobry pomysł. Jest on komplementarny w stosunku do modeli predykcyjnych, bo służy do skutecznego wprowadzenia polityki izolacji. A jak wiadomo izolacja jest dziś najskuteczniejszym sposobem na walkę z epidemią. Jestem jak najbardziej za.

Czy – z czysto technologicznego punktu widzenia, nie biorąc pod uwagę ograniczeń prawnych związanych choćby z RODO – podobna aplikacja mogłaby powstać w Polsce?

Pewnie, że tak! Czemu nie? A co do RODO, jeśli chodzi o życie lub śmierć tysięcy ludzi, to RODO po prostu „idzie na półkę”. Walczymy obecnie na wojnie. Ludzie, którzy zasłaniają się w tej kwestii RODO – czy innymi obostrzeniami prawnymi – są po prostu niepoważni. Przecież gdy epidemia minie „włączymy” to RODO z powrotem.

Rozumiem, że taka aplikacja mogłaby być dobrym źródłem danych do modeli matematyczno-komputerowych?

Jak najbardziej! Walidacja wzorca kontaktów dziennych poprzez takie dane byłaby nie do przecenienia.

Czy są jakieś inne sposoby na wykorzystanie analizy Big Data do walki z pandemią koronawirusa?

Z tego co wiem, do Ministerstwa Zdrowia spływają obecnie dziesiątki propozycji od różnych firm, instytucji, profesjonalistów i amatorów, którzy mają pomysł jak to zrobić.

Wie Pan może jakiego typu są to rozwiązania?

Głównie informacyjne. Takie, które służą do tego, aby szczegółowo informować rząd i społeczeństwo o tym jak się ta epidemia rozwija. Zresztą rozwiązanie z Oksfordu – o którym Pan wspomniał – nie jest jedyne i nie tylko oni na to wpadli. Nasze firmy również oferują podobne pomysły ministerstwu. Pytanie jest tylko jakie są zdolności operacyjne, aby takie rozwiązanie szybko wdrożyć? I czy w ogóle jest to możliwe? Tego nie wiem.

Czy występujące w Polsce moce obliczeniowe centrów superkomputerowych umożliwiłyby wykonanie podobnych działań?

Tych mocy jest z naddatkiem. Obliczenia, które wykonuje się w obszarach naukowych wymagają znacznie większych mocy niż śledzenie „zaledwie” 40 mln obywateli. Także nie jest to jakieś wielkie obciążenie.

A co jeśli chodzi o wykorzystanie sztucznej inteligencji, z której z powodzeniem skorzystał Tajwan, aby zdusić w zarodku rozwój epidemii…

To są specyficzne rozwiązania. Z tego co kojarzę, to dotyczyły one śledzenia tych ludzi, którzy są zakażeni i identyfikowania tych, którzy mogliby być zakażeni.

Wykorzystywano jeszcze aktualizacje, które w czasie rzeczywistym ostrzegały ludzi o ryzykownych obszarach.

Tak! Inteligentnie użyta sztuczna inteligencja oczywiście mogłaby pomóc. Natomiast problem jest taki, że może ona dotyczyć wyłącznie zachowań bieżących, bo w tym wypadku mamy dane, które pozwalają nauczyć AI. Ale jeśli chodzi o przewidywanie możliwych scenariuszy to sztuczna inteligencja nie da sobie rady, ponieważ nie ma historii, z której mogłaby skorzystać, i na której mogłaby się nauczyć. Trzeba też pamiętać, że AI polega na tym, że na wzorcach, które już istnieją, uczy się ona rozpoznawać, klasyfikować czy też określać dane, których wcześniej nie widziała. Musi mieć więc cały szereg danych treningowych, a dla epidemii danych takich nie mamy.

A gdybyśmy na bieżąco podawali AI dane?

Nie wydaje mi się to możliwe.

Tagi