BiznesAnalityka

Integracja i standaryzacja zwiększy użyteczność danych medycznych

Największą barierą w analizie danych medycznych jest ich olbrzymia różnorodność. Jednak w tej różnorodności tkwi jednocześnie wielka szansa na poprawę skuteczności terapii.

Integracja i standaryzacja zwiększy użyteczność danych medycznych

Coraz większa dostępność opieki zdrowotnej powoduje, że lekarze dysponują coraz większą liczbą danych na temat coraz większej liczby pacjentów, informacji na temat przebytych przez nich chorób i zastosowanych terapii. Zwiększa się także zakres i precyzja wyników badań diagnostycznych wykonywanych za pomocą nowoczesnych urządzeń i technologii. Zbiory danych medycznych osiągnęły już taką wielkość i złożoność, że efektywny dostęp do wielu zawartych w nich informacji i wynikającej z nich wiedzy nie jest możliwy bez użycia odpowiednich narzędzi analitycznych, w tym rozwiązań typu Big Data.

Rola zaawansowanych technologii analitycznych w rozwoju medycyny i badań klinicznych była tematem przewodnim tegorocznej edycji konferencji SAS Institute „Advanced Analytics and Data Science” w Szkole Głównej Handlowej. Za jedną z najważniejszych barier utrudniających pełne wykorzystanie potencjału zawartego w istniejących zasobach uznano olbrzymią różnorodność i rozproszenie danych medycznych, zarówno pod względem ich źródeł, treści i formatów zapisu. Z drugiej strony, uczestnicy spotkania podkreślali, że niejednorodność i zróżnicowanie tychże zbiorów to jednocześnie szansa na znalezienie wielu nowych, skutecznych rozwiązań niedostępnych do tej pory lekarzom i naukowcom.

Potrzeba wysoko zaawansowanych metod

Duża różnorodność danych medycznych – w połączeniu z coraz doskonalszymi narzędziami do ich analizy – zwiększa efektywność badań naukowych, przyczynia się do tworzenia coraz skuteczniejszych metod diagnostycznych, sprzyja opracowywaniu coraz lepszych leków i sposobów terapii. Wyniki analiz mogą służyć również poprawie zarządzania placówkami opieki zdrowotnej czy wypracowywaniu optymalnych modeli polityki zdrowotnej w skali całego państwa. Są poza tym pomocne w działalności biznesowej związanej z usługami medycznymi czy produkcją leków.

W modelowaniu procesów biomedycznych coraz bardziej zauważalna staje się potrzeba korzystania z uczenia maszynowego. Wiele nadziei badacze pokładają także w zastosowaniu narzędzi do text-mining’u, czyli wydobycia danych z informacji tekstowych. Dzięki nim możliwy staje się dostęp do informacji zawartych w nieustrukturyzowanych, swobodnych notatkach lekarskich uzupełnianych w elektronicznych kartach chorych podczas codziennych wizyt pacjentów czy w innych dokumentach tekstowych.

Jedną z dziedzin, w której bardzo intensywnie wykorzystywane są w ostatnich latach możliwości oferowane przez narzędzia do analizy wielowymiarowych danych, jest onkologia. Badanie genomów (cząsteczek DNA) i transkryptomów (cząsteczek RNA) sprzyja rozwojowi onkologii precyzyjnej, nastawionej na dostosowywanie terapii do indywidualnych cech konkretnych pacjentów. Pozwala to na bardziej skuteczne leczenie chorych na nowotwory. Daje przy tym również możliwość optymalizacji kosztów leczenia.

Analizy biomedyczne należą jednak do bardzo skomplikowanych. Badacze zajmujący się biologią molekularną muszą zmierzyć się z bardzo obszernymi, wielowymiarowymi danymi, które na dodatek mają bardzo złożoną strukturę. W wyniku każdej obserwacji czy badania typu „omics” (genomics, proteomics, metabolomics itp.) pojawia się duża liczba zmiennych, które trzeba jednocześnie poddać analizie. Wymaga to zastosowania złożonych metod obliczeniowych i zaawansowanych narzędzi statystycznych.

W modelowaniu procesów biomedycznych coraz bardziej zauważalna staje się potrzeba korzystania z uczenia maszynowego. Wiele nadziei badacze pokładają także w zastosowaniu narzędzi do text-mining’u, czyli wydobycia danych z informacji tekstowych. Dzięki nim możliwy staje się dostęp do informacji zawartych w nieustrukturyzowanych, swobodnych notatkach lekarskich uzupełnianych w elektronicznych kartach chorych podczas codziennych wizyt pacjentów czy w innych dokumentach tekstowych, np. powstających podczas badań klinicznych. Kolejnym wyzwaniem jest połączenie danych medycznych z informacjami środowiskowymi, np. o zanieczyszczeniu powietrza, strukturze demograficznej, aktywności zawodowej pacjentów itp.

Dla wszystkich jednakowe standardy

Do osiągnięcia jak najlepszych rezultatów analiz potrzebna jest jednak integracja i standaryzacja danych medycznych. Obecnie w użyciu jest wielka różnorodność wykorzystywanych w opiece zdrowotnej standardów transmisji, zapisu i przechowywania danych biomedycznych. Na dodatek, każdy uważa, że jego standardy są właściwe. Do najpopularniejszych, używanych obecnie standardów należą m.in.: HL7, CIMI, OpenEHR, Omaha System, CEN, ISO/TC 215, GE Healthcare, CDISC, NIH.

Jedną z dziedzin, w której bardzo intensywnie wykorzystywane są w ostatnich latach możliwości oferowane przez narzędzia do analizy wielowymiarowych danych, jest onkologia. Badanie genomów (cząsteczek DNA) i transkryptomów (cząsteczek RNA) sprzyja rozwojowi onkologii precyzyjnej, nastawionej na dostosowywanie terapii do indywidualnych cech konkretnych pacjentów. Pozwala to na bardziej skuteczne leczenie chorych na nowotwory.

W opanowaniu złożoności danych medycznych może pomóc także ich publiczne udostępnianie. Już dzisiaj istnieją liczne, otwarte, publicznie dostępne zbiory danych medycznych. Dzięki temu istnieje możliwość wykorzystania do analiz nie tylko danych będących w wewnętrznych, siłą rzeczy ograniczonych zasobach poszczególnych organizacji, lecz także w szerszej skali. Zwiększa się również różnorodność analizowanych danych.

Tagi

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *