Integracja informacji z wielu różnych źródeł była celem nadrzędnym stworzenia platformy informatycznej ONKO.SYS w Centrum Onkologii – Instytucie im. Marii Skłodowskiej–Curie.
Impulsem do stworzenia platformy był brak możliwości porównywania danych gromadzonych w Instytucie w różnych systemach i ich analizy. Oprócz rozproszenia i braku integracji istniejących zasobów informacyjnych, brakowało też zaawansowanych narzędzi statystycznych, które mogłyby wspierać prowadzenie analiz, jak również nowoczesnych narzędzi do wizualizacji wyników analiz. Istniała także potrzeba zautomatyzowania rozbudowanej sprawozdawczości ciążącej na pracownikach naukowych Centrum. Niezbędne stało się, aby zgromadzić w jednym miejscu i zintegrować rozproszone dotychczas dane dotyczące wszystkich obszarów i aspektów działalności oraz wszystkich zasobów ośrodka.
Działający od początku bieżącego roku system ONKO.SYS składa się z kilku modułów. Integrację danych zapewnia hurtownia danych. Towarzyszy jej zestaw narzędzi analitycznych i raportowych. Oprócz tego pracownicy mogą korzystać z elektronicznego systemu obiegu dokumentów i systemu zarządzania projektami. Poszczególne jednostki organizacyjne mają witryny informacyjne. W systemie są także informacje o wszystkich pracownikach naukowych Centrum. Repozytorium OmegaPSIR służy wspomaganiu ich działalności naukowej. Zawiera informacje o publikacjach, konferencjach, projektach, współpracy, awansach naukowych. Na specjalnym forum można się wymieniać informacjami i opiniami. Można także korzystać przez sieć ze zbiorów biblioteki instytutowej i archiwum prac naukowych. Dostęp do wszystkich zasobów systemu zapewniany jest przez specjalny portal.
Obraz całości
Największym źródłem danych dla hurtowni jest szpitalny system informacyjny HIS (Hospital Information System). Działa on w warszawskim Centrum Onkologii – Instytucie im. Marii Skłodowskiej-Curie (COI). Służy wspomaganiu bieżącej działalności szpitala i przychodni. Do elektronicznego systemu szpitalnego wszyscy lekarze wpisują na bieżąco informacje o pacjentach. Są tam wszystkie „karty” pacjentów, zawierające wszystkie dane charakteryzujące pacjenta: rozpoznania, ustrukturyzowane i tekstowe wyniki badań, przebieg leczenia, porady czy zabiegi.
Jedną z podstawowych korzyści z analizy Big Data zasobów medycznych jest znalezienie prawidłowości w bardzo dużej próbie przypadków. Daje to możliwość zdobycia wiedzy nieosiągalnej poprzez śledzenie pojedynczych przypadków. Dzięki hurtowni zyskaliśmy dostęp do danych dotychczas dla nas niedostępnych. Często też do takich, o istnieniu których nie wiedzieliśmy, bo jako niestandardowe nie były ujawniane bezpośrednio w systemie szpitalnym – mówi prof. Magdalena Chechlińska, kierownik Zakładu Immunologii w Centrum Onkologii – Instytut im. Marii Skłodowskiej-Curie w Warszawie.
„Pojedynczy pacjent jest bardzo dobrze opisany w tym systemie. Wcześniej nie było jednak możliwości porównywania chorób i stosowanych terapii u wielu różnych pacjentów. Pojawiła się potrzeba stworzenia rozwiązania, które by zapewniało możliwości wykonywania zaawansowanych, wieloaspektowych analiz, i które pozwalałoby prowadzić te analizy bez zaburzania codziennej pracy systemu szpitalnego” – tłumaczy prof. Magdalena Chechlińska, kierownik Zakładu Immunologii, inicjator i koordynator realizacji projektu ONKO.SYS. „Tymczasem korzystanie z analityki jest dzisiaj niezbędne zarówno dla pracy naukowej jak i codziennej praktyki lekarskiej” – dodaje.
Hurtownia zasilana jest również danymi z systemów diagnostycznych w poszczególnych pracowniach. Opisy przeprowadzonych badań laboratoryjnych i obrazowych łączone są z innymi informacjami o pacjentach. Obrazy (np. tomograficzne) gromadzone są w elektronicznych archiwach poszczególnych pracowni. Część informacji w hurtowni dotyczy też pacjentów spoza COI. Są to np. pacjenci z innych ośrodków onkologicznych, które uczestniczą we wspólnych projektach badawczych lub pacjenci poddawani badaniom molekularnym. Hurtownia integruje także dane z ponad dwudziestu baz danych stworzonych przez pracowników naukowych Centrum Onkologii – Instytutu, np.: „Baza pacjentów poradni genetycznej”, „Bank komórek i tkanek”, „Baza preparatów komórek krwiotwórczych”, „Krajowy Rejestr Przełyku Barretta” „Potrójnie ujemny rak piersi”.
Dostęp do ukrytych zasobów
„Dzięki hurtowni zyskaliśmy dostęp do danych dotychczas dla nas niedostępnych. Często też do takich, o istnieniu których nie wiedzieliśmy, bo jako niestandardowe nie były ujawniane bezpośrednio w systemie szpitalnym” – mówi prof. Magdalena Chechlińska. Efektywne przetwarzanie zasobów hurtowni danych umożliwia zestaw narzędzi analitycznych, w który wyposażona jest platforma ONKO.SYS. Są to głównie narzędzia z pakietu SAS Advanced Analytics (SAS Visual Analytics, SAS Visual Statistics, SAS Enterprise Guide, SAS Data Integration Studio, SAS Data Miner). Z kolei do szybkiego dostępu do danych pochodzących z systemu szpitalnego – na potrzeby np. codziennej praktyki lekarskiej – służy program MSD firmy Transition Technologies. Do analiz w ramach ONKO.SYS wykorzystywanych jest także kilka specjalistycznych programów, np. JMP Genomics.
Duże nadzieje na możliwość zdobycia wiedzy nieosiągalnej dotychczasowymi metodami pracownicy warszawskiego Centrum Onkologii pokładają w analizie nieustrukturyzowanych zapisów notatek lekarskich. Do tej pory zgromadzono już ponad 8 mln takich notatek, a co miesiąc przybywa 60 tys. nowych. Dzięki nim będzie można np. lepiej, na dużych, odpowiednio wyselekcjonowanych grupach analizować skuteczność strategii leczniczych, działania niepożądane leków.
Duże nadzieje na możliwość zdobycia wiedzy nieosiągalnej dotychczasowymi metodami pracownicy warszawskiego Centrum Onkologii pokładają w analizie nieustrukturyzowanych zapisów notatek lekarskich. W tym celu zastosowano, po raz pierwszy w Polsce, w medycynie, rozwiązanie SAS Content Categorization Studio. Jest to narzędzie do text-miningu. Do tej pory zgromadzono już ponad 8 mln takich notatek, a co miesiąc przybywa 60 tys. nowych. „Wykorzystanie danych zawartych w notatkach lekarskich otwiera zupełnie nowe możliwości badań i poszukiwania skuteczniejszych sposobów leczenia chorych na nowotworowy” – zapewnia prof. Magdalena Chechlińska. Będzie można np. lepiej, na dużych, odpowiednio wyselekcjonowanych grupach analizować skuteczność strategii leczniczych, działania niepożądane leków. Tylko w notatkach lekarskich opisane są losy pacjenta, takie jak zmiana leczenia i samopoczucie pacjenta po zastosowaniu określonej terapii. Narzędzie do text miningu rozpoznaje, czy użyte wyrażenia mają zabarwienie negatywne czy pozytywne.
W stronę zindywidualizowanej terapii
Platforma ONKO.SYS daje możliwość prowadzenia badań klinicznych, których wyniki będą miały bezpośredni wpływ na sytuację pacjentów. To są m.in. badania dotyczące łączenia leków. Dzięki analizie danych dotyczących dużej liczby przypadków można lepiej weryfikować skuteczność działania określonych leków i strategii terapeutycznych na tle indywidualnych uwarunkowań. Można również próbować identyfikować leki, jakie można by z powodzeniem stosować do innych jednostek chorobowych niż te, w leczeniu których są rutynowo stosowane.
„Choroby nowotworowe są niezwykle heterogenne. Taki sam typ nowotworu u każdego pacjenta może być de facto inną chorobą. Dlatego niezwykle ważne jest, aby mieć dostęp do informacji, które pozwolą dopasować dla każdego przypadku jak najlepsze leki i sposoby terapii” – podkreśla prof. Magdalena Chechlińska. Medycyna precyzyjna staje się coraz bardziej realna za sprawą możliwości integrowania coraz większych liczby danych medycznych poddawanych coraz dokładniejszym analizom.
Przykładowe wykorzystanie analiz danych medycznych:
- • Analiza efektywności strategii leczenia w kontekście indywidualnych cech pacjenta.
- • Tworzenie algorytmów wspomagających diagnostykę różnicową nowotworów oraz decyzje terapeutyczne.
- • Badania nowotworów rzadkich: identyfikacja przypadków, weryfikacja sposobów i wyników leczenia, poszukiwanie mutacji.
- • Analiza wyników badań wielkoskalowych (np. badań ekspresji genów).
- • Prognozowanie zjawisk medycznych i epidemiologicznych.
- • Szacowanie kosztów leczenia pacjentów, prognozowanie wydatków na opiekę medyczną w skali ośrodka, regionu, kraju.
- • Szacowanie tzw. niepotrzebnych kosztów (oszczędności u progu wzrostu wydatków na leczenie i opiekę starzejącego się społeczeństwa).
- • Optymalizacja procedur medycznych w skali kraju (obniżanie kosztów i unikanie narażania pacjentów na niepotrzebne procedury).
- • Porównywanie jakości i standardów leczenia między ośrodkami.
- • Porównywanie efektywności leczenia pacjentów leczonych kompleksowo w jednym ośrodku, względem leczenia w różnych ośrodkach.