Trendy 2021: Hot or Not
Trendy 2021: HOT or NOT? Typuje Bogusław Święcicki
Hot or not, czyli w co inwestować pieniądze, czas w 2021? Oto jest pytanie… HOT: Natural Language Processing, bazy grafowe; NOT HOT: cloud-as-an-onprem – typuje Bogusław Święcicki, dyrektor ds rozwoju w Makolab.
O odpowiedź na pytanie o trendy “hot or not” – w ramach nowej rubryki na łamach „ITwiz” – prosimy CXO, ekspertów i naukowców. Pytamy o ich emocje w stosunku do technologii, trendów i zjawisk technologicznych. Ich odpowiedzi to migawka, zapis chwili, zdjęcie w czasie. Krótko i na temat.
Zapraszamy do lektury i komentowania – także podczas spotkań CXO HUB!
Oto, jak typuje Bogusław Święcicki.
- Które technologie, podejścia lub zjawiska wynikające ze stosowania technologii właśnie zyskują na znaczeniu?
- Co okazuje się odpowiedzią na potrzeby firm i użytkowników nowych technologii?
- Które rozwiązania okazują się niewypałem i schodzą ze sceny?
- Co jest „hot”, a co „not hot” we współczesnych technologiach?
HOT
Natural Language Processing
Możliwość porozumiewania się z komputerem w sposób naturalny i nauczenia go zrozumienia tekstu, obrazu ich kontekstu to doświadczenie niezwykłe. W ostatnim czasie w zespole, którym zarządzam, został zrealizowany projekt, którego celem było przeanalizowanie 200 tys. artykułów naukowych, w tym ponad 100 tys. z pełnym tekstem, o COVID-19, SARS-CoV-2 i pokrewnych koronawirusach, a następnie opracowanie wniosków na ten temat. Opracowane przez Pawła Garbacza i Roberta Trypuza rozwiązanie klasyfikuje zdania na te, które wyrażają istotne korelacje (odkryte i opisane) oraz te, które reprezentują inne informacje, które znajdujemy w streszczeniach artykułów, takie jak rodzaj artykułu, procedury eksperymentalne, opisy próbek itp. Ostatecznym celem było wybranie ze wszystkich zdań podzbioru, który wyraża kluczowe informacje o COVID- 19.
Analiza i rozumienie kontekstu informacji dostępnej w Internecie jest szansą do weryfikacji – na zasadzie prawda-fałsz – tej informacji z rozsądną liczbą odcieni. Dla komputera jest to możliwe w skończonym czasie, dla człowieka już nie. Rozwiązania Natural Language Processing i Watson Studio wspominane podczas spotkania CXO HUB 15 października przez dr Marka Michalewicza, dyrektora ICM UW, umożliwiają stosowanie tych rozwiązań z każdego miejsca z dostępem do Internetu, przy niewielkim koszcie w porównaniu do budowania własnej infrastruktury serwerowej i softwarowej. To odpowiednie narzędzia do takiej skali problemów i zarazem niedostępne on-premise.
Niezwykle gorące są zresztą wszystkie funkcje cloud computing, nieodstępne – albo bardzo trudno dostępne – w projektach bazujących na infrastrukturze on-premise. Ontologia semantyczna wzbogacona o narzędzia Machine Learning – wraz z Natural Language Processing – tworzy sztuczną inteligencję wspierająca człowieka w podejmowaniu decyzji .
Bazy grafowe
Jest to temat jest jeszcze bardziej gorący niż NLP. Label Property Graphs to nowy rodzaj baz danych, takich jak np. Neo4J czy czy TigerGraph. Dają one nowe możliwości agregacji potężnej ilości danych i ich analizy. Poszukiwanie zależności, korelacji oraz wizualizacji w czasie rzeczywistym daje nowe możliwości niedostępne w relacyjnych bazach danych. Zastosowanie tego typu technologii jest ograniczone tylko wyobraźnią. Dr Marek Michalewicz wspominał – podczas spotkania CXO HUB – o zastosowaniu baz grafowych do analizy i wizualizacji zagrożeń w sieci.
NOT HOT
Cloud as an on-premise
Model cloud computing używany jako – stojący obok naszej serwerowni – serwer, wykorzystywany jako komputer lub maszyna wirtualna… Egzotyczne w tym jest tylko to, że to „obok” jest dalej, albo „nie wiem, gdzie”, i na tym koniec z dreszczami emocji z powodu nowinek. Wiele wdrożonych rozwiązań nie potrafi korzystać z gotowych usług, funkcji chmurowych, a to one dają realną wartość dodaną. Natywne funkcje chmurowe są cały czas rzadko stosowane w rozwiązaniach takich, jak np. systemy ERP. Weźmy przykładowo mechanizm OCR stosowany do skanowania dokumentów. Wersja klasyczna on-premise jest uciążliwa w instalacji i konfiguracji sprzętu. W dodatku nie zawsze jest dokładna. Alternatywnym rozwiązaniem jest zastosowanie rozwiązania chmurowego. Jeśli program do analizy dokumentów finansowych wywoła z chmury funkcję „rozpoznaj tekst”, to koszt użycia tego rozwiązania wyniesie jedną setną centa wartości samego tekstu, a wykonanie zadania potrwa znacząco krócej. Dzieje się tak dlatego, że korzystasz z gotowej funkcji ciągle udoskonalanej i uaktualnianej. Na koniec zaś, system ERP zaksięguje wydatki z dokładnością co do miejsca powstawania kosztów.
Cóż, jeśli tak często ludzie nie chcą “hot”, tylko po staremu – wolą zmarznąć niż coś zmienić.