Cloud computingCloud Use CasePolecane tematy

Jednolity Plik Kontrolny zbierany w chmurze publiczne

Aby przygotować się na bliżej nieokreślony wolumen zbieranych od podatników danych, Ministerstwo Finansów zdecydowało się wykorzystać możliwości łatwego skalowania zasobów w chmurze obliczeniowej. Gotowe, dostępne tam narzędzia przyspieszają także kolejne, realizowane w resorcie finansów projekty.

Jednolity Plik Kontrolny zbierany w chmurze publiczne
3d rendering circuit cloud on tablet for cloud computing technology

Jak wspominają przedstawiciele Ministerstwa Finansów, na początku projektu co prawda wiedziano jak dużo Jednolitych Plików Kontrolnych (JPK) może zostać przesłanych, jednak nie do końca wiadomo było jak duże będą to pliki. „Tymczasem spodziewaliśmy się bardzo dużych ich rozmiarów. Dodatkowo chcieliśmy przygotować się na szczyt obciążenia odnotowywany zwykle między 20 a 25 dniem każdego miesiąca” – mówi Robert Kietliński, zastępca dyrektora Departamentu Informatyzacji w Ministerstwie Finansów.

Projekt zrealizowany zaledwie w 3 miesiące

„Uznaliśmy, że chmura obliczeniowa – w założeniach stworzona dla dużej ilości klientów – pozwala na stworzenie wystarczającego bufora, który będzie zbierał i przechowywał przez chwilę – przesyłane jednocześnie i w dużych ilościach – pliki JPK. My zaś już w tzw. wolnej chwili będziemy mogli je następnie pobrać jeden po drugim” – dodaje.

Projekt budowy rozwiązania na potrzeby JPK trwał – dzięki chmurze – zaledwie 3 miesiące. Zaczęło się od wystawienia odpowiedniego API w chmurze Azure. Następnie stworzono aplikację desktopową dla płatników. Na koniec zaś przekazano całe rozwiązanie do testów. „Zazwyczaj wpierw przeprowadzany jest proces legislacyjny, a dopiero później wdrażamy nowy projekt. W tym przypadku oba procesy realizowane były równolegle. Dzięki chmurze, wdrożenie kolejnych funkcjonalności wyprzedzało niekiedy legislację. Dzięki temu jednak wiedzieliśmy np., że pewnych zapisów w propozycji ustawy nie da się wdrożyć i przekazywaliśmy swoje uwagi do osób pracujących nad nią” – mówią przedstawiciele Departamentu Informatyzacji Ministerstwa Finansów.

W 2016 roku zaledwie ok. 6000 podmiotów było zobowiązanych do przesyłania Jednolitego Pliku Kontrolnego (JPK). Dlatego też był to dobry poligon doświadczalny do przetestowania usług w chmurze obliczeniowej. Ministerstwo Finansów wybrało Microsoft Azure. Ponieważ w chmurze wystawiane jest jedynie API, zapewnienie sprawnego działania usługi nie wymagało zbyt dużej liczby serwerów wirtualnych. Dużo większa jest za to – zakupiona w chmurze Azure – przestrzeń dyskowa. W tym roku resort finansów dodał kolejne serwery wirtualne, ponieważ od początku 2017 roku zobligowanych do przesyłania JPK jest już ok. 100 tys. podatników. Natomiast w roku 2018 będzie to łącznie ok. 1,6 mln podmiotów. „Sama przestrzeń dyskowa jest najtańszą z wykupionych przez nas usług. Dużo droższe jest przesyłanie danych. Płacimy zaś za ilość przekazywanych informacji” – wyjaśnia Robert Kietliński.

Bezpieczeństwo i możliwość wyboru centrum przetwarzania danych

Zgodnie z prawem, nawet samo przechowywanie plików po stronie dostawcy usług chmury obliczeniowej jest interpretowane jako ich przetwarzanie. „Ważna więc była dla nas możliwość wybrania centrum przetwarzania danych w obrębie Unii Europejskiej. Wybraliśmy dwa data center oferujące usługi Azure – podstawowe i zapasowe” – mówi Robert Kietliński. „Istotny był też poziom zabezpieczeń, związany m.in. z szyfrowaniem danych i przeciwdziałaniom atakom typu DDoS. W drugim przypadku miało to nas zabezpieczyć przed ewentualną próbą ukrycia w ten sposób karuzeli finansowej. Aby sprawdzić poziom zabezpieczeń wynajęliśmy nawet firmę, która przeprowadziła pentesty” – dodaje.

Przesyłane od podatników pliki XML są zabezpieczone i spakowane. Dane są szyfrowane, aby zabezpieczyć wrażliwe dane gospodarcze polskich firm. Resort finansów chciał także dzięki temu wyeliminować obawy, że dane polskich podmiotów mogą w jakiś sposób „trafić w ręce obcego rządu”. Pliki JPK nie są także w żaden sposób przetwarzane po stronie chmury obliczeniowej. „Dodatkowo przesyłany jest do nas znacznie mniejszy plik podpisujący i identyfikujący JPK. Dokonywane jest to po stronie podatników. Przeprowadzenie tego w naszym centrum danych wymagałoby bardzo dużych inwestycji w infrastrukturę” – tłumaczy Robert Kietliński.

System rozproszonego przechowywania i przetwarzania danych

Kolejny etap to ściągnięcie plików, sprawdzenie ich, odszyfrowanie a następnie przetwarzanie ich na platformie Hadoop w Centrum Przetwarzania Danych Ministerstwa Finansów. Platformę tę wdrożył w resorcie finansów Oracle Polska. „Hadoop wykorzystywany jest przez nas do przetwarzania danych ze wszystkich systemów, z których korzysta resort finansów. Na tej platformie przeprowadzana jest także integracja i przetwarzanie dużych zbiorów danych” – wyjaśnia Robert Kietliński.

Po doświadczeniach z e-Deklaracjami okazało się, że stworzenie dedykowanej infrastruktury pod zbieranie JPK nie byłoby uzasadnione ekonomicznie. „W e-Deklaracjach musimy przygotować się na piki liczby zbieranych od podatników dokumentów, np. teraz, pod koniec kwietnia. Później większość infrastruktury jest niewykorzystywana. Podobnie byłoby z infrastrukturą na potrzeby JPK. Jeden z dostawców zakup samego sprzętu – bez oprogramowania – na potrzeby tego projektu wycenił na 20 mln zł” – mówi Robert Kietliński.

„Tymczasem chmura stanowi dla nas jedynie bufor w przypadku zwiększonej nagle ilości przekazywanych plików. Następnie możemy je już powoli ściągać do siebie. Jednocześnie ponoszony przez nas koszt jest dużo niższy od budowy dedykowanej infrastruktury. Wykupiliśmy usługi w chmurze Azure za ok. 1 mln euro, co powinno wystarczyć nam na co najmniej 4 lata, i to pomimo innych projektów, w których także wykorzystujemy usługi cloud computing” – dodaje.

e-paragony zbierane w chmurze publicznej

W oparciu o usługi Microsoft Azure projektowane jest bowiem kolejne rozwiązanie związane z udostępnianiem przez sprzedawców klientom tzw. e-paragonów. Proponowany w przepisach model zakłada, że od stycznia 2018 roku kasy fiskalne będą podłączone online i będą automatycznie przesyłać dane o sprzedaży do centralnego repozytorium prowadzonego przez Ministerstwo Finansów. Projekt wymiany dotychczasowych kas fiskalnych na modele wydające e-paragony potrwa 3-4 lata. Państwo ma gromadzić dane handlowe, ale szczegóły naszych paragonów i płatności mają pozostać anonimowe.

„Na razie pracujemy nad koncepcją całego rozwiązania. Ponieważ nie wiadomo jeszcze czy do naszego systemu przesyłany będzie każdy paragon osobno, czy też co jakiś czas zagregowane dane, ponownie zdecydowaliśmy się na zbudowanie swego rodzaju bufora w chmurze Azure” – wyjaśnia Robert Kietliński. „Ten projekt jest jednak bardziej skomplikowany, ponieważ dane wymieniane mają być z kasami fiskalnymi w obu kierunkach. W założeniach mamy sterować przepływem informacji z kasy, a nawet wymuszać przesłanie do nas danych. Azure będzie niejako front-endem dla komunikacji systemu e-paragonów z nowymi kasami fiskalnymi” – dodaje.

Kolejne projekty rozwijane szybciej dzięki platformom cloud computing

W chmurze Azure powstaje także Rejestr Domen Służących do Oferowania Gier Hazardowych Niezgodnie z Ustawą. Będzie on wysyłał komunikaty push do operatorów telekomunikacyjnych w Polsce. Następnie będą oni mieli 24 godziny na uzupełnienie w swoich systemach DNS adresów stron niezgodnych z ustawą. Osoby wchodzące na te strony będą przekierowywane na stronę informacyjną Ministerstwa Finansów. Komunikat push będzie przesyłany za każdym razem, gdy zostanie dodany lub usunięty adres jakiejś stronnych. Rejestr „zakazanych” stron dla wszystkich dostępny jest już na hazard.mf.gov.pl.

„Microsoft Azure pozwala nam na bardzo szybkie zrealizowanie całego projektu, który – ze względu na prace legislacyjne – ‘wpłynął’ do nas dość późno. Dzięki chmurze możemy skorzystać z gotowych narzędzi i konkretnych usług dostępnych w Azure, które wykorzystujemy do budowy naszego rozwiązania. Dzięki temu, zaledwie w ciągu miesiąca byliśmy w stanie uruchomić wersję beta systemu i przekazać ją do testów. Stworzenie tego własnymi siłami trwałoby znacznie dłużej. Dlatego dostęp do natywnych usług w chmurze był dla nas równie ważny, co bezpieczeństwo i skalowalność całego rozwiązania” – opowiada Robert Kietliński. Azure wykorzystywane jest także do uruchamiania wewnętrznego systemu e-learningowego. Gdy nie jest on wykorzystywany, zasoby w chmurze są oczywiście zwalniane, a Ministerstwo Finansów nie musi za nie płacić.

Pierwszym projektem w chmurze – opartym na usługach Amazon Web Services – był system, z którego korzystali użytkownicy tzw. loterii paragonowej. Dzięki udostępnionemu serwisowi przekazywali oni zgłoszenia do niej, w tym dane osobowe na swój temat. Co ciekawe dane te nie były szyfrowane w żaden sposób i – wg przedstawicieli resortu finansów – nie łamało to obecnej ustawy o ochronie danych osobowych czy regulacji związanych z przetwarzaniem tego typu informacji.

„Oczywiście – podobnie, jak w przypadku Microsoft Azure – serwery, na których przetwarzane były te dane znajdowały się na terenie Unii Europejskiej” – przekonują przedstawiciele resortu finansów.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *