Przejdź do treści Wyszukiwarka

Prywatność w uczeniu maszynowym

Szereg zastosowań uczenia maszynowego obejmuje zagadnienia, w których prywatność ma szczególne znaczenie. Dotyczy to zarówno przypadków, w których tajemnica dotyczy danych treningowych, na których uczony jest algorytm (np. gdy dane te zawierają informacje medyczne), jak i takich, w których sam algorytm podlega ochronie, gdyż np. jego znajomość ujawnia pewne informacje na temat danych treningowych. Rozwój metod ochrony prywatności jest punktem centralnym prowadzonych badań. 

Badamy rozwiązania oparte o technologię obliczeń wielopodmiotowych (multiparty computation protocols). Technologia ta pozwala na wykonywanie obliczeń na rozproszonych danych w taki sposób, żeby dane te nie zostały ujawnione osobom postronnym. Pokrewną metodą, którą również badamy w tym kontekście, jest tzw. szyfrowanie homomorficzne (homomorphic encryption), które dodatkowo minimalizuje konieczność interakcji między stronami wykonującymi algorytm. Ponadto, badania prowadzone w IDEAS NCBR dotyczą możliwych zastosowań tzw. zaufanych środowisk wykonawczych (trusted execution environment) do zwiększenia prywatności wykonywanych obliczeń. 

Osobnym zagadnieniem jest zapewnienie, że wynik obliczeń nie zdradza prywatnych informacji na temat danych wejściowych. Technologią wykorzystywaną przez nas w tym kontekście jest tzw. prywatność różnicowa (differential privacy). Metoda oparta jest na odpowiednim dodawaniu losowego szumu do wyniku obliczeń, tak żeby nie można było zeń wydedukować informacji na temat poszczególnych elementów danych wejściowych.

Wymienione wyżej technologie rozwijane są w informatyce teoretycznej od wielu lat. Wartość dodana naszych badań wynika ze współpracy z innymi zespołami naukowymi IDEAS NCBR, które zajmują się uczeniem maszynowym. Interakcje te pozwalają na dostosowanie rozwiązań do konkretnych problemów występujących w tej dziedzinie badań.

Uczenie maszynowe w analizie bezpieczeństwa

Jednym z głównych problemów związanych z wielopodmiotowymi protokołami kryptograficznymi jest to, że zdecentralizowane rozwiązania są zazwyczaj bardziej złożone i podatne na błędy niż rozwiązania scentralizowane, a błędy w takich protokołach mogą prowadzić do znacznych strat finansowych. W IDEAS NCBR zajmujemy się rozwiązywaniem tych problemów za pomocą narzędzi pochodzących z metod formalnych. W szczególności, pracujemy nad użyciem metod uczenia maszynowego do dowodzenia poprawności protokołów kryptograficznych. Jest to obiecujące podejście, ponieważ w wielu przypadkach analiza ta zawiera powtarzalne elementy, które potencjalnie dają się zautomatyzować. Wyzwaniem natomiast jest znalezienie odpowiednich danych treningowych. 

Bezpieczniejszy blockchain

Technologia blockchain została wprowadzona w 2008 r. Pod tą nazwą rozumie się zwykle protokoły kryptograficzne służące do osiągania konsensusu na dużą skalę w sieciach rozproszonych. Protokoły te mogą pracować w tak zwanym wariancie permissionless, w którym zbiór uczestników nie jest określony a priori, lub w wariancie permissioned, w którym konsensus jest utrzymywany przez wstępnie zdefiniowane grupy serwerów.

Początkowe zastosowania tej technologii dotyczyły sektora finansowego, służyły głównie do tworzenia nowych wirtualnych kryptowalut (takich jak bitcoin). Jednak obecnie uważa się, że technologia ta ma o wiele więcej zastosowań, w szczególności w systemach zarządzania tożsamością cyfrową, w zarządzaniu kredytami hipotecznymi, systemach rejestracji własności gruntów, monitorowaniu łańcuchów dostaw, ubezpieczeniach, badaniach klinicznych, w zarządzaniu prawami autorskimi, prowadzeniu zdecentralizowanych organizacji, w zarządzaniu obrotem energii czy w Internecie rzeczy (IoT). W IDEAS NCBR zajmujemy się badaniem praktycznych aspektów tej technologii, takich jak bezpieczeństwo tzw. portfeli kryptowalutowych, protokoły konsensusu czy inteligentne kontrakty.

Lider grupy badawczej


Stefan Dziembowski

Stefan Dziembowski jest profesorem na Wydziale Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego. Jego zainteresowania naukowe dotyczą teoretycznej i stosowanej kryptografii, w szczególności zagadnień związanych z atakami fizycznymi na urządzenia kryptograficzne oraz z technologią blockchain.

Dziembowski otrzymał tytuł magistra informatyki w 1996 r. na Uniwersytecie Warszawskim, doktorat z informatyki w 2001 r. na Uniwersytecie w Aarhus (Dania) i habilitację z nauk matematycznych w 2012 r. na Uniwersytecie Warszawskim. Odbył staże post-doktorskie na ETH w Zurychu, w CNR w Pizie i na Uniwersytecie Rzymskim Sapienza, gdzie został adiunktem w 2008 r. W 2010 r. przeniósł się na Uniwersytet Warszawski, gdzie prowadzi Laboratorium Kryptografii i Blockchaina.

Jego prace ukazywały się na wiodących konferencjach informatycznych (FOCS, STOC, CRYPTO, EUROCRYPT, ACM CCS, ASIACRYPT, TCC, IEEE S&P, ACM CCS, LICS, i innych) i w czasopismach (Communications of the ACM, Journal of Cryptology IEEE Transactions on Information Theory, Journal of the ACM, Communications of the ACM). Wielokrotnie był zapraszany do komitetów programowych czołowych konferencji CRYPTO, EUROCRYPT, ACM CCS, ASIACRYPT, TCC, ICALP i innych. Prace jego współautorstwa otrzymały nagrody za najlepsze prace (Best Paper Awards) na konferencjach EUROCRYPT i IEEE S&P (w 2014 r.). W 2015 r. był przewodniczącym komitetu organizacyjnego (general chair) konferencji Theory of Cryptography Conference, a w 2008 r. współprzewodniczącym jej komitetu programowego (PC co-chair). Został wybrany współprzewodniczącym konferencji Eurocrypt 2022.  Wygłosił keynote talk na Conference on Cryptographic Hardware and Embedded Systems (CHES) 2020.

Stefan Dziembowski otrzymał dwa granty Europejskiej Rady ds. Badań Naukowych: ERC Starting Grant (2007) oraz ERC Advanced Grant (2019), dwa granty Fundacji na rzecz Nauki Polskiej: FNP Welcome oraz FNP Team, dwa granty NCN Opus z Narodowego Centrum Nauki, grant Marie-Curie na staż post-doktorski, oraz stypendium Start z Fundacji na rzecz Nauki Polskiej. Jest też laureatem Polsko-Niemieckiej Nagrody Copernicus (w 2020 r., razem z prof. Sebastianem Faustem) oraz Nagrody im. prof. Kazimierza Bartla (2016).  W kadencji 2021-2024 Stefan Dziembowski będzie członkiem Rady Narodowego Centrum Nauki. Wypromował pięciu doktorów.

Inne grupy i zespoły badawcze

  • Sekwencyjne podejmowanie decyzji Wierzymy, że rozwój technik pozwalających na skuteczne analizowanie i podejmowanie sekwencji decyzji pozwoli tworzyć inteligentne i autonomiczne systemy. Przełoży się to na wiele praktycznych rozwiązań.
    Piotr Miłoś
  • Uczenie maszynowe w trybie ciągłym Sztuczne sieci neuronowe są skutecznymi modelami uczenia maszynowego stosowanymi w różnych dziedzinach życia. Spowodowane jest to ich znakomitymi możliwościami automatycznego uczenia się efektywnego sposobu reprezentowania danych, bez znaczącej ingerencji człowieka w ten proces.
    Bartłomiej Twardowski
  • Inteligentne algorytmy i struktury danych Algorytmy, szczególnie te wykorzystywane w uczeniu maszynowym, dają szanse na podejmowanie lepszych decyzji niż ludzkie.
    Piotr Sankowski