Przejdź do treści Wyszukiwarka

Każdego dnia podejmujemy wiele decyzji, czy to w życiu osobistym, czy też podczas pracy w przedsiębiorstwach i instytucjach. Często skutki danej decyzji są nieoczywiste. Co więcej, są one rozciągnięte w czasie, a tym samym wzajemnie na siebie oddziałują, wzmacniają się, osłabiają lub korygują. Aby postępować racjonalnie, czy też inteligentnie, musimy analizować sekwencje decyzji. 

Wierzymy, że rozwój technik pozwalających na skuteczne analizowanie i podejmowanie sekwencji decyzji pozwoli tworzyć inteligentne i autonomiczne systemy. Przełoży się to na wiele praktycznych rozwiązań, począwszy od sterowania robotami czy samochodami autonomicznymi, a kończąc na wielokrokowych procedurach decyzyjnych lub dedukcyjnych, takich jak dowody matematyczne. 

Temat ten jest fascynujący z naukowego punktu widzenia, gdyż leży na przecięciu wielu dziedzin uczenia maszynowego. Aby badać go we właściwy sposób, potrzebujemy rozwinąć techniki planowania, metody uczenia ze wzmocnieniem, a także umiejętnie korzystać z dobrodziejstw uczenia głębokiego i nowoczesnych modeli językowych. Liczymy na to, że z czasem postęp w zakresie tych technik i ich umiejętne zastosowanie doprowadzą do powstania rozwiązań o dużym stopniu uniwersalności, które będzie można „ściągnąć z półki” i zaaplikować do szerokiej gamy problemów. 

Czy androidy mogą mieć zdrowy rozsądek?

Philip K. Dick pyta w tytule swej kultowej książki „czy androidy śnią o elektrycznych owcach?”. Chcemy na początek zadać prostsze pytanie: czy androidy mogą mieć zdrowy rozsądek? Zbudowanie sztucznego ekwiwalentu zdrowego rozsądku może mieć fundamentalny wpływ na paradygmat, w ramach którego budujemy systemy automatyczne. 

Automatyzacja i autonomia są jednym z głównych motorów postępu gospodarczo-technologicznego. Jednak w wielu przypadkach automatyzacja jest płytka, np. roboty na taśmach przemysłowych operują w ściśle zdefiniowanym i kontrolowanym środowisku, w przeciwieństwie do chaotycznego środowiska świata codziennego (np. drony poruszające się w przestrzeni miejskiej). Jak możemy to zmienić? Potrzebujemy fundamentalnej redefinicji metod sterowania. Nie mogą być one oparte o ręcznie napisane skrypty, jak to się dzieje na taśmach produkcyjnych, natomiast muszą elastycznie reagować na zmiany słabo zdefiniowane (lub trudne do ręcznego skalowania).

W ramach prac mojego zespołu rozwijamy metody i modele, które mają cechy funkcjonalnego ekwiwalentu zdrowego rozsądku. Ich istotnymi cechami jest generalizacja zero-shot i możliwość adaptacji bez zapominania. Generalizacja zero-shot to możliwość operowania w sytuacjach nietestowanych podczas treningu, co można uznać za sztuczny odpowiednik zdrowego rozsądku. Jednym z najważniejszych osiągnięć informatyki ostatnich lat jest to, że generalizację taką można uzyskać poprzez umiejętne skalowanie modeli i ilości danych. Adaptacja bez zapominania obejmuje, zgodnie z utartą terminologią uczenia ciągłego (continual learning), możliwość nabywania nowych umiejętności w szybki sposób (tj. transfer wiedzy z poprzednich zadań) i braku zapominania (wiele umiejętności modelu będzie wykorzystywanych sporadycznie). 

Lider zespołu badawczego


Piotr Miłoś

Piotr Miłoś – matematyk i informatyk, profesor nadzwyczajny Polskiej Akademii Nauk oraz członek ELLIS Society. Jest liderem zespołu badawczego w IDEAS NCBR, badaczem w Instytucie Matematycznym Polskiej Akademii Nauk. Zdobywał doświadczenie prowadząc badania na Wydziale Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego oraz na Uniwersytecie w Bath i w Genewie. Jest absolwentem Wydziału Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego.
Jego zainteresowania naukowe obejmują tworzenie inteligentnych algorytmów, które będą wspomagały podejmowanie decyzji w scenariuszach złożonych z wielu kroków. Jest to interdyscyplinarny obszar, który łączy wiele dziedzin uczenia maszynowego, takich jak: planowanie i uczenie się, uczenie wielozadaniowe i ciągłe, modelowanie sekwencyjne przy użyciu transformerów a także uczenie ze wzmocnieniem.

nagroda naukowa Rektora UW, 2017

– Narodowe Centrum Nauki, grant Preludium.bis 2020-2024, projekt: Uczenie ze wzmocnieniem raz jeszcze

– Narodowe Centrum Nauki, grant Sonata.bis 2018-2023, projekt: Uczenie ze wzmocnieniem, współczesne wyzwania

– Narodowe Centrum Nauki, grant Opus 2015-2019, projekt: Analiza układów stochastycznych z geometrią

Inne grupy i zespoły badawcze

  • Algorytmy w autonomicznych UAV Bezzałogowe statki powietrzne (ang. unmanned aerial vehicles – UAVs), znane również jako drony są coraz częściej wykorzystywane w różnych dziedzinach gospodarki.
    Przemysław Kornatowski
  • Leśnictwo precyzyjne Zastosowanie danych teledetekcyjnych w pozyskiwaniu informacji o lasach ma swoją długą, już około 100-letnią, historię.
    Krzysztof Stereńczak
  • AI dla bezpieczeństwa Opracowujemy wielopoziomowe systemy zarządzania ochroną infrastruktury krytycznej, jak i te służące do zabezpieczenia kluczowych usług państwa wobec zagrożeń kinetycznych i cybernetycznych.
    Tomasz Michalak