Projekty finansowane przez NCN


Dane kierownika projektu i jednostki realizującej

Szczegółowe informacje o projekcie i konkursie

Słowa kluczowe

Aparatura

Wyczyść formularz

Uczenie maszynowe ze wzmocnieniem - współczesne wyzwania

2017/26/E/ST6/00622

Słowa kluczowe:

uczenie maszynowe uczenie ze wzmocnieniem sztuczna inteligencja

Deskryptory:

  • ST6_7: Sztuczna inteligencja, systemy inteligentne i wieloagentowe

Panel:

ST6 - Informatyka i technologie informacyjne: technologie i systemy informacyjne, informatyka, obliczenia naukowe, systemy inteligentne

Jednostka realizująca:

Uniwersytet Warszawski, Wydział Matematyki, Informatyki i Mechaniki

woj. mazowieckie

Inne projekty tej jednostki 

Kierownik projektu (z jednostki realizującej):

dr Piotr Miłoś 

Liczba wykonawców projektu: 5

Konkurs: SONATA BIS 7 - ogłoszony 2017-06-14

Przyznana kwota: 1 746 300 PLN

Rozpoczęcie projektu: 2018-04-20

Zakończenie projektu: 2023-04-19

Planowany czas trwania projektu: 60 miesięcy (z wniosku)

Status projektu: Projekt rozliczony

Opis Projektu

Pobierz opis projektu w formacie .pdf

Uwaga - opisy projektów zostały sporządzone przez samych autorów wniosków i w niezmienionej formie umieszczone w systemie.

Zakupiona aparatura

  1. Laptops. Za kwotę 40 000 PLN
  2. Komputery z GPU. Za kwotę 300 000 PLN

Dane z raportu końcowego/rocznego

  • Teksty w publikacjach pokonferencyjnych (6)
  1. Simulation-based reinforcement learning for real-world autonomous driving
    Autorzy:
    Błażej Osiński, Adam Jakubowski, Paweł Zięcina, Piotr Miłoś, Christopher Galias, Silviu Homoceanu, Henryk Michalewski
    Konferencja:
    International Conference on Robotics and Automation (rok: 2020, ), Wydawca: IEEE
    Data:
    konferencja 43982
    Status:
    Opublikowana
  2. Continual World: A Robotic Benchmark For Continual Reinforcement Learning
    Autorzy:
    Maciej Wołczyk, Michał Zając, Razvan Pascanu, Łukasz Kuciński, Piotr Miłoś
    Konferencja:
    Neural Information Processing Systems (rok: 2021, ), Wydawca: Curran Associates, Inc
    Data:
    konferencja 12,2021
    Status:
    Opublikowana
  3. Model Based Reinforcement Learning for Atari
    Autorzy:
    Łukasz Kaiser, Mohammad Babaeizadeh, Piotr Miłoś, Błażej Osiński, Roy H. Campbell, Konrad Czechowski, Dumitru Erhan, Chelsea Finn, Piotr Kozakowski, Sergey Levine, Afroz Mohiuddin, Ryan Sepassi, George Tucker, Henryk Michalewski
    Konferencja:
    International Conference on Learning Representations (rok: 2020, ), Wydawca: electronic
    Data:
    konferencja 43947
    Status:
    Opublikowana
  4. Catalytic Role Of Noise And Necessity Of Inductive Biases In The Emergence Of Compositional Communication
    Autorzy:
    Łukasz Kuciński, Tomasz Korbak, Paweł Kołodziej, Piotr Miłoś
    Konferencja:
    Neural Information Processing Systems (rok: 2021, ), Wydawca: Curran Associates, Inc
    Data:
    konferencja 12,2021
    Status:
    Opublikowana
  5. Structure and randomness in planning and reinforcement learning
    Autorzy:
    Piotr Januszewski, Konrad Czechowski, Piotr Kozakowski, Łukasz Kuciński, Piotr Miłoś
    Konferencja:
    IJCNN (rok: 2021, ), Wydawca: IEEE
    Data:
    konferencja 7,2021
    Status:
    Opublikowana
  6. Subgoal Search For Complex Reasoning Tasks
    Autorzy:
    Konrad Czechowski, Tomasz Odrzygóźdź, Marek Zbysiński, Michał Zawalski, Krzysztof Olejnik, Yuhuai Wu, Łukasz Kuciński, Piotr Miłoś
    Konferencja:
    Neural Information Processing Systems (rok: 2021, ), Wydawca: Curran Associates, Inc
    Data:
    konferencja 12,2021
    Status:
    Opublikowana