Projekty finansowane przez NCN


Dane kierownika projektu i jednostki realizującej

Szczegółowe informacje o projekcie i konkursie

Słowa kluczowe

Aparatura

Wyczyść formularz

Uczenie ze wzmocnieniem raz jeszcze

2019/35/O/ST6/03464

Słowa kluczowe:

uczenie maszynowe uczenie ze wzmocnieniem sztuczna inteligencja

Deskryptory:

  • ST6_7: Sztuczna inteligencja, systemy inteligentne i wieloagentowe

Panel:

ST6 - Informatyka i technologie informacyjne: technologie i systemy informacyjne, informatyka, obliczenia naukowe, systemy inteligentne

Jednostka realizująca:

Instytut Matematyczny Polskiej Akademii Nauk

woj.

Inne projekty tej jednostki 

Kierownik projektu (z jednostki realizującej):

dr hab. Piotr Rafał Miłoś 

Liczba wykonawców projektu: 2

Konkurs: PRELUDIUM BIS 1 - ogłoszony 2019-09-16

Przyznana kwota: 532 800 PLN

Rozpoczęcie projektu: 2020-10-01

Zakończenie projektu: 2025-09-30

Planowany czas trwania projektu: 60 miesięcy (z wniosku)

Status projektu: Projekt w realizacji

Opis Projektu

Pobierz opis projektu w formacie .pdf

Uwaga - opisy projektów zostały sporządzone przez samych autorów wniosków i w niezmienionej formie umieszczone w systemie.

Dane z raportu końcowego/rocznego

  • Teksty w publikacjach pokonferencyjnych (7)
  1. Fast and Precise: Adjusting Planning Horizon with Adaptive Subgoal Search
    Autorzy:
    Michał Zawalski, Michał Tyrolski, Konrad Czechowski, Tomasz Odrzygóźdź, Damian Stachura, Piotr Piękos, Yuhuai Wu, Łukasz Kuciński, Piotr Miłoś
    Konferencja:
    ICLR 2023 (rok: 2023, tom: ICLR 2023, strony: n/a), Wydawca: n/a
    Data:
    konferencja 1-5.05.2023
    Status:
    Opublikowana
    Doi:
    10.48550/arXiv.2206.00702 - link do publikacji
  2. Off-Policy Correction For Multi-Agent Reinforcement Learning
    Autorzy:
    Michał Zawalski, Błażej Osiński, Henryk Michalewski, Piotr Miłoś
    Konferencja:
    AAMAS '22: Proceedings of the 21st International Conference on Autonomous Agents and Multiagent Systems (rok: 2022, tom: AAMAS 2022, strony: 45660), Wydawca: International Foundation for Autonomous Agents and Multiagent Systems
    Data:
    konferencja 9-13.05.2022
    Status:
    Przyjęta do publikacji
  3. Robotic Control via Embodied Chain-of-Thought Reasoning
    Autorzy:
    Michał Zawalski, William Chen, Karl Pertsch, Oier Mees, Chelsea Finn, Sergey Levine
    Konferencja:
    Proceedings of Machine Learning Research, vol. 270 (rok: 2024, tom: Conference on Robotic Learning, strony: 3157-3181), Wydawca: n/d
    Data:
    konferencja 6-9.11.2024.
    Status:
    Opublikowana
    Doi:
    10.48550/arXiv.2407.08693 - link do publikacji
  4. Off-Policy Correction For Multi-Agent Reinforcement Learning
    Autorzy:
    Michał Zawalski, Błażej Osiński, Henryk Michalewski, Piotr Miłoś
    Konferencja:
    AAMAS '22: Proceedings of the 21st International Conference on Autonomous Agents and Multiagent Systems (rok: 2022, tom: AAMAS 2022, strony: 45660), Wydawca: International Foundation for Autonomous Agents and Multiagent Systems
    Data:
    konferencja 9-13.05.2022
    Status:
    Przyjęta do publikacji
  5. Fast and Precise: Adjusting Planning Horizon with Adaptive Subgoal Search
    Autorzy:
    Michał Zawalski, Michał Tyrolski, Konrad Czechowski, Tomasz Odrzygóźdź, Damian Stachura, Piotr Piękos, Yuhuai Wu, Łukasz Kuciński, Piotr Miłoś
    Konferencja:
    ICLR 2023 (rok: 2023, tom: ICLR 2023, strony: n/a), Wydawca: n/a
    Data:
    konferencja 1-5.05.2023
    Status:
    Opublikowana
    Doi:
    10.48550/arXiv.2206.00702 - link do publikacji
  6. Off-Policy Correction For Multi-Agent Reinforcement Learning
    Autorzy:
    Michał Zawalski, Błażej Osiński, Henryk Michalewski, Piotr Miłoś
    Konferencja:
    n/d (rok: 2022, tom: AAMAS 2022, strony: 45660), Wydawca: International Foundation for Autonomous Agents and Multiagent Systems
    Data:
    konferencja 9-13.05.2022
    Status:
    Przyjęta do publikacji
  7. Off-Policy Correction For Multi-Agent Reinforcement Learning
    Autorzy:
    Michał Zawalski, Błażej Osiński, Henryk Michalewski, Piotr Miłoś
    Konferencja:
    AAMAS '22: Proceedings of the 21st International Conference on Autonomous Agents and Multiagent Systems (rok: 2022, tom: AAMAS 2022, strony: 45660), Wydawca: International Foundation for Autonomous Agents and Multiagent Systems
    Data:
    konferencja 9-13.05.2022
    Status:
    Przyjęta do publikacji