Aktuálne problémy reinforcement learningu

Reinforcement learning (učenie odmenou a trestom) - čo to je a ako to ako funguje, vrátane ukážok. Hlavné body prednášky budú:
• Kľúčové úspechy v úlohach : Atari, GO, Hide and seek a ukážky vzniku deep reinforcement learning a AlphaGO.
• Problém explorácie : riedke odmeny, ako napr. v úlohách : Montezuma's revenge, Hide and seek. Ako "efektívne" preskúmavame stavový priestor.
• Omyly a pochybné publikácie – zhrnutie pokusov a omylov, ako informácia pre tých, ktorí sa budú tejto oblasti venovať, aby sa im vyhli.
• Záver – ukážeme, čo sa v súčasnosti rieši, odkazy na knihy a overené materiály

Dátum konania: 
10.5.2022 o 17:00
Prednášajúci: 
Ing. Michal Chovanec, PhD
Inštitúcia: 
Tachyum