Iti0210w13

Allikas: Lambda

13. Nädal

Hüvitisega õppimine ehk stiimulõpe. Q-Learning. [AIMA] 21.3.2, [ARTINT] 12.4.

Mõned sissejuhatavad artiklid: [1],[2]

Q-Learning/SARSA

Reinforcement Learning: Example and Tutorial

loengu salvestus