States versus Rewards: Dissociable Neural Prediction Error Signals Underlying Model-Based and Model-Free Reinforcement Learning.
Neuron. 2010 May 27;66(4):585-595
Authors: Gläscher J, Daw N, Dayan P, O'Doherty JP
モデルベースとモデルフリーな強化学習を比較。いまいち違いがピンとこない。状態的予測誤差にはLPFCとvSTRが関与してる模様。よくわからず。
0 件のコメント:
コメントを投稿