ページ

2010-06-03

状態対報酬: モデルベースとモデルフリーの強化学習に基づく分離された神経予測誤差信号

States versus Rewards: Dissociable Neural Prediction Error Signals Underlying Model-Based and Model-Free Reinforcement Learning.
Neuron. 2010 May 27;66(4):585-595
Authors: Gläscher J, Daw N, Dayan P, O'Doherty JP

モデルベースとモデルフリーな強化学習を比較。いまいち違いがピンとこない。状態的予測誤差にはLPFCとvSTRが関与してる模様。よくわからず。

0 件のコメント:

コメントを投稿