K1_ADVERSARIA: 状態対報酬：　モデルベースとモデルフリーの強化学習に基づく分離された神経予測誤差信号

2010-06-03

状態対報酬：　モデルベースとモデルフリーの強化学習に基づく分離された神経予測誤差信号

States versus Rewards: Dissociable Neural Prediction Error Signals Underlying Model-Based and Model-Free Reinforcement Learning.
Neuron. 2010 May 27;66(4):585-595
Authors: GlÃ¤scher J, Daw N, Dayan P, O'Doherty JP

モデルベースとモデルフリーな強化学習を比較。いまいち違いがピンとこない。状態的予測誤差にはLPFCとvSTRが関与してる模様。よくわからず。

K1_ADVERSARIA

ページ

Category

Archive

2010-06-03

状態対報酬：　モデルベースとモデルフリーの強化学習に基づく分離された神経予測誤差信号

0 件のコメント:

コメントを投稿

K1_ADVERSARIA

ページ

Category

Archive

2010-06-03

状態対報酬： モデルベースとモデルフリーの強化学習に基づく分離された神経予測誤差信号

0 件のコメント:

コメントを投稿

状態対報酬：　モデルベースとモデルフリーの強化学習に基づく分離された神経予測誤差信号