多巴胺神经元对奖励概率和不确定性的离散编码(2003)

2020-08-02 02:30:30

不确定性是衡量信息和评估预测准确性的关键。它由概率P决定,在P=0.5时最大,在概率较高和较低时减小。使用不同的刺激来表示奖励的概率,我们发现多巴胺神经元的相位激活在整个概率范围内单调变化,支持了过去的说法,即这种反应编码了预测的和实际的奖励之间的差异。相比之下,以前没有观察到的反应与不确定性是一致的,包括活动逐渐增加,直到潜在的奖励时间。不确定性的编码表明多巴胺信号可能在基于注意力的学习和冒险行为中发挥作用。