研究揭示奖赏学习并非由单一强化学习机制主导

来源:《自然-人类行为》

研究表明,人类在奖赏驱动决策任务中的行为,主要可由工作记忆(WM)与习惯(H)两大机制共同解释,而非传统认为的强化学习(RL)主导。研究者通过重新分析七组实验数据发现,当工作记忆负荷较重时,习惯会驱动重复行为,二者协同作用可有效完成学习。该成果挑战了现有RL模型对心理与神经机制的普遍假设,为理解学习行为的底层机制提供了新视角。