每周论坛之七(总第279期):刘彦平(中山大学),2021年11月1日下午

每周论坛之七(总第279期)

报告人:刘彦平 副教授

报告人单位:中山大学

题目:互动模式对探索-利用困境的影响

时间:2021111(周一,14:20-16:00

地点:中山大学东校园心理学系(南学院楼C座)305

报告简介:

当人或动物在环境中搜索有价值事物时,要么利用以往经验选择当前能带来最大奖励的选项,要么为找到更大奖励而探索新选项。这种两难决策即为探索-利用困境(exploration-exploitation dilemma)。以往研究主要集中于单人搜索环境。例如,Wu 等人(2018)使用空间关联的多臂老虎机范式(spatially correlated multi-armed bandit paradigm),研究了单人搜索时的学习概括和探索-利用困境,发现局部化的函数学习模型(localized function learning model)和置信上界抽样模型(upper confidence bound sampling model)能用于描述人类在二维空间中的学习概括和决策过程。但是现有结果还不能推广到群体环境。对于群体而言,同样也会存在探索-利用困境,并且群体的互动过程还受奖励分配方式的影响, 进而形成合作或竞争关系。本研究即利用空间关联的多臂老虎机范式,通过不同奖励分配方式探讨互动模式在双人搜索行为中对学习概括和探索-利用困境的影响,并建构计算模型用于评估相关的学习概括和探索-利用决策。

报告人简介:

刘彦平副教授,主要通过研究高级认知功能来破解大脑奥秘,包括阅读等语言问题、强化学习等决策问题。研究方法主要包括眼动等行为技术,脑电等神经手段,及计算建模和人工智能方式。其它信息敬请浏览个人主页(http://psy.sysu.edu.cn/teacher/296)。