首页 > 业界 > 关键词  > AI最新资讯  > 正文

复旦、人大等发布大五人格+MBTI测试 角色扮演AI特质还原率达82.8%

2023-11-20 11:46 · 稿源:站长之家

要点:

  • 复旦大学和中国人民大学联合Chat凉宫春日团队发布的研究强调,评价AI角色扮演的关键在于良好的人设还原度,其特质还原率达到82.8%。

  • 使用大五人格的NEO-FFI问卷和MBTI的16Personalities测试,研究人员通过LLM进行引导式开放式问答,对AI角色进行全面的人格测试,从心理学的角度研究角色扮演AI的行为模式。

  • 研究者提出了一套面谈式人格测试框架,利用开放式问答,通过LLM预测角色扮演AI的人格特质,实验结果显示在大五人格和MBTI测试上达到了82.8%的还原率。

站长之家(ChinaZ.com)11月20日 消息:近期,由复旦大学和中国人民大学合作的Chat凉宫春日团队发布了一项关于AI角色扮演的研究。该研究强调了良好的人设还原度对于评价AI角色扮演的重要性,特质还原率高达82.8%。研究使用了大五人格的NEO-FFI问卷和MBTI的16Personalities测试,并通过LLM进行引导式开放式问答,全面测试了AI角色的人格。这一面谈式人格测试框架的提出,为评估角色扮演AI的人格特质提供了新的方法。

image.png

项目地址:https://github.com/LC1332/Chat-Haruhi-Suzumiya/tree/main/research/personality

随着大语言模型的发展,基于这些模型的角色扮演聊天机器人在全球范围内引起了广泛关注。相较于传统聊天机器人的繁琐工程,现今的大语言模型能够轻松构建具备不同身份、人格、记忆和语言习惯的角色扮演AI。然而,对于角色扮演AI的分析性研究仍然相当匮乏,尤其是在对它们的评估上。这项研究通过使用心理学的人格相关理论,从大五人格和MBTI等维度对角色扮演AI进行了人格测试,为这一领域的研究提供了新的视角。

研究者提出的面谈式人格测试框架通过开放式问答,使得角色扮演AI的评估更为全面。与传统的Likert Scale相比,这种框架能够更好地激发角色扮演AI的扮演行为,减少对底座LLM训练数据的影响。实验结果显示,现有的角色扮演AI在大五人格和MBTI测试上的还原率达到了82.8%。

研究者指出,这些结果仍受到底座LLM的先验影响,表现为在某些维度上的平均得分与底座模型较为一致。为了研究这一点,研究者比较了不同底座模型对角色扮演AI的影响,发现在某些维度上存在一致性,但在其他维度上并没有明显的相关关系。

综合而言,这项研究为评估AI角色扮演的人格特质提供了新的方法和视角,同时也揭示了在现有技术中存在的一些挑战和限制。未来,随着技术的不断发展,角色扮演AI的人格还原度和表现可能会得到进一步提升。

举报

  • 相关推荐
  • 央视网首场AI晚会七夕“AI心动夜”即将开启 联合可灵AI打造视听盛宴

    8月28日晚8点,央视频与快手可灵AI联合打造的七夕晚会“AI心动夜”正式开启。晚会以“AI视频叙事+传统文化”为核心,通过AI技术融合文化传承、艺术创作与情感表达,呈现跨越虚拟与现实、科技与文化交融的七夕盛典。节目包括《星河告白》《千年婚服秀》等,展现不同时代的爱情故事与中华婚服之美,同时通过《与妻书》《许愿吧》等作品探讨革命年代的深情与当代浪漫。晚会将在央视频、快手等平台同步直播,带领观众体验科技与文化的精彩碰撞。

  • 可赞AI深度测评:这款AI办公助手,让我告别加班写报告!

    文章分享了一款名为“可赞AI”的办公工具,能高效处理文档写作、图表制作和会议纪要整理。通过实际测试,作者发现该工具可自动生成结构化摘要、可视化图表,并支持多场景适配,大幅提升办公效率。尤其适合团队协作,减少沟通成本。虽然部分复杂功能仍需优化,但整体完成度高,值得职场人士尝试。

  • 最新AI资讯哪里看?AI技术人员如何从论文到产业应用全覆盖?

    文章指出,ArXiv、ACL和NeurIPS等论文库是AI开发者获取前沿技术的重要来源,但仅依赖论文库已不足以构建完整竞争力。作者强调需要超越论文本身,关注技术落地、产业应用及生态动态。推荐利用AIbase等技术资讯平台作为补充,提供筛选整合、趋势解读和产业视角,帮助开发者高效把握技术动态,避免闭门造车,构建复合型信息摄入体系。

  • 5个月狂揽超800万粉丝,这家AI公司想打造“AI账号工厂”?

    ​AI距离替代真人又近了一步? 最近,“科技大司马”连续多次登上新榜视频号科技互联网月榜TOP5,成为今年上半年涨势最猛的科技类账号之一,仅在视频号就2个月涨粉超166万,数据最好的一条视频全网播放量超5000万。

  • AI学习路线图:用“每天五分钟”系统化构建你的AI入门知识库

    本文介绍了一种高效AI学习方法:通过每日投入5分钟,利用AIbase资讯平台系统学习。建议从建立AI认知框架开始,关注技术、应用、产业三个维度;每日浏览全球AI新闻速递积累术语;主动探索特定领域;定期回顾构建知识图谱。强调持续微学习的重要性,无需熬夜苦读,一年后即可建立系统的AI知识体系。

  • 百度正式发布AI搜索APP“梯子AI”:主打无广告智能搜索!

    百度旗下的AI搜索AppTizzy.ai”已完成了前期的测试,并正式更名为梯子AI”上架。 这款应用最初于8月10日发布,当时名称为Tizzy.ai”,更新后版本号从1.0.0直接跳至1.2.0。 据介绍,梯子AI定位为智能搜索助手,依托百度多个大模型能力开发而成,主打无广告智能搜索,整合深度思考、资源检索及影视娱乐功能,致力于为用户提供简单搜索,一触即达”的极致体验。

  • 狂奔一年,AI玩具们找到了自己的路

    一年前,AI玩具还被怀疑是概念炒作,需要量产数据去证明这个需求真实存在。经过一年发展,这个市场快速膨胀变大,出现了更多样的产品路径、更大额度的融资和更多愿意为之买单的消费者。 「一年前产品刚推出的时候,我们特别忐忑。」跃然创新CEO李勇告诉我们,当时没有成熟的案例作为参照,不知道能不能卖好,团队只是凭直觉认为,将大模型对话能力和毛绒玩具结�

  • B站要变成AI站

    互联网平台都在跟AI结合,B站没有成为例外。从新一季度财报来看,B站的AI味儿也越来越浓了。 8月21日,B站公布第二季度业绩,总营收达73.4亿元人民币,同比增长20%。其中,游戏业务收入为16.1亿元,同比增长60%,广告业务收入为24.5亿元,同比增长20%。由此推动B站毛利率从去年同期的29.9%提升至36.5%,调整后净利润达到5.6亿元,创下历史最好成绩。 从整体来看,B站生态集聚

  • 省心还是添乱?AI旅游助手在争议中前进

    AI对在线旅游行业的改造,正在提速。 今年上半年,各大平台争相推出面向用户的各类AI旅游助手,刮起了一阵AI旋风: 马蜂窝在2025世界人工智能大会上带来了AI旅游助手APP,计划将其打造成目的地“专属管家”,不久前还上线了个性化攻略定制产品“AI路书”; 途牛在4月推出“AI助手小牛”,随后陆续更新多项功能; 飞猪则推出“飞猪AI问一问”,并第一时间接入DeepSeek-R1大模

  • AI火花集|AI火花先锋添新力,拆解保险、客服、物联网AI落地实战

    AI正加速渗透产业,2025年全球AI投资预计达2000亿美元,年增长近翻倍。保险、电商客服、智能家居成为落地先锋。暖哇科技、云起未来、蜂助手分别聚焦保险理赔自动化、电商智能客服、5G+AI物联网,通过实战方案推动AI从概念验证走向规模化应用。面临数据价值陷阱、流通壁垒等挑战,企业需构建专业知识库并优化人机协同。未来AI将深入产业毛细血管,汇聚零散创新火花,�

今日大家都在搜的词: