首页 > 业界 > 关键词  > AI最新资讯  > 正文

复旦、人大等发布大五人格+MBTI测试 角色扮演AI特质还原率达82.8%

2023-11-20 11:46 · 稿源:站长之家

要点:

  • 复旦大学和中国人民大学联合Chat凉宫春日团队发布的研究强调,评价AI角色扮演的关键在于良好的人设还原度,其特质还原率达到82.8%。

  • 使用大五人格的NEO-FFI问卷和MBTI的16Personalities测试,研究人员通过LLM进行引导式开放式问答,对AI角色进行全面的人格测试,从心理学的角度研究角色扮演AI的行为模式。

  • 研究者提出了一套面谈式人格测试框架,利用开放式问答,通过LLM预测角色扮演AI的人格特质,实验结果显示在大五人格和MBTI测试上达到了82.8%的还原率。

站长之家(ChinaZ.com)11月20日 消息:近期,由复旦大学和中国人民大学合作的Chat凉宫春日团队发布了一项关于AI角色扮演的研究。该研究强调了良好的人设还原度对于评价AI角色扮演的重要性,特质还原率高达82.8%。研究使用了大五人格的NEO-FFI问卷和MBTI的16Personalities测试,并通过LLM进行引导式开放式问答,全面测试了AI角色的人格。这一面谈式人格测试框架的提出,为评估角色扮演AI的人格特质提供了新的方法。

image.png

项目地址:https://github.com/LC1332/Chat-Haruhi-Suzumiya/tree/main/research/personality

随着大语言模型的发展,基于这些模型的角色扮演聊天机器人在全球范围内引起了广泛关注。相较于传统聊天机器人的繁琐工程,现今的大语言模型能够轻松构建具备不同身份、人格、记忆和语言习惯的角色扮演AI。然而,对于角色扮演AI的分析性研究仍然相当匮乏,尤其是在对它们的评估上。这项研究通过使用心理学的人格相关理论,从大五人格和MBTI等维度对角色扮演AI进行了人格测试,为这一领域的研究提供了新的视角。

研究者提出的面谈式人格测试框架通过开放式问答,使得角色扮演AI的评估更为全面。与传统的Likert Scale相比,这种框架能够更好地激发角色扮演AI的扮演行为,减少对底座LLM训练数据的影响。实验结果显示,现有的角色扮演AI在大五人格和MBTI测试上的还原率达到了82.8%。

研究者指出,这些结果仍受到底座LLM的先验影响,表现为在某些维度上的平均得分与底座模型较为一致。为了研究这一点,研究者比较了不同底座模型对角色扮演AI的影响,发现在某些维度上存在一致性,但在其他维度上并没有明显的相关关系。

综合而言,这项研究为评估AI角色扮演的人格特质提供了新的方法和视角,同时也揭示了在现有技术中存在的一些挑战和限制。未来,随着技术的不断发展,角色扮演AI的人格还原度和表现可能会得到进一步提升。

举报

  • 相关推荐
  • AI不再健忘!红熊AI发布“记忆熊”,给大模型装上“海马体”

    当前大模型虽能力惊人,却普遍存在“记忆缺失”问题,制约了AI应用的深度与用户体验。红熊AI推出的开源记忆系统“记忆熊”,旨在突破这一瓶颈。它基于认知科学原理,构建了包含存储层、编排层和应用层的三层架构,模拟人类记忆的感知、提炼、关联与遗忘全周期,为智能体提供长期记忆框架。该系统不仅显著提升了任务性能与效率,降低了幻觉生成,更标志着AI设计从“即时响应”向“持续认知”的关键转变。记忆系统的完善,将驱动AI在医疗、教育、企业服务等领域实现更深度的智能化升级,开启人机协作的新时代。

  • 亿道信息以“AI+终端”与“AI+应用”双轮驱动,开启智能普惠新纪元

    12月3日,亿道信息在深圳举办年度“亿道科技日”,以“Edge+AI,端云协同”为核心,展示公司从产品提供商向场景计算体系构建者的战略转型。活动发布了覆盖个人、家庭、企业、工业、穿戴等核心场景的AI终端矩阵与一体化应用方案,致力于将AI转化为千行百业触手可及的生产力引擎。重点产品包括旗舰AI+PC(算力达180TOPS,预装“小亿AI助手”)、高性能AI+BOX(集成126TOPS算力与96GB显存)及全系列AI服务器矩阵。同时,公司推出“亿道超算AI智能引擎”以降低企业AI部署门槛,并展示AESOF跨平台开放框架,构建开放生态,与英特尔、高通等产业链伙伴深化合作,推动智能技术普惠化。

  • 别把AI做成“拿着锤子找钉子”!人民日报专访刘庆峰道出AI落地的终极真相

    《人民日报》专访科大讯飞董事长刘庆峰,探讨AI发展路径。文章指出,AI发展应避免“技术自嗨”,需从社会刚需出发,通过“做减法”和“问初心”实现价值落地。科大讯飞以智慧医疗为例,聚焦核心赛道,通过软硬协同、云端融合,让AI真正赋能基层。这种务实态度,为中国AI发展提供了“长期主义”的清醒样本。

  • 汉鑫科技与IBM落地“AI深耕计划”,赋能中国企业“AI+出海”

    山东汉鑫科技与IBM在烟台合作落地“AI深耕计划”,旨在为中国企业智能化转型和全球化运营提供安全、灵活、定制化的企业级技术方案和咨询服务。双方在四个月内完成从可行性评估到客户项目落地的全过程,并在2025年山东省绿色低碳高质量发展大会期间举行签约仪式。此前,双方已共同发布“HiMax+制造业AI+企业资产管理解决方案”,结合IBM Maximo平台和人工智能技术,以及汉鑫的行业经验,实现设备全生命周期管理、产品质量智能检测等复杂场景中的实时预警和预测性维护。未来,双方将聚焦企业智能化转型的全价值链打通,以“AI赋能+场景落地”的框架共创解决方案,助力烟台打造智能经济产业新生态,加速实现从“数字经济”到“智能经济”的跃迁。

  • 什么是AI员工?雇佣AI员工后就可以替代人工吗?企业如何发挥AI员工的真正价值?

    本文探讨了AI员工如何从热门概念转变为驱动企业业务增长的核心引擎。文章指出,AI员工并非简单的聊天机器人,而是基于大模型技术、能理解任务并自主执行的智能体,其核心价值在于赋能人类员工、解放管理者精力。AI员工适合处理重复性高、操作繁琐的低价值工作,如客户服务、销售助理和售后支持等,从而让人类员工专注于更具创造性和战略性的任务。企业正确运用AI员工,不仅能提升效率和客户体验,还能构建更强大、高效的人机协同组织,激发增长潜力。

  • 李楠:豆包手机是今年技术最激进的AI设备

    怒喵科技创始人李楠发文表示,豆包手机是今年技术上最激进的AI设备。 自从豆包手机上架以来,市场给予了近乎狂热的反馈,该机定价是3499元,一经上市便被抢购一空,二手平台炒至8000元以上,这款AI设备由字节跳动旗下的豆包团队和努比亚联合打造。 你只需发出语音指令,豆包手机上的AI助手就能自动在屏幕上点击、滑动,跨越App的边界,完成点外卖、比价等一系列操�

  • 想让AI成为新引擎,快手不能只靠可灵

    从12月1日开始,快手开启了「可灵全能灵感周」,要连续5天,每天都发布一项新产品。目前,快手已经发布了统一多模态视频大模型可灵视频O1和全能图像模型可灵图片O1,展现了要一站式满足AI视频、图像创作需求的野心。 这种密集的发布,也是快手在向外界进一步展示自身的AI技术积累。而保持AI技术的领先是快手新故事的重要组成部分。从财报来看,快手已经把AI视作为�

  • 携手共创AI新时代,安谋科技“AI Arm CHINA”战略驱动半导体生态重构

    2025年12月2日,SIIAS香港首届国际半导体峰会召开。安谋科技CEO陈锋发表主旨演讲,指出AI正从辅助工具演变为重塑行业生态的核心动力,推动半导体等产业系统性重构。公司确立“AI Arm CHINA”战略,旨在连接全球Arm生态与本土创新,并积极布局香港,构建产学研协同体系,以赋能中国AI产业发展。峰会展现了全球产业协作与生态融合的趋势,强调唯有携手共进,方能共赢智能未来。

  • 广告收入激增,B站尝到了AI的甜头?

    ​B站终于在商业化的长跑中尝到了甜头。 2025年Q3财报显示,B站总营收为76.9亿元人民币,同比增长5%;调整后净利润为7.9亿元,同比大幅增长233%,单季盈利创新高。 其中,广告业务实现23%的同比激增。但这,也将B站“社区初心与商业变现”的老难题推至新的风口浪尖。

  • “AI 教父”Hinton与云天励飞陈宁在AI十字路口的握手—从“能力恐慌”到“普惠共识”

    在2025GIS全球创新峰会上,杰弗里·辛顿与陈宁的对话超越了东西方AI理念的表面对立,勾勒出技术文明的新共识。双方在“AI向善”与“AI普惠”两个根本命题上达成深度共识:辛顿提出“更强AI”与“更安全AI”必须同步推进,标志着西方AI伦理讨论从哲学思辨转向工程实现;陈宁则为“向善”注入普惠维度,强调技术可及性是实现“善”的前提,提出“百倍降本”目标构建普惠的经济学基础。两人共同将“AI向善”从软性伦理倡导,塑造成包含安全机制与普惠能力的双重硬性标准。辛顿承认中国在AI治理上更具预防性优势,陈宁则倡议建立全球统一AI推理芯片标准,展现中国产业界正从技术应用者向全球规则贡献者迈进。这场对话揭示:未来全球AI治理可能需要融合西方的风险预警传统与中国的协同推进经验,伦理与工程必须融合,风险防控与普惠推广必须同步。当东西方顶尖智慧在根本目标上达成一致,人类或许真的找到了一条既能拥抱智能爆炸潜力,又能稳健穿越伦理迷雾的务实路径。

今日大家都在搜的词: