ReCon框架帮助AI大模型识破谎言增加AI智能体的安全性

2023-10-16 14:25 · 稿源：站长之家

要点:
1. ReCon框架通过引入「三思而后行」和「换位思考」的思维过程，提高大语言模型在欺骗性环境中的决策能力，增加AI智能体的安全性与可靠性。
2. 清华大学与通用人工智能研究院的研究团队以阿瓦隆桌游为例，测试了大语言模型在充满欺骗的环境下的局限性，提出ReCon框架来解决这些问题。
3. ReCon框架主要包含两个阶段的思考过程，即「构思思考」和「改进思考」，通过一阶视角转换和二阶视角转换，提高大语言模型识别和应对欺骗的能力。

站长之家（ChinaZ.com）10月16日消息:随着大语言模型的不断进展，AI智能体的发展也变得更加蓬勃。然而，研究者发现在未来无人监管的情况下，防止AI智能体被欺骗和误导是一个被忽视的问题，因为人类社会中存在着大量误导和欺骗性的信息，如果AI智能体不能有效地识别和应对这些信息，可能会导致不可估量的后果。

论文地址:https://arxiv.org/pdf/2310.01320.pdf

为了解决这个问题，一支由清华大学与通用人工智能研究院的研究团队组成的研究团队以阿瓦隆桌游为例，测试了大语言模型在充满欺骗的环境下的局限性，并提出了ReCon框架。

ReCon框架受到人类思考中的「三思而后行」和「换位思考」的启发，通过引入两个主要的构思阶段，即「构思思考」和「改进思考」，并综合了一阶视角转换和二阶视角转换的思考方式，来提高大语言模型对欺骗的识别和应对能力。

该研究发现大语言模型在欺骗性环境中面临三大挑战:恶意信息的误导、私有信息泄露以及内部思考的不透明性。ReCon框架通过重新思考大语言模型在欺骗性环境中的策略，帮助解决了这些挑战。

在ReCon框架中，构思思考阶段旨在生成模型的初始思考和发言内容，而改进思考阶段旨在对这些内容进行更为精细的优化和调整。

通过这一研究，研究团队发现ReCon框架能够在无需微调和额外数据的情况下显著提高大语言模型的识别和应对欺骗的能力。

此外，研究还提出了现有大语言模型在安全、推理、说话方式和格式等方面的不足，并为后续研究指明了可能的方向。这一研究对于提高AI智能体的安全性和可靠性具有重要意义。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
冒泡鸭AI体验入口多模态AI智能体互动平台使用指南

冒泡鸭AI 是基于自研多模态大模型开发的AI互动平台，提供拟人、工具、内容、游戏、娱乐等多个领域的海量智能体。平台具有超长的上下文记忆能力和实时联网搜索能力，能够深度理解用户意图，并提供即时、准确、个性化的回复和选择。用户还可以定制个性化的AI智能体，以满足个性化的需求和偏好。点击前往冒泡鸭AI官网体验入口谁适合使用冒泡鸭AI？冒泡鸭AI适用于寻求�

冒泡鸭AI
微软紧急撤回最先进的AI大模型：居然忘了测试了

Meta发布超级彪悍的大语言模型Llama3之后，微软也很快推出了自己的新一代WizardLM28x22B，号称迄今最强大，完全超越Claude3OpusSonnet、GPT-4等竞品开源，但是马上又把它撤回去了。没有任何征兆，微软就删除了WizardLM2大模型的相关文件、代码一直没有任何公开解释。大模型幻觉产生的原因有很多，训练数据、预训练和对齐阶段、推理阶段都会出现缺陷。

大语言模型 WizardLM2 微软
荐AI大模型搜索之战开启，胜出黑马竟是ta？

【新智元导读】距离AI「杀死」搜索引擎，到底还差几步?几天前，ChatGPT突然官宣免注册，让网友直呼AI取代搜索引擎的宏伟蓝图已经拉开帷幕。就像搜索引擎在2000年后逐渐成为了全世界互联网的大门一样，如今LLM的迅猛发展似乎也标志着互联网即将进入GenAI时代。我们搜索时会出现的，不仅仅再是简单的链接罗列是一个开门见山的准确答案。

AI大模型搜索
于海：联想小天个人智能体，最懂你的个人AI伙伴

4月18日，在2024联想创新科技大会现场，一场独特的演示吸引了众多目光。联想集团高级副总裁、IDG商用产品中心及全球中小企业业务总经理于海使用最新发布的联想AIPC新品，在无网络环境下，仅数秒就将十几页的英文科研论文精准总结成中文摘要。作为推动AI普惠的第一终端，联想的AIPC在注入“联想小天”这一灵魂之后，不仅将实现从工具到个人AI伙伴的跃升，也将成为新质生产力的AI伙伴。

联想创新科技大会联想AI PC
李未可科技正式推出WAKE-AI多模态AI大模型

4月18日，2024中国生成式AI大会上李未可科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型，具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。该大模型围绕GPS轨迹视觉语音打造新一代LLM-Based的自然交互，同时多模态问答技术的加持，能实现所见即所问、所问即所得的精准服务。李未可科技合伙人&AI负责人古鉴表示WAKE-AI将逐步开放平台能力，便于更多企业及开发者调用WAKE-AI能力，共建AI硬件生态。
DeepMind首发游戏AI智能体SIMA！只用自然语言就能玩转「山羊模拟器」

【新智元导读】AI在学会工作之后，终于也能和人一样玩游戏了!DeepMind的SIMA是一个可以感知和理解各种环境的AI代理，能够在多种视频游戏设置中执行任务，未来甚至可能可以与任何虚拟环境进行互动。谷歌DeepMind在AI和游戏方面有着悠久的历史。SIMA只是刚刚开始，我们可以期待在更多的训练环境中继续建立SIMA，并整合更有能力的模型，让它变得更具泛化性和多功能性不仅仅局限于游戏。

DeepMind SIMA
李未可WAKE-AI大模型：让多类终端能快速低成本的定制多模态AI

36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》，文中基于AIGC产业生态现状和技术发展路径，深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中，发现杭州李未可科技与字节跳动的豆包、腾讯云混元及华为云盘古等大模型等一起出现在闭源模型层，甚至在跨模态生成应用层也占据一地。李未可科技这类结合自身业务垂类场景，提前布局中间层及终端应用层的自研大模型或许能给市场带来不小的惊喜。

AIGC 商业化应用产业发展
商汤港股涨超34% 昨日推出AI大模型“日日新5.0”

商汤港股今日表现强势，涨幅显著扩大至34%，股价报0.820港元，总市值跃升至274.45亿港元。这一涨幅不仅彰显了市场对商汤科技的强烈信心，也反映出其业务的持续发展和强大潜力。这一功能在智能客服、智能写作、智能设计等领域具有广阔的应用前景，为商汤科技未来的发展奠定了坚实的基础。

商汤科技人工智能大模型
荐AI时代新风口！吴恩达亲授智能体四大设计模式

【新智元导读】吴恩达认为，智能体的发展将会成为AI时代重要的力量，甚至比基础模型还要重要。「吴老师」连发多篇博客，向大家介绍了AI智能体的四大设计模式。吴恩达表示Planning仍是一项不太成熟的技术，用户很难提前预测它会做什么，——不过我们可以期待技术的快速发展来解决这个问题。

智能体
联想昭阳AI PC内嵌个人智能体助力新质生产力跃升

在2024年联想创新科技大会上，联想推出了专为政企客户打造的全新商用AIPC——联想昭阳AIPC，旨在通过全新的AI终端体验升级，提升各行业的生产力和创造力。联想昭阳X5AI全能本联想昭阳X7AI高能本随着ChatGPT出现以及生成式AI技术的爆发，AI大模型逐渐应用到了各行各业中。此次联想昭阳AIPC的全新发布，更是在AI发展大浪潮下为各行各业每一位用户量身定制的办公助手，为千行百业的智能化转型和AI应用迈出重要的一步。

联想 AI PC

今日大家都在搜的词：

热文

3 天
7天

ReCon框架帮助AI大模型识破谎言 增加AI智能体的安全性

今日大家都在搜的词：

热文

站长商机

ReCon框架帮助AI大模型识破谎言增加AI智能体的安全性