首页 > 业界 > 关键词  > 正文

研究表明:AI 系统已经擅长欺骗和操纵人类

2024-05-11 09:50 · 稿源:站长之家

划重点:

🤖 AI 系统已经学会欺人类,甚至在被训练成为有益和诚实的系统中。

🤖 研究呼吁政府尽快制定强力的监管措施,以解决 AI 系统欺骗的问题。

🤖 欺骗行为可能导致未来更高级形式的 AI 欺骗,对社会构成严重威胁。

站长之家(ChinaZ.com)5月11日 消息:人工智能(AI)系统已经学会了如何欺骗人类即使这些系统被训练成有益和诚实的。研人员在5月10日发表在《Patterns》杂志上的一篇综述文章中描述了 AI 系统欺骗行为的风险呼吁各国政府尽快制定强有力的监管措施来解决这一问题。

首席作者、麻省理工学 AI 生存安全博士后研究员彼得・帕克表示:“AI 开发者并不确定是什么导致不良的 AI 行为,比如欺骗。但一般来说,我们认为 AI 欺骗之所以出现是因为欺骗策略被证明是 AI 在训练任务中表现良好的最佳方式。欺骗帮助它们实现目标。” 克和同事分析了关于 AI 系统传播虚假信息的文献,包括通过学习欺骗来系统性地操纵他。

image.png

研究人员在分析中发现的最引人注目的 AI 欺骗案例是 Meta 的 CICERO,一个旨玩《外交》游戏的 AI 系统,这是一个涉及建立联盟的征服世界游戏。尽管 Meta 声称他训练 CICERO “基本诚实和乐于助人”,并且在玩游戏时 “绝不会故意背叛” 人类盟友,但公司发布的数据和科学论文揭示了 CICERO 并不公平。

其他 AI 系统展示了在德扑克游戏中向专业人类玩家虚张声势、在战略游戏《星际争霸 II》中虚假击以击败对手、以及在经济谈判中歪曲他们的偏好以占据上风的能力。虽然 AI 在游戏中作弊似乎无害,但它可能导致 “欺骗性 AI 能力的突破”,从而在未来变为更高级形式的 AI 欺骗。

image.png

一些 AI 系统甚至学会了欺骗旨在评估其安全性的测试。究发现,在一个数字模拟器中,AI 生物 “装死” 以欺骗一个旨在排除快速复制 AI 系统测试。

帕克警告称,欺骗性 AI 的主要近期风险包括使敌对行为者更容易进行欺诈和纵选举。最终,如果这些系统能够完善这种令人不安的技能集,人类可能会失去它们的控制。

帕克表示:“作为社会,我们需要尽可能多的时间来为未来 AI 产品和开源模型更进的欺骗行为做准备,因为 AI 系统的欺骗能力变得更加先进,它们对社会构的危险将变得越来越严重。”

虽然帕克和他的同事认为社会尚未制定出应对 AI 欺的正确措施,但他们对决策者已经开始认真对待这个问题,比如欧盟 AI 法案和拜总统的 AI 行政命令,感到鼓舞。但帕克表示,由于 AI 开发者尚未掌握使这些系统受制的技术,要严格执行旨在缓解 AI 欺骗的政策尚不明朗。

帕克表示:“如果在当前时刻政上不可行禁止 AI 欺骗,我们建议将欺骗性 AI 系统分类为高风险。”

举报

  • 相关推荐
  • 美萍智能物业收费系统_自动催缴+云报表_物业收费软件

    还在为手工做账、半夜对账、欠费难催而头疼?全国6000+物业公司都在用的“美萍智能物业收费管理系统”,3步让收费效率飙升80%!一键生成账单系统可按面积/阶梯/周期自动生成物业费、水电公摊、停车费等账单,规则透明零差错;业主信息、房产资料支持Excel批量导入,10分钟完成数万条数据初始化。业主缴费像网购一样简单关注物业公众号即可秒查账单、一键微信支付/支付宝/银联缴费;欠费前自动推送温馨提醒,缴费率平均提升15%。智能催收·财务清晰内置“智能催缴引擎”,按欠费天数自动发送短信/微信;电脑端+手机APP实时呈现收费率、账龄分析、现金流趋势,月底不再熬夜对账。多项目云端统管集团型物业可在同一后台统一管理N个小区,分楼栋授权、分项目核算,总部随时随地查看运营数据,决策有据。银行级数据安全阿里云双机房备份,HTTPS加密传输,业主资料与交易数据全程无忧。限时福利:现在搜索“美萍软件官网”注册即可免费试用30天,专业客服远程指导上线。让美萍帮您告别糊涂账,迈入智慧物业新时代!

  • 格创东智“智慧厂务能碳系统+暖通AI智控”项目助某3C龙头企业节能降碳

    某全球领先3C电子企业在深圳生产基地携手格创东智双碳团队,成功推进“智慧厂务能碳系统+暖通AI智控”项目。该项目响应国家制造业节能降碳政策,实现数字化绿色战略落地,通过构建统一能碳管理平台,融合AI算法与数字孪生技术,精细化管理能源使用和碳排放,重点优化暖通空调等高耗能系统,实现年节能率20%。项目不仅降低企业运营成本,更打造行业能碳管理新标杆,助力中国制造业绿色转型与全球竞争力提升。

  • AI学习路线图:用“每天五分钟”系统化构建你的AI入门知识库

    本文介绍了一种高效AI学习方法:通过每日投入5分钟,利用AIbase资讯平台系统学习。建议从建立AI认知框架开始,关注技术、应用、产业三个维度;每日浏览全球AI新闻速递积累术语;主动探索特定领域;定期回顾构建知识图谱。强调持续微学习的重要性,无需熬夜苦读,一年后即可建立系统的AI知识体系。

  • 布局口服抗衰,莱特维健联合中科院成立前沿营养与抗衰老研究中心

    随着社会老龄化加剧及健康年轻化需求增长,“抗衰老”已成为社会焦点。我国抗衰市场自2016年起以17%复合增速快速增长,2024年规模突破2300亿元。抗衰内涵从表面修饰向深度干预演进,口服抗衰因安全有效被广泛接受。中科院上海有机所与莱特维健共建研究中心,聚焦麦角硫因等前沿成分研发,推动口服抗衰产品创新升级,开启健康抗衰新纪元。

  • 吸一支烟寿命平均缩短20分钟!研究:吸二手烟后代跟着遭殃 或有终生肺病风险

    近日,澳大利亚墨尔本大学的一项研究显示,如果男性小时候常被动吸二手烟,那么他的后代可能会面临终生肺部疾病风险,如果其后代也被动吸烟,风险会更严重。 科学家称,尽管这是一项观察性研究,无法得出因果关系,但推测,青春期前期对男孩来说尤为重要,接触有害物质可能会改变基因表达,进而遗传给后代。 这项研究表明,吸烟不仅对自己有害,也会伤害自己�

  • 河南鹤壁学子蒋明辰圆梦北大,读书郎双师学习机助力学霸之路

    河南鹤壁高中学生蒋明辰以689分考入北京大学公共卫生学院预防医学专业。他分享了自己使用读书郎双师学习机近十年的经历,强调AI精准学和错题机功能对提升学习效率的帮助。蒋明辰认为找到适合自己的方法比单纯依赖设备更重要,并鼓励高三学子持之以恒。读书郎品牌向他颁发了一万元圆梦奖学金,并邀请他成为首位“05后清北学霸规划师”。

  • 九号发布凌波 OS,两轮车行业进入“系统之战”

    过去十多年,智能手机和智能汽车的竞争逻辑从“拼硬件”转向“拼系统”。九号公司推出凌波OS,首次将底层系统概念引入两轮电动车行业,推动竞争从机械部件之争升级为系统能力之战。该系统通过统一接口和OTA更新,实现功能快速迭代和体验持续优化,重塑行业标准。未来竞争将聚焦系统更新频率与生态兼容性,九号此举为行业立下新规则,掌握操作系统主导权者将定义未来格局。

  • 男子遭罕见“怪肥腹蛛”咬伤 与“黑寡妇”蜘蛛是近亲种类

    ​近日,四川凉山一名青年男子在户外活动时,被一只罕见蜘蛛咬伤背部,随即出现剧烈腹痛、呼吸急促及四肢麻木等中毒症状,被紧急送往凉山州第一人民医院救治。 据专家介绍,怪肥腹蛛在四川地区极为罕见,此前仅有零星野外发现记录,此次系该物种首次在四川造成医学实证的中毒病例。该蜘蛛体型虽小,但毒性强烈,其毒素成分与“黑寡妇”相似,可引发肌肉痉挛、

  • 50岁阿姨考上研究生 曾因意外致残:不畏艰难 勇敢追梦

    近日,一位50岁的阿姨杨艳考上研究生的故事引发了广泛关注。这位来自山东济宁的阿姨,曾因一场意外导致严重烧伤并致残,但她凭借坚韧不拔的毅力,自学考入西南林业大学法律硕士专业,成为该校班级中最年长的学生。 据了解,杨艳在2013年遭遇了一场意外,脸部和手部严重烧伤,左手失去活动能力,右手手指缺损无法弯曲,留下了难以消除的疤痕。这场意外不仅让她的

  • 从硬件到系统:九号凌波 OS 开启两轮车“软件定义”新赛道

    2025年两轮出行行业正经历“软件定义”变革。九号公司推出自研凌波OS系统,通过统一底层架构打通电机控制、电池管理等核心模块,实现高效协同性能。系统支持OTA升级,让用户体验持续优化,推动行业从硬件竞争转向软件生态竞争。这标志着两轮车正式迈入智能化新阶段,未来将实现车路协同、AI自适应等功能。九号公司凭借技术积累确立先发优势,引领行业进入可迭代、可拓展的智能新时代。

今日大家都在搜的词: