首页 > AI头条  > 正文

专家揭示数百项 AI 安全测试存在严重缺陷

2025-11-04 09:30 · 来源: AIbase基地

根据最新报道,来自英国政府 AI 安全研究所和多所知名大学的计算机科学家们发现,当前用于评估新一代人工智能(AI)模型安全性和有效性的测试存在广泛的缺陷。这项研究分析了超过440个基准测试,发现几乎所有的测试在某个方面都有弱点,这些弱点可能会影响到最终结论的有效性。  

机器人AI

图源备注:图片由AI生成

研究的主要作者、牛津互联网研究所的研究员安德鲁・比恩(Andrew Bean)表示,这些基准测试是检查新发布 AI 模型安全性和是否符合人类利益的重要工具。然而,由于缺乏统一的标准和可靠的测量方法,很难判断这些模型是否真正取得了进展,或者只是表面上看起来在进步。  

在目前英国和美国尚未出台全国性 AI 监管法规的背景下,基准测试成了技术公司推出新 AI 时的安全网。近期,一些公司因其 AI 模型造成的危害而不得不收回或收紧其产品。例如,谷歌最近撤回了一款名为 Gemma 的 AI,因为该模型虚构了关于一位美国参议员的不实指控,这引发了广泛的争议。  

谷歌表示,Gemma 模型是为 AI 开发者和研究人员设计的,而不是供普通消费者使用,并在得知非开发者尝试使用后将其撤回。研究还发现,许多基准测试并未使用不确定性估计或统计测试,仅有16% 的测试具备这样的措施。此外,在评估 AI 的 “无害性” 等特征时,相关定义往往存在争议或模糊,进一步降低了基准测试的实用性。  

该研究呼吁建立共享标准和最佳实践,以提升 AI 安全性和有效性的评估能力。

划重点:  

🔍 近440个 AI 安全测试发现几乎所有都有缺陷,影响结论有效性。  

🚫 谷歌因 Gemma 模型引发虚假指控事件,撤回该 AI。  

📊 仅16% 的测试使用统计方法,亟需建立共享标准与最佳实践。

  • 相关推荐
  • 温度超65℃ 塑料盒会释放有害物质 专家提出六项防护准则

    近日,关于高温环境下塑料餐盒释放有害物质的研究结果引发广泛关注。科学研究表明,当温度超过65℃时,塑料外卖盒、一次性纸杯等常见餐具会释放微塑料及全氟化合物等有害物质,这些物质可能通过食物进入人体,导致血管内皮损伤,长期接触更会增加心血管疾病风险。 据专家介绍,外卖食品出锅时温度通常高达80-90℃,直接装入塑料餐盒后,有害物质迁移量会显著增�

  • 百度搜索AI API全面开放 绝大多数结果由AI生成

    11月13日,百度创始人李彦宏在2025百度世界大会上宣布,百度搜索已实现绝大多数结果由AI生成,首条结果富媒体覆盖率高达70%。他强调,百度正通过AI技术深度重构搜索结果页,从传统文字链接模式转向以图片、视频等富媒体内容为核心的AI应用。李彦宏指出,百度是全球搜索引擎中对AI化改造最激进的,正引领行业进入全新时代。他还表示,企业需善用AI方能立于不败之地,个人也需掌握AI技能以掌控未来。目前,百度已通过AI+API开放搜索能力,与三星、荣耀、vivo等主流厂商建立合作,共同探索AI搜索的无限可能。

  • 百度AI:熬过“起大早”的孤独,等来时代的奖励

    AI的故事,又进入到了新阶段。 11月13日,第20届百度世界大会举行。在这场被视为AI行业风向标的会议上,百度创始人李彦宏发表了题为《效果涌现》的主旨演讲。他表示,当前,“我们更关心如何让AI与我们要做的每一项任务,都能有机结合,让AI成为企业发展和个人成长的原生推动力。” 这场演讲的核心,恰恰道出了AI产业的分水岭——从“智能涌现”迈向“效果涌现”。

  • 百度搜索推出“百度猎户座”AI引擎,涵盖基座模型、搜索AI API、 MCP、垂类优势能力

    2025年11月13日,百度发布“百度猎户座”AI引擎,全面开放25年搜索技术与前沿AI能力。该系统整合底座模型、搜索API、MCP及垂直领域能力,基于多智能体架构统一连接信息、工具、服务与模型,融合搜索技术优势与全网MCP生态资源。即日起对外开放,支持企业快速接入打造专属AI应用。同时,文心助手上线个性化记忆功能,视频生成推出“参考生成”玩法,AI短剧创作平台免费提供超30万部IP资源及全流程工具。

  • 视源股份旗下希沃参与1项国家标准、2项行业标准建设,助力智慧教育规范化发展

    视源股份旗下希沃深度参与国家与行业标准制定,主导《移动学习终端功能要求》国家标准及两项电子行业标准编制。三项标准均于2025年下半年陆续发布,涵盖终端功能、护眼性能及多场景适配等关键技术规范,填补了多媒体学习终端领域长期缺乏统一标准的空白。公司通过标准化工作持续输出技术领导力,已参与制定超130项各类标准,未来将继续以创新技术驱动教育数字化行业高质量发展。

  • 百惠金控:全球 IPO 重现热度 AI 股料再受热捧

    毕马威报告显示,全球IPO市场正逐步回暖,2025年第三季度超400宗IPO,创投市场连续四季稳健增长。AI领域成为主要驱动力,OpenAI等企业筹备上市推动热潮,美股与港股表现活跃。投资者更趋理性,聚焦企业商业模式与盈利潜力。香港凭借国际金融中心地位,吸引中资科创企业上市,需满足财务披露与ESG高标准。机构建议企业尽早寻求专业支持,把握资本窗口期。

  • AI日报:广电整治AI动画乱象;360发布大模型安全白皮书;百度推出小度AI眼镜Pro

    国家广电总局宣布自2026年3月起全面整治AI生成内容,要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》,提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro,集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX,实现文本化语音编辑。Grok新增纯文本生成视频功能,17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠,并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型,优化开发者体验。

  • 斩获双11百吋电视全渠道销量、销额双冠,海信做对了什么?

    海信在双11期间凭借MiniLED技术实现爆发,电视品类全渠道销量与销售额双双夺冠,其中小墨E5Q Pro和U7S Pro表现抢眼。其成功源于技术普惠战略:通过供应链整合降低MiniLED门槛,推动高端画质普及;同时以RGB-MiniLED实现色彩精准度跃升,结合百吋巨幕布局,精准击中消费者对尺寸、画质、价格的核心需求。这场胜利印证了以技术创新驱动细分市场深耕的策略价值。

  • 网上爆火的便秘果可以缓解便秘吗 专家:不妨试试这些方法

    ​近日,一款名为“便秘果”的产品在网络上迅速走红,不少消费者因听闻其能快速缓解便秘而纷纷尝试。然而,专家提醒,这款看似神奇的“便秘果”虽短期通便效果显著,但潜在风险却不容忽视,长期或随意使用可能带来严重健康问题。 据了解,“便秘果”实为腊肠树的干燥果实,内含大黄素、番泻苷等蒽醌类泻药成分。这些成分通过强烈刺激肠道蠕动,能在饮用后几小

  • 小米YU7全网首拆上热搜 雷军回应:欢迎同行和专家指点

    易车原创节目11月5日发布小米YU7全网首拆视频,官方称对车辆进行了彻底拆解。视频迅速引发关注,小米CEO雷军回应表示认真看完并推荐车主观看,同时欢迎同行和专家指点。视频详细展示了车身结构、电池安全设计、智能驾驶系统等关键部件,易车称YU7在用料、结构、三电、NVH等方面均经得起考验。网友称赞视频制作用心,雷军也肯定其专业性。

今日大家都在搜的词: