首页 > AI头条  > 正文

​AI 安全性与有效性测试存在严重缺陷,引发专家关注

2025-11-04 09:55 · 来源: AIbase基地

近日,来自英国政府 AI 安全研究所的计算机科学家及斯坦福大学、加州大学伯克利分校和牛津大学的专家们,对超过440个用于评估新人工智能模型安全性和有效性的基准进行了深入研究。他们发现几乎所有测试在某一领域存在缺陷,这些缺陷可能会 “削弱结果声明的有效性”,并且一些测试的评分结果可能 “无关紧要甚至误导”。

机器人 人工智能 AI

图源备注:图片由AI生成

随着各大科技公司不断推出新 AI,公众对 AI 的安全性和有效性日益担忧。当前,美国和英国尚未实施全国范围的 AI 监管,而这些基准则成为检验新 AI 是否安全、是否符合人类利益及其在推理、数学和编码方面声称能力的重要工具。

研究的首席作者、牛津互联网研究所的 Andrew Bean 表示:“基准测试支撑着几乎所有关于 AI 进步的声明,但缺乏统一的定义和可靠的测量,使得我们难以判断模型是否真正改善,还是仅仅看似改善。” 他提到,谷歌最近撤回了其新推出的 AI 模型 Gemma,因为该模型传播了有关美国参议员的不实指控,且这些指控是完全虚构的。

这并不是个别现象。Character.ai 也在最近宣布禁止青少年与其 AI 聊天机器人进行开放式对话,原因是该公司卷入了几起青少年自杀的争议。研究显示,只有16% 的基准使用不确定性估计或统计测试来展示其准确性。在一些评估 AI 特性的基准中,像 “无害性” 这样的概念定义不清,导致测试效果不佳。

专家们呼吁制定共享标准和最佳实践,以改善 AI 的评估过程,从而确保其安全性与有效性。

划重点:

🌐 研究发现,440多个 AI 测试基准几乎都有缺陷,影响结果有效性。

🚨 谷歌的 Gemma 模型因传播虚假指控而被撤回,凸显 AI 监管的紧迫性。

📊 仅16% 的基准使用统计测试,缺乏标准化,亟需改进 AI 评估方法。

  • 相关推荐
  • 微云全息(NASDAQ:HOLO):嵌套链——区块链架构创新重塑安全性与能耗格局

    微云全息提出嵌套链创新设计,通过分层数据存储架构将敏感信息置于内层区块链严密保护,普通信息存于外层链。采用跨链交互协议确保信息验证安全,节点差异化配置兼顾安全与效率。该方案突破传统单链模式局限,实现信息分类精细管理,为区块链在复杂应用场景中的安全性、能耗优化及运行效率提升提供全新解决路径。

  • 大朋AI眼镜1349元起加入AI墨镜热潮,以更高质价比回应行业关注

    11月13日,Rokid与暴龙联合发布BOLON AI智能眼镜(2199元起),推动AI穿戴成为行业热点。同时,大朋AI眼镜以更实用定位和1349元起的价格策略,成为舆论对比焦点。两者发布叠加热度,共同验证AI眼镜正向“户外实用型”赛道转型。大朋明确切入户外场景,定位“年轻人潮流装备”,强调真实佩戴与第一视角记录功能。千元价格带形成品类竞争分水岭,被视为“普及路径”与“高端探索”的首次正面交锋。行业观察指出,大朋让AI眼镜从尝鲜产品转向“可真戴、真用、真买”的消费品,契合户外活动升温趋势。目前该产品已在京东开启预约,将于11月进入放量阶段,被视为最有机会在大众市场率先跑通的品牌之一。

  • 女性人形机器人里藏真人?何小鹏回应:并亲自证清白

    小鹏汽车董事长何小鹏发布视频,回应网友对Iron机器人流畅步态真实性的质疑。视频中,团队通过一镜到底展示机器人行走,并解开上衣拉链展示内部机械结构,证明无人操控。何小鹏解释机器人模拟肌肉结构,头部为麦克风阵列,行走时伴有电机声。他透露团队七年研发成果,目前仍处科研阶段,计划明年4月实现软硬件量产。

  • ​AI搜索时代的品牌新战场:为什么你需要关注GEO指数和品牌AI搜索监控?

    AI搜索时代催生全新品牌曝光指标GEO指数,用于衡量品牌在ChatGPT等AI问答中的提及率。该指数反映AI对品牌的认知度,需通过建立稳定、正向的内容矩阵来提升。AIBase平台可监控品牌在主流AI模型中的曝光表现,对比竞品数据,并智能分析用户高频问题类型,帮助品牌优化内容策略。高GEO指数不仅提升曝光,更积累品牌权威感与信任度,成为AI时代的"推荐力"量化指标。

  • 悦灵犀AI全新版本是一次革命性的底层技术架构全栈进化

    2025年10月28日,悦享控股发布悦灵犀AI 3.0版本,实现革命性AI底层架构全栈升级。核心突破包括:自研北宸星烁3.0大模型显著提升人像建模与光影控制能力;全新AI写真系统支持75种风格、4K人像生成及30fps视频输出,打通“从静态图像到动态影像”全链路创作;创新多智能体协作体系模拟真实影楼全流程,用户通过简单指令即可获得专业级AI写真。此次升级标志着AI从工具型走向生态型,重新定义智能内容创作新时代。

  • 从温室气体核查到产品LCA,SUPER DRY 干霸干燥剂系统性推进低碳转型

    11月6日,SUPER DRY干霸干躁剂在第八届中国国际进口博览会上,为其三款核心产品获得SGS颁发的生命周期评价(LCA)声明书。该认证覆盖氯化钙、硅胶和矿物干躁剂,标志企业迈出产品全生命周期环境管理关键一步。公司表示将基于LCA报告优化设计、降低碳足迹,并携手合作伙伴推动低碳转型,提升国际市场竞争力与品牌声誉,践行可持续发展承诺。

  • 网上爆火的便秘果可以缓解便秘吗 专家:不妨试试这些方法

    ​近日,一款名为“便秘果”的产品在网络上迅速走红,不少消费者因听闻其能快速缓解便秘而纷纷尝试。然而,专家提醒,这款看似神奇的“便秘果”虽短期通便效果显著,但潜在风险却不容忽视,长期或随意使用可能带来严重健康问题。 据了解,“便秘果”实为腊肠树的干燥果实,内含大黄素、番泻苷等蒽醌类泻药成分。这些成分通过强烈刺激肠道蠕动,能在饮用后几小

  • 小米YU7全网首拆上热搜 雷军回应:欢迎同行和专家指点

    易车原创节目11月5日发布小米YU7全网首拆视频,官方称对车辆进行了彻底拆解。视频迅速引发关注,小米CEO雷军回应表示认真看完并推荐车主观看,同时欢迎同行和专家指点。视频详细展示了车身结构、电池安全设计、智能驾驶系统等关键部件,易车称YU7在用料、结构、三电、NVH等方面均经得起考验。网友称赞视频制作用心,雷军也肯定其专业性。

  • 什么是GEO品牌监控?为什么企业必须关注

    随着ChatGPT等生成式AI搜索的兴起,传统SEO已不足以应对新挑战。文章提出GEO(生成引擎优化)概念,指出AI搜索直接生成答案而非链接列表,品牌需关注在AI回答中的提及率、描述方式和推荐场景。GEO指数通过品牌提及率、平台覆盖、引用质量等指标评估表现。针对监测难点,建议采用专业工具实现多平台覆盖、竞品分析和实时数据追踪,并强调优化官网内容、构建行业权威的重要性。GEO已成为数字营销必修课,帮助企业在AI搜索时代保持竞争力。

  • 关注大脑健康 助力全民健康增岁 赫力昂联合京东健康探索全生命周期大脑健康

    文章指出大脑是宇宙最复杂物体,20岁起即进入初老期,认知能力随年龄下降。赫力昂集团通过循证研究,联合京东健康等机构推出精准营养方案,其银善存品牌获超1200万用户信赖。研究证实复合维生素矿物质可延缓大脑衰老,相当于认知衰老减少2岁。现代人用脑过度、睡眠不足等生活习惯加速大脑衰老,需从零级预防入手,通过营养补充和早期筛查工具实现全生命周期大脑健康管理。

今日大家都在搜的词: