斯坦福大学：大多数大语言模型不符合欧盟AI法案 GPT-4仅排第四

2023-07-12 10:16 · 稿源：站长之家

站长之家（ChinaZ.com）7月12日消息:斯坦福大学著名的以人为中心的人工智能研究所（HAI）表示，对10个主要基础模型的调查显示，它们“基本上不”遵守欧盟的人工智能法案。

得分最高的基础模型是Bloom，它是 Hugging Face 的开源模型，于2022年7月发布，是一个大型多语言模型，具有多达1760亿个参数，旨在通用。

紧随其后的是 EleutherAI 的GPT-NeoX和 Google 的PaLM2。OpenAI 的 GPT-4排名第四，Cohere 的Command跻身前五。

得分最低的模型是来自德国人工智能初创公司 Aleph Alpha 的Luminous 。令人惊讶的是，表现第二差的模型是Anthropic 开发的人工智能机器人 Claude，这是，旨在生成更安全的响应。第三差的是AI21的Jurassic-2。

斯坦福大学研究人员表示，Claude的结果表明模型是受限或封闭的。他们发现，像 Claude 这样的模型，以及 Google 的PaLM2和 OpenAI 的GPT-4等几乎没有被披露的模型，使得评估数据源和计算水平变得困难。GPT-4得分为25，PaLM 得分为27，尽管与 Claude 一样，在涉及数据源和治理的测试时，两者都排名较低。

斯坦福大学的研究人员考虑了欧盟人工智能法案的22项要求，并选择了12项可以利用公共信息进行“有意义的评估”的要求。它们是数据源、数据治理、受版权保护的数据、计算、能源、能力/限制、攻击/缓解、评估、测试、机器生成的内容、成员国和下游文档。

这12个指标按4分制进行评估，其中最低得分为1分，4为最高。然而，由于创建者没有透露足够的信息，某些模型无法得到充分评估。例如，封闭模型的数据源通常不公开。

研究人员表示，他们选择《欧盟人工智能法案》是因为它是“当今世界最重要的人工智能监管举措”。该法案很快将成为适用于欧盟4.5亿人口的法律，同时也为全球人工智能监管开创了先例。

研究人员得出结论，得分最高的模型仍有“重大改进”的空间。这意味着欧盟人工智能法案将导致透明度和问责制方面的“重大变化”和“实质性进展”。

大多数模型陷入困境的四个领域是受版权保护的数据（不明确的责任问题）、计算/能源(能源使用报告不均匀)、风险缓解(披露不充分)和评估/测试(模型提供商很少根据故意伤害来衡量性能)。

一般来说，广泛开放的模型在资源披露方面较强，但在监视或控制部署方面较弱。封闭或受限模型则相反。因此，斯坦福大学的研究人员呼吁欧盟政策制定者加强部署要求，以确保更大的问责制。

研究人员表示，欧盟人工智能法案必须明确未明确规定的领域，例如哪些性能维度需要披露。此外，评估合规性时必须考虑模型的准确性、稳健性、公平性和效率，类似于美国标准与技术研究所的人工智能风险管理框架。

斯坦福大学团队表示，欧盟人工智能法案还应迫使提供商披露使用模式，以反映在线平台的透明度报告。对于全球政策制定者来说，他们应该优先考虑模型的透明度。社交媒体监管的经验是一个明显的教训，即平台透明度不足导致了许多危害。

模型提供商合规性最差的领域是受版权保护的训练数据的披露。研究人员呼吁立法者澄清版权与生成模型的训练和输出的关系，包括机器生成内容侵犯内容创作者权利的条件。

对于模型提供商来说，斯坦福大学的研究人员建议他们从“容易实现的成果”开始，例如为基于基础模型构建的下游开发人员改进文档。他们还应该与学术界和公众合作制定行业标准，以提高整个生态系统的透明度和问责制。

（举报）

相关推荐

关键词：

调动不同AI大模型费用怎么算?AI模型费用计算神器算清每一分投入!

本文探讨了企业在调用不同AI大模型时的费用计算问题。随着GPT-4、Claude、文心一言等模型广泛应用，各厂商的计费规则差异显著：有的按Token收费，有的按调用次数，还有地区定价差异。相同任务在不同模型上的成本可能相差10倍。文章推荐使用AIbase费用计算器（https://model.aibase.com/zh/calculator），该工具覆盖主流模型，支持自定义参数，能快速对比不同模型的调用成本，帮助企业实现精准预算控制，选择最具性价比的AI服务方案。

AI大模型费用计算隐性成本
如何科学比价AI大模型?一文教你用好这个AI大模型比价免费计算工具

本文探讨了当前AI大模型调用成本计算的重要性，介绍了AIbase费用计算器的实用功能。主要内容包括：1)不同厂商计费方式差异大，存在token/字符/调用次数等不同标准；2)AIbase工具支持主流模型费用对比，实时更新官方价格；3)提供输入输出分开计费模拟，支持自定义参数和结果排序；4)完全免费无需登录，适合快速查询。文章还给出选型建议：轻量任务选Claude Instant等低成本模�

AI大模型模型比价调用成本
AI大模型那么多，该如何科学对比选型?

文章探讨了当前AI大模型选择的困境，指出随着国内外模型数量激增，用户面临选择难题。作者提出应从实际需求出发，考虑模型能力、成本、使用方式、中文支持等核心维度，避免只看参数规模或流行度的误区。特别推荐使用AIbase模型广场等对比工具，可快速比较多个模型的详细参数、调用方式和价格差异。文章以中文写作为例，对比了通义千问、月之暗面、文心一言和GPT-4�

生成式人工智能大模型选型 AI模型对比
AI大模型对比完全指南:如何选择最适合你的大模型?

文章探讨了当前AI大模型市场众多选择带来的选择困难问题。面对GPT-4、Claude、文心一言等各具特色的模型，普通用户和企业难以科学评估和选择。文章提出了一套完整的评估体系，包括基础能力、技术性能、应用场景和商业考量四个维度，并建议采用标准化测试和实际场景验证相结合的方法。同时介绍了2025年主流AI模型的特点：GPT-4o在多模态交互领先，Claude3在编程和逻辑分析突出，Gemini2.5擅长长文本处理，国产DeepSeek则以高性价比见长。最后强调选择AI模型应基于具体需求，而非简单追求性能排名，建议通过专业对比平台和实际测试来验证。

AI大模型对比模型选择方法论市场分析
2025年国内AI大模型哪家强？上AI大模型选型对比工具，用数据说话！

文章分析了国内AI大模型市场竞争格局，指出百度、阿里、腾讯、字节等科技巨头与初创公司纷纷布局，呈现繁荣景象。针对用户选型难题，提出需综合考虑参数规模、场景适配、成本效益等关键因素，并介绍了AIbase推出的AI大模型选型对比工具。该工具汇集主流模型最新数据，支持多维度能力对比和场景化筛选，帮助用户快速定位最适合自身需求的模型。最后强调没有"最强"的通用模型，只有最匹配特定场景的解决方案。

国内AI大模型 AI技术竞争大模型选型
哪个大模型性价比最高？用这个 AI 大模型费用计算器轻松比价

AI大模型快速发展，但不同厂商的定价规则差异大，导致选择困难。AIbase推出的AI大模型费用计算器（https://model.aibase.com/zh/calculator）能帮助开发者快速比较主流模型的调用成本。该工具覆盖GPT-4、Claude、文心一言等国内外热门模型，支持输入输出分开计费，实时更新官方定价，无需注册即可使用。用户只需输入文本，系统自动拆分token数并精准计算费用，结果清晰直观可排序。建议根据场景需求选择模型：平衡成本与性能可选GPT-4o、DeepSeek-V2；高精度需求选GPT-4 Turbo；中文场景优选国产模型。使用前通过计算器模拟成本，可避免项目超支风险。

大模型性价比人工智能
AI模型怎么计费?大模型费用计算器助你精准预算，告别复杂参数困扰

随着AI大模型普及应用，企业开发者面临复杂的计费挑战：主流模型采用Token计费，但不同模型Token换算差异大（如1Token=1.8汉字或1汉字），输入输出Token分开计价且输出更贵，隐藏成本包括上下文累积、重复调用等。定价模式多样（按量/包月），模型间价差显著（如DeepSeek V3成本仅为GLM-4Plus的1/3）。专业工具AIbase费用计算器（https://model.aibase.com/zh/calculator）可精准预估成本，覆盖GPT-4、文心一言等主流模型，智能处理Token换算和隐藏成本，提供多模型对比分析。实际案例显示，处理10万次咨询时文心一言成本（800元）显著低于GPT-4（2000+元）。未来趋势包括价格战推动成本下降、计费模式多元化（任务分级/套餐组合），建议企业建立成本监控体系，通过场景化分析和动态模型调整实现性价比最优。AI时代，专业计费工具将成为精准控制成本的关键。

AI模型计费 Token计费机制费用预算工具
男子编造2岁女儿被抱走遭处罚：为博关注由AI大模型生成

近日，一则细节详尽的“2岁女儿王喵喵被抱走”的寻人启事在网络上疯狂传播，引发超百万次点击与大量转发，众多网友纷纷加入转发助力寻找的行列。启事中描述走失者王喵喵为2岁女性，眼睛大大的，笑时会露出两颗小虎牙，在嘉兴市南湖区新丰镇乌桥超市被一大妈抱走，还附上了“父亲”与“母亲”的联系电话，字里行间满是焦灼，让人感觉是心急如焚的家长发出的求�

寻人启事网络传播嘉兴市
如何精准锁定高性价比的AI大模型？AIbase AI模型费用计算器助力开发者省心省钱选模型

文章探讨了在预算有限的情况下如何选择合适的大模型API。面对GPT-4、Claude2、Llama2等数十种模型，开发者常陷入选择困境：既要考虑性能，又要兼顾成本。不同厂商的计费机制复杂多样（按Token、请求次数或时间），手动计算耗时且容易出错。文章推荐使用AIbase的AI模型费用计算器，该工具聚合主流模型定价数据，支持可视化交互计算，能快速比较不同场景下的使用成本，帮助�

大模型选择 AI应用开发 API调用成本
广域铭岛的工业AI精准决策三要素：实时数据、机理模型与反馈机制

广域锚岛在2025世界人工智能大会上发布"Geega工业AI平台+工业智造超级智能体"双引擎，通过实时数据感知、工业Know-How与AI算法融合、决策-执行-验证闭环反馈三大能力，构建工业智能决策体系。该平台覆盖研发、生产、物流等全领域，日均处理百万级调度事务，使工作效率提升30%，年节省24000小时。其创新在于将行业机理知识内化为AI模型，并通过仿真验证持续优化，实现AI与制造业的深度耦合，推动工业智能化从理论走向规模化应用。

工业AI技术智能制造工业智造

热文

3 天
7天

斯坦福大学：大多数大语言模型不符合欧盟AI法案 GPT-4仅排第四

调动不同AI大模型费用怎么算?AI模型费用计算神器算清每一分投入!

如何科学比价AI大模型?一文教你用好这个AI大模型比价免费计算工具

AI大模型那么多，该如何科学对比选型?

AI大模型对比完全指南:如何选择最适合你的大模型?

2025年国内AI大模型哪家强？上AI大模型选型对比工具，用数据说话！

哪个大模型性价比最高？用这个 AI 大模型费用计算器轻松比价

AI模型怎么计费?大模型费用计算器助你精准预算，告别复杂参数困扰

男子编造2岁女儿被抱走遭处罚：为博关注由AI大模型生成

如何精准锁定高性价比的AI大模型？AIbase AI模型费用计算器助力开发者省心省钱选模型

广域铭岛的工业AI精准决策三要素：实时数据、机理模型与反馈机制

热文

理想回应和乘龙重卡碰撞测试：被卷入舆情争议实属无心之举

AI日报：混元推四款小尺寸开源模型；昆仑万维发布新推理大模型

法拉第方回应新车抄袭长城：联合开发不存在抄袭

荣耀畅玩70 Plus发布：骁龙6系芯片国补售价1019.15元起

AI日报：阿里推全新图片模型Qwen-Image；小米全量开源MiDashen

理想i8宣布统一版本：标配即顶配并降价1万元

微信员工辟谣改日期恢复过期文件：纯属谣言

第五人格崩了上热搜网易旗下多款游戏回应：紧急排查中

李想回应理想i8统一配置版本：此前陷入惯性思维

腾讯张军回应云客服仿冒腾讯会议App：还好名字露了马脚

腾讯客服回应微信提现手续费下降：已进行全量更新

AI日报：Kimi K2 高速版发布；美图WHEE上线视频超清功能；字节

理想回应和乘龙重卡碰撞测试：被卷入舆情争议实属无心之举

理想邀请乘龙卡车直播对撞东风柳汽：理想撞卡车视频严重侵权

REDMI Pad 2开售：售价999元起 11英寸2.5K大屏

小米汽车7月交付量超30000台创历史新高

AI日报：混元推四款小尺寸开源模型；昆仑万维发布新推理大模型

法拉第方回应新车抄袭长城：联合开发不存在抄袭

荣耀畅玩70 Plus发布：骁龙6系芯片国补售价1019.15元起

京东外卖：继续反内卷呼吁停止“0元购”

站长商机