英语的人工智能使用费比其他语言便宜 15 倍简体中文成本约为英语的两倍

2023-07-31 10:02 · 稿源：站长之家

站长之家(ChinaZ.com) 7月31日消息:研究表明，对于类似 OpenAI 的服务，由于计算成本的计量和计费方式，英语输入和输出比其他语言要便宜得多，其中简体中文的成本约为英语的两倍，西班牙语为英语的 1.5 倍，而掸语则要贵 15 倍。

Claude2，Anthropic，人工智能，聊天机器人

一项由牛津大学进行的研究发现，让一个大型语言模型处理一句缅甸语句子需要 198 个 tokens，而同样的英语句子只需 17 个 tokens。Token 代表通过 API 访问大型语言模型（如 OpenAI 的 ChatGPT 或 Anthropic 的 Claude 2）的计算成本，这意味着使用服务处理缅甸语句子比处理英语句子要贵 11 倍。

这种「标记化」模型意味着在不理想的情况下，访问和训练非英语语言模型会更昂贵。这是因为像中文这样的语言与英语在结构上（无论是语法上还是字符数量上）有所不同，从而导致其标记化的成本更高。

举个例子，根据 OpenAI 的 GPT3 tokenizer，将「your affection」这个词组标记化为英语只需两个 tokens，而在简体中文中则需要八个 tokens。这是因为简体中文的文本虽然只有 4 个字符（你的感情），而英语文本有 14 个字符。

微软自己在解释其 ChatGPT 模型的 API 访问和使用的页面上提供了一个很有用的工具，其中甚至包括了一个标记化工具，您可以用来测试每个提示的标记成本。在那里，我们可以看到在英语中，1 个 token 约等于 4 个字符，100 个 tokens 约等于 75 个英文单词。但是这种数学规则并不能应用于其他任何语言，微软清楚地表明了这一点。

在人工智能相关的成本方面，英语的成本效益无可匹敌；例如，相对于输出而言，中文的成本是英语的两倍。但这只是 AI 公司迄今为止用于训练模型的可用训练数据的反映。人工智能的爆发已经向世界展示了高质量紧急数据（作为生活记录而产生的数据）的价值。

此问题直接关系到 AI 公司希望实现递归训练的愿望，即能够用自己的输出训练 AI 模型。如果实现了这一点，那么未来模型仍将显示英语与其他语言相比的成本效益，其他语言的复杂性和更有限的基础训练数据导致了更高的标记化速率。

为了进一步复杂化问题，似乎除了标记化之外，其他衡量成本的方法最终也会遇到相同的问题。无论是通过位数还是字符计数，显然没有任何一种语言能够超越英语的实际实用性——英语的「可压缩性」较高，因此标记数量较低。

这意味着问题不在于模型的货币化方式；它实际上是技术和基础模型在训练中的一个真实局限。而且不难想象，这个问题会影响到各个版本的多语言模型。毕竟，它们几乎都是以相同方式构建的。

当我们考虑到推出大型语言模型（如 ChatGPT）或生成式图像网络（如 Midjourney）的公司主要位于美国时，这种成本差异已经导致一些国家推出了培训和使用本地语言的大型语言模型的计划。中国和印度都这样做了，而且都声称这样做是为了配合英语为基础的 AI 网络所允许的创新速度。而这种速度主要受到访问和训练成本的限制。

每个人都希望花尽可能少的钱获得尽可能多的东西，这是很自然的。而这些动态直接影响根据基础语言进行 LLM 培训和部署的成本。人工智能业务是如此复杂，其影响如此深远，我们必须非常小心地采取每一个小步骤。

（举报）

相关推荐

关键词：

跨境支付的未来：人工智能、嵌入式金融和即时结算

本文系统分析了人工智能、嵌入式金融与即时结算三大技术趋势如何重构跨境支付体系。人工智能通过智能填单、动态风控和预测性维护显著提升支付效率与安全性；嵌入式金融将支付功能无缝融入电商平台与供应链，实现“无跳转支付”；即时结算技术将跨境支付时间从数日缩短至秒级，并优化现金流。三大技术深度融合形成协同效应，推动跨境支付向更智能、高效、无缝�

全球支付生态数字化浪潮跨境支付体系
人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

AI应用落地面临“最后一公里”部署难题：传统流程繁琐耗时，从模型开发到上线需数周。英特尔携手戴尔与零克云打造“工作站-AI PC-云端”协同生态，通过本地工作站进行小规模测试验证，降低试错成本与数据泄露风险，再通过“一键部署”快速扩展至云端规模化落地。这种“先本地验证、后云端放大”的路径显著提升开发效率，释放团队创造力，让有价值的AI想法快速照进现实。

AI部署模型上线服务器配置
简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案，标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑，该模型围绕用户兴趣成长周期设计，提供个性化学习支持：可为未明确兴趣方向的用户智能推荐内容，为入门用户规划学习路径，为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖，并通过社群互动增强学习动力。公司未来将持续优化模型能力，联合行业伙伴构建完整培养体系，推动兴趣教育向个性化、高质量方向发展。

简智AI大模型生成式人工智能兴趣教育
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济
小米AI眼镜推出1.4.16.0固件版本支持英语口语陪练

小米首款AI眼镜近日推出1.4.16.0版固件更新，新增抖音直播、小爱控车等功能，并修复已知问题。亮点包括：支持英语口语陪练，用户可自由对话练习；语音控制小米汽车，查询车辆状态；优化小爱同学响应，实现高效指令操作；新增直播功能，满足多样化需求。该眼镜配备1200万像素主摄、五麦克风阵列等硬件，搭载骁龙AR1芯片，具备物体识别、翻译等AI能力，全面提升使用体验。

小米AI眼镜固件更新英语口语陪练
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
遇到平板电池问题，试试联想想帮帮AI服务智能体的AI智修功能

联想推出“想帮帮AI服务智能体”，通过AI智修功能解决手机/平板常见故障。用户只需在APP中输入问题，AI即可自动检测电池耗电快、断触、游戏卡顿等异常，结合知识库智能诊断并执行修复。系统具备主动预警、自动修复能力，严重故障时可协助预约售后。该服务覆盖设备全生命周期，提供快速定位、即时处理的一站式解决方案，让用户告别手动排查烦恼。

手机电池耗电快打游戏断触平板断触

今日大家都在搜的词：

热文

3 天
7天

英语的人工智能使用费比其他语言便宜 15 倍简体中文成本约为英语的两倍

跨境支付的未来：人工智能、嵌入式金融和即时结算

人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

人工智能巨头OpenAI拟上市估值或高达1万亿美元

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

小米AI眼镜推出1.4.16.0固件版本支持英语口语陪练

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

遇到平板电池问题，试试联想想帮帮AI服务智能体的AI智修功能

今日大家都在搜的词：

热文

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

董明珠再回应玫瑰空调：创新尝试打造家电艺术品

华为Mate X7今日开启预订搭载第二代红枫影像等配置

AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异

苹果回应iPhone17PM被湿巾擦掉色：高浓度酒精或是诱因

参与开发iPhoneAir设计师离职转投AI初创公司

华为FreeBuds Pro 5悦彰耳机价格公布：1449元支持星闪音频

快手发布2025年第三季度财报：可灵AI营业收入超3亿元

小米端到端辅助驾驶“Xiaomi HAD增强版”将于11月12日发布

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

阿里巴巴回应千问崩了：状态良好欢迎来问

荣耀500系列官宣将于11月24日发布

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

小米超级小爱AI大模型推出随心修图功能

站长商机

英语的人工智能使用费比其他语言便宜 15 倍 简体中文成本约为英语的两倍

今日大家都在搜的词：

热文

站长商机

英语的人工智能使用费比其他语言便宜 15 倍简体中文成本约为英语的两倍