彭博进军AI大语言模型针对金融业推BloombergGPT

2023-04-04 11:35 · 稿源：站长之家

站长之家（ChinaZ.com）4月4日消息:多家科技巨头正在扎堆构建大型语言模型，但最让人感到意外的一家公司可以说是是金融数据和新闻行业巨头彭博。

彭博由前纽约大佬 Mike Bloomberg 创立，是一家拥有量化新闻部门的金融数据公司，最近这家公司进军了AI大型语言模型领域，推出了BloombergGPT。该公司表示，该大语言模型（LLM）专门针对各类金融数据进行训练，以全方位支持金融领域的自然语言处理(NLP)任务。

彭博表示，基于LLM的人工智能（AI）已经在许多领域都展示出令人兴奋的新应用。然而，由于金融行业的复杂性并且含有大量金融术语，仍需要一个专攻金融专业的模型。

BloombergGPT 将用于金融 NLP 任务，例如情绪分析、命名实体识别、新闻分类和问答。

该模型还将用于引入挖掘彭博终端（Bloomberg Terminal）海量数据的新方法。多年来，彭博终端一直使用功能键和复杂的用户界面。

Bloomberg 首席技术官 Shawn Edwards 在一篇博客中表示，与为每个应用程序创建自定义模型相比，BloombergGPT 将使公司能够更快地处理新型应用程序，一开始就具有“更高的性能”。

BloombergGPT到底如何呢?

就训练规模而言，BloombergGPT 由500亿个参数组成。相比之下 OpenAI 的GPT-3使用了1750亿个参数。

在 LLM中，BloombergGPT 还是相对较小，与其相近的是 Meta 的650亿参数的LLaMA 模型。当然，BloombergGPT 是专门针对高度特定的金融 NLP 任务进行训练的，这意味着它不需要像 OpenAI 模型那样更通用的数据。

该模型是通过使用 Bloomberg 广泛的金融数据存档创建的，包含3，630亿词例（token）的金融数据集，这批数据又与另一个包含3，450亿词例的公共数据集叠加，成为了包含超7，000亿词例的大型训练语料库。

Bloomberg ML 工程师随后训练了一个500亿参数的仅解码器因果语言模型，生成的模型在特定于金融的 NLP 基准以及一套内部标准上进行了验证。

就BIG-bench Hard和MMLU等流行的 NLP基准而言，彭博社表示，BloombergGPT模型在金融任务上的表现远超类似规模的开放模型，而在一般NLP基准上的表现也达到甚至超过了平均水平。

对于特定于金融的基准测试，BloombergGPT 可以与更大的开源模型相媲美，例如Bloom和OPT-66B。Bloomberg 的得分也高于 Hugging Face 的GPT-NeoX等较小的开源模型。

然而，在更一般的基准测试中，BloombergGPT 对比 OpenAI 的 GPT-3，只取得了相差不远的结果。

BloombergGPT在两大类NLP任务中的表现:金融专业任务和一般任务。

LLM池塘来了一条新鱼

OpenAI和谷歌正在使用他们的大型语言模型来为代码生成和生产工作流程改进等任务提供新的产品。

但随着对 LLM 兴趣的增加，开发自家模型的玩家数量也在增加。就在上周，芯片制造初创公司 Cerebras推出了在其 AI 超级计算机 Andromeda 上训练的大型语言模型。Salesforce为客户关系管理创建了EinsteinGPT 。

训练这些模型的巨大成本可能会让很多企业放弃开发自己的模型。

但也有例外，比如斯坦福大学的 AI 研究人员推出了语言模型Alpaca，其训练成本仅为600美元。另外一个例子是，Databricks 展示了开发成本仅需30美元的ChatGPT 克隆版Dolly 。

然而在大家扎堆开发大语言模型的背景下，马斯克等千名科技人士签署公开信，呼吁暂停训练比GPT-4更强大的AI系统，以研究它们的影响。这封公开信由非营利性组织Future of Life Institute发布，信的开头写道:“广泛的研究表明，具有与人类竞争智能的AI系统可能会对社会和人类造成深远的风险，这一点也得到了顶级AI实验室的承认。”公开信指出:“只有在我们确信它们的效果是积极的，风险是可控的，才应该开发强大的人工智能系统。”

然而，这个想法遭到了图灵奖获得者 Yann LeCun 等人的嘲笑。

（举报）

相关推荐

关键词：

荐AI日报：GPT-5-Auto现身Mac客户端；阿里开源WebAgent项目WebShaper；腾讯推X-Omni多模态模型

【AI日报】今日AI领域重要动态：1）阿里开源WebAgent项目WebShaper，GAIA评测超越Claude4-Sonnet；2）Moonvalley推出草图转视频功能，支持手绘生成电影级视频；3）腾讯X-Omni模型实现图文理解重大突破；4）百度搜索测试AI应用中心入口；5）Midjourney+新增个性化推荐功能；6）GPT-5或于2025年夏季发布；7）Ollama推出桌面客户端；8）OWL团队开源多智能体协作工具Eigent；9）OpenAI年收入激增至120亿美元；10）英伟达H20芯片因安全风险被约谈；11）万兴科技天幕2.0模型国内排名第四，与华为云共建AI视频实验室。

人工智能 AI产品技术趋势
AI 大模型选型指导：一文实测 Kimi‑K2‑Turbo‑Preview 与 Qwen3‑Coder‑Flash

本文对比分析了Kimi-K2-Turbo-Preview和Qwen3-Coder-Flash两款AI大模型在开发者选型中的表现。K2-Turbo采用MoE架构，激活参数32B，支持128K上下文，在代码调试和自动化流程方面表现突出；Qwen3-Coder为480B参数的MoE模型，原生支持256K上下文，擅长大规模代码库理解和API集成。二者在中级任务表现接近，但K2在复杂可视化任务更优，Qwen3在多轮Agent调用更稳定。建议根据需求选择：注重调试自动化选K2，需要长上下文支持选Qwen3。推荐使用AIbase模型广场进行高效选型对比。

AI大模型选型编码能力对比性能评测
iQOO Z10 Turbo+官宣8月7日发布

今日，iQOO手机正式宣布，全新性能旗舰iQOO Z10Turbo+将于8月7日19:00全球首发，并同步开启全渠道销售。即日起，用户可通过各大电商平台及线下门店预约新机，首销期间可享价值2214元的专属礼包，包含一年延保、三年电池保障服务及一年后盖换新等权益。作为行业首款搭载8000mAh超薄蓝海电池的性能机型，iQOO Z10Turbo+凭借“续航怪兽”属性引发关注。官方实测数据显示，该机可�

iQOO Z10Turbo+ 性能旗舰
天狮李金元：用Globast供应链撬动全球大健康版图

天狮集团董事局主席李金元33年深耕大健康产业，打造全球供应链网络Globast。该系统通过智能算法预测需求、区块链技术溯源产品，实现224个国家和地区的物流高效协同。社交电商结合拼团玩法提升复购率，数字化供应链使跨境响应时间缩短、库存成本降低。李金元将供应链视为大健康产业的生命线，以天津为起点构建全球化通路，持续推动产业版图扩张。

数字经济天狮集团李金元
荐AI日报：字节发布同声传译模型Seed LiveInterpret 2.0；秘塔搜索API上线；Lovart AI正式版全球发布

AI日报栏目报道了多项AI领域最新进展：1)字节跳动发布端到端同声传译模型Seed LiveInterpret 2.0，实现中英高质量实时翻译；2)秘塔搜索API上线，提供低价多模态搜索服务；3)Lovart AI正式版发布，作为首个AI设计Agent重塑创作流程；4)李沐团队推出Higgs Audio v2语音合成模型，融合千万小时训练数据；5)OpenAI开发Sora2视频生成模型，与谷歌Veo3展开竞争；6)OpenAI与Oracle合作扩展Stargate项目，�

人工智能同声传译字节跳动
751万粉丝网红迅猛龙正式入读复旦大学：非全日制MBA项目

日前，复旦MBA聚劲2025”班级见面会在复旦管院政立院区举行。现场照片显示，拥有超过751万粉丝的网红博主迅猛龙特蕾莎”（真名许锴蓥），作为管理学院2025级MBA新生，入读复旦。据了解，许锴蓥考取的是复旦非全日制MBA，她以管综140分、英语二83分，总分223分的成绩被复旦大学管理学院工商管理专业录取。

复旦MBA 网红博主考研经历
荐AI日报：可灵发布灵动画布创意工作台；Coze Studio和Loop正式开源；WPS AI 3.0灵犀版本发布

【AI日报】汇总了近期AI领域重要动态：1)字节跳动开源Coze两大核心项目，降低AI开发门槛；2)可灵AI发布"灵动画布"创意工作台，创作者突破4500万；3)Runway推出视频编辑模型Aleph，支持自然语言指令操作；4)金山办公发布WPS AI 3.0，实现智能文档创作；5)京东升级大模型品牌JoyAI；6)浦东设立20亿AI种子基金；7)阿里开源WebSailor框架提升信息检索效率；8)我国大模型数量突破1500个，居全球领先；9)蚂蚁数科联合发布金融大模型评测基准；10)腾讯开源混元3D世界模型，支持360°场景生成。

字节跳动 Coze Studio
如何精准锁定高性价比的AI大模型？AIbase AI模型费用计算器助力开发者省心省钱选模型

文章探讨了在预算有限的情况下如何选择合适的大模型API。面对GPT-4、Claude2、Llama2等数十种模型，开发者常陷入选择困境：既要考虑性能，又要兼顾成本。不同厂商的计费机制复杂多样（按Token、请求次数或时间），手动计算耗时且容易出错。文章推荐使用AIbase的AI模型费用计算器，该工具聚合主流模型定价数据，支持可视化交互计算，能快速比较不同场景下的使用成本，帮助�

大模型选择 AI应用开发 API调用成本
实战指南:AI大模型使用费用预测怎么做?AIbase大模型费用计算器帮你告别成本“黑箱”

本文探讨了如何预测AI大模型使用费用，并介绍了AIbase费用计算工具的价值。随着ChatGPT等大模型的普及，企业面临高昂API费用、复杂Token计费模式等问题。文章提出四个关键步骤：1)量化使用规模，包括调用量、Token消耗等；2)深入解读定价模型，注意输入/输出Token价差、上下文窗口等隐藏成本；3)构建预测模型，推荐使用AIbase等专业工具进行多模型成本对比；4)持续监控优化。AI

AI大模型费用预测成本控制
荐AI日报：阿里推全新图片模型Qwen-Image；小米全量开源MiDashengLM-7B；智谱Zread.ai搭载 GLM-4.5

本文汇总了AI领域最新动态：1)阿里开源文生图模型Qwen-Image，中文文本渲染领先；2)ChatGPT周活用户达7亿，OpenAI年收入120亿美元；3)Anthropic测试Claude Opus 4.1，推理能力升级；4)智谱推出开发工具Zread.ai提升代码理解效率；5)xAI发布Grok Imagine4支持文生视频及NSFW内容；6)Character.AI推出首个AI原生社交功能；7)阿里与南开合作视频压缩技术LLaVA-Scissor；8)北京团队突破人形机器人3D视觉系统�

人工智能文生图模型阿里通义千问

热文

3 天
7天

彭博进军AI大语言模型针对金融业推BloombergGPT

荐AI日报：GPT-5-Auto现身Mac客户端；阿里开源WebAgent项目WebShaper；腾讯推X-Omni多模态模型

AI 大模型选型指导：一文实测 Kimi‑K2‑Turbo‑Preview 与 Qwen3‑Coder‑Flash

iQOO Z10 Turbo+官宣8月7日发布

天狮李金元：用Globast供应链撬动全球大健康版图

荐AI日报：字节发布同声传译模型Seed LiveInterpret 2.0；秘塔搜索API上线；Lovart AI正式版全球发布

751万粉丝网红迅猛龙正式入读复旦大学：非全日制MBA项目

荐AI日报：可灵发布灵动画布创意工作台；Coze Studio和Loop正式开源；WPS AI 3.0灵犀版本发布

如何精准锁定高性价比的AI大模型？AIbase AI模型费用计算器助力开发者省心省钱选模型

实战指南:AI大模型使用费用预测怎么做?AIbase大模型费用计算器帮你告别成本“黑箱”

荐AI日报：阿里推全新图片模型Qwen-Image；小米全量开源MiDashengLM-7B；智谱Zread.ai搭载 GLM-4.5

热文

理想回应和乘龙重卡碰撞测试：被卷入舆情争议实属无心之举

法拉第方回应新车抄袭长城：联合开发不存在抄袭

AI日报：混元推四款小尺寸开源模型；昆仑万维发布新推理大模型

荣耀畅玩70 Plus发布：骁龙6系芯片国补售价1019.15元起

AI日报：阿里推全新图片模型Qwen-Image；小米全量开源MiDashen

理想i8宣布统一版本：标配即顶配并降价1万元

第五人格崩了上热搜网易旗下多款游戏回应：紧急排查中

微信员工辟谣改日期恢复过期文件：纯属谣言

李想回应理想i8统一配置版本：此前陷入惯性思维

苹果iOS 26 Beta 5上线：细节优化更新内容一览

腾讯客服回应微信提现手续费下降：已进行全量更新

理想回应和乘龙重卡碰撞测试：被卷入舆情争议实属无心之举

AI日报：Kimi K2 高速版发布；美图WHEE上线视频超清功能；字节

理想邀请乘龙卡车直播对撞东风柳汽：理想撞卡车视频严重侵权

REDMI Pad 2开售：售价999元起 11英寸2.5K大屏

法拉第方回应新车抄袭长城：联合开发不存在抄袭

AI日报：混元推四款小尺寸开源模型；昆仑万维发布新推理大模型

小米汽车7月交付量超30000台创历史新高

荣耀畅玩70 Plus发布：骁龙6系芯片国补售价1019.15元起

AI日报：阿里推全新图片模型Qwen-Image；小米全量开源MiDashen

站长商机

彭博进军AI大语言模型 针对金融业推BloombergGPT

热文

站长商机

彭博进军AI大语言模型针对金融业推BloombergGPT