首页 > 业界 > 关键词  > BloombergGPT最新资讯  > 正文

彭博进军AI大语言模型 针对金融业推BloombergGPT

2023-04-04 11:35 · 稿源:站长之家

站长之家(ChinaZ.com)4月4日 消息:多家科技巨头正在扎堆构建大型语言模型,但最让人感到意外的一家公司可以说是是金融数据和新闻行业巨头彭博

彭博由前纽约大佬 Mike Bloomberg 创立,是一家拥有量化新闻部门的金融数据公司,最近这家公司进军了AI大型语言模型领域,推出了BloombergGPT。该公司表示,该大语言模型(LLM)专门针对各类金融数据进行训练,以全方位支持金融领域的自然语言处理(NLP)任务。

image.png

彭博表示,基于LLM的人工智能(AI)已经在许多领域都展示出令人兴奋的新应用。然而,由于金融行业的复杂性并且含有大量金融术语,仍需要一个专攻金融专业的模型。

BloombergGPT 将用于金融 NLP 任务,例如情绪分析、命名实体识别、新闻分类和问答。

该模型还将用于引入挖掘彭博终端(Bloomberg Terminal)海量数据的新方法。多年来,彭博终端一直使用功能键和复杂的用户界面。

Bloomberg 首席技术官 Shawn Edwards 在一篇博客中表示,与为每个应用程序创建自定义模型相比,BloombergGPT 将使公司能够更快地处理新型应用程序,一开始就具有“更高的性能”。

BloombergGPT到底如何呢?

就训练规模而言,BloombergGPT 由500亿个参数组成。相比之下 OpenAI 的GPT-3使用了1750亿个参数。

在 LLM中,BloombergGPT 还是相对较小,与其相近的是 Meta 的650亿参数的LLaMA 模型。当然,BloombergGPT 是专门针对高度特定的金融 NLP 任务进行训练的,这意味着它不需要像 OpenAI 模型那样更通用的数据。

该模型是通过使用 Bloomberg 广泛的金融数据存档创建的,包含3,630亿词例(token)的金融数据集,这批数据又与另一个包含3,450亿词例的公共数据集叠加,成为了包含超7,000亿词例的大型训练语料库。

Bloomberg ML 工程师随后训练了一个500亿参数的仅解码器因果语言模型,生成的模型在特定于金融的 NLP 基准以及一套内部标准上进行了验证。

就BIG-bench Hard和MMLU等流行的 NLP基准而言,彭博社表示,BloombergGPT模型在金融任务上的表现远超类似规模的开放模型,而在一般NLP基准上的表现也达到甚至超过了平均水平。

对于特定于金融的基准测试,BloombergGPT 可以与更大的开源模型相媲美,例如Bloom和OPT-66B。Bloomberg 的得分也高于 Hugging Face 的GPT-NeoX等较小的开源模型。

然而,在更一般的基准测试中,BloombergGPT 对比 OpenAI 的 GPT-3,只取得了相差不远的结果。

图片

BloombergGPT在两大类NLP任务中的表现:金融专业任务和一般任务。

LLM池塘来了一条新鱼

OpenAI和谷歌正在使用他们的大型语言模型来为代码生成和生产工作流程改进等任务提供新的产品。

但随着对 LLM 兴趣的增加,开发自家模型的玩家数量也在增加。就在上周,芯片制造初创公司 Cerebras推出了在其 AI 超级计算机 Andromeda 上训练的大型语言模型。Salesforce为客户关系管理创建了EinsteinGPT 。

训练这些模型的巨大成本可能会让很多企业放弃开发自己的模型。

但也有例外,比如斯坦福大学的 AI 研究人员推出了语言模型Alpaca,其训练成本仅为600美元。另外一个例子是,Databricks 展示了开发成本仅需30美元的ChatGPT 克隆版Dolly 。

然而在大家扎堆开发大语言模型的背景下,马斯克等千名科技人士签署公开信,呼吁暂停训练比GPT-4更强大的AI系统,以研究它们的影响。这封公开信由非营利性组织Future of Life Institute发布,信的开头写道:“广泛的研究表明,具有与人类竞争智能的AI系统可能会对社会和人类造成深远的风险,这一点也得到了顶级AI实验室的承认。”公开信指出:“只有在我们确信它们的效果是积极的,风险是可控的,才应该开发强大的人工智能系统。”

然而,这个想法遭到了图灵奖获得者 Yann LeCun 等人的嘲笑。

举报

  • 相关推荐
  • 从单点突破到生态构建,盈米基金AI开放平台赋能金融业智能升级

    近日,盈米基金在广州举办"AI势能+Tech Day·财富管理专场"闭门研讨会,30家国内顶尖金融机构的大模型专家参会。盈米基金高级技术总监梁仲智提出"AI协同转型"概念,强调企业需将能力"再资产化",通过数据治理和接口改造实现AI友好化。盈米推出AI开放平台,将投研、投顾等核心能力封装成API供AI调用,并上线MCP Server提供30多个金融工具。实践显示,AI协同使财务报告生成时间从3小时缩短至3分钟,投顾服务"AI小顾"累计服务超10万用户。梁仲智认为,AI协同不仅是技术引入,更是涉及组织架构和生产关系的深刻变革,未来职场角色将向"服务AI"和"业务交付"两端集中。这场"智力革命"正在重塑企业的价值创造方式。

  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • Manus与Lovart之后,又一颠覆B2B外贸行业的智能体来了!信风AI引智能化拓客浪潮

    我们见过太多传统的外贸获客方式:买一份客户数据、雇几个人做电话/邮件、甚至手动跑展会、查黄页、看海关单。但这些方法普遍存在两个问题——效率低、成本高。尤其是试图开拓新市场时,语言不通、信息不全、时间滞后,成了外贸人绕不开的难题。

  • OpenAI 进军硬件领域,将收购 Jony Ive 的 AI 创业公司

    OpenAI 山姆·奥特曼与前苹果首席设计师 Jony Ive共同公布了一项合作计划:打造下一代 AI 智能设备……

  • AI日报:Anthropic推最强编码AI模型Claude4;苹果计划推AI智能眼镜;QQ浏览器上线首个高考Agent

    【AI日报】今日AI领域重要动态:1)Anthropic发布Claude4系列AI模型,编程能力超越竞争对手;2)苹果计划2026年推出集成AI技术的智能眼镜;3)字节跳动与清华合作推出时序多模态大模型ChatTS;4)3DTown框架实现单张照片生成逼真3D场景;5)OpenAI秘密开发无屏幕AI设备;6)商汤科技推出儿童AI下棋机器人;7)微软记事本新增AI写作功能;8)深圳设立70亿元基金支持AI硬件初创企业;9)谷歌发布3D视频通信平台Beam;10)阿联酋推出"星际之门"计划,免费提供ChatGPT服务;11)法国Mistral推出开源模型Devstral;12)Anthropic API新增四大功能;13)美国众议院通过法案限制各州监管AI;14)QQ浏览器推出高考AI助手。

  • B站的最大商业化机会,其实还在AI里

    B站在2025年第一季度财报中交出了营收70亿元、GAAP净利润达3.6亿元的成绩单,市场目光也大多聚焦在游戏业务76%的惊人增长上——通过《三国:谋定天下》的强势表现,让投资者看到了这家“慢公司”似乎找到了持续赚钱的方法。 不过,游戏业务起起伏伏这件事对于B站来说早是“习惯”,其曾凭借FGO式吸金神话让市场振奋,后期则逐渐淡化,那么,如果将视线从短期财务数据�

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • IBM高管详解如何加速企业AI应用:Agent是路径,不是噱头

    IBM在2025 Think大会上提出,企业AI竞争已从实验阶段转向实际应用阶段,关键在于定制化AI解决方案和可量化的业务成果。IBM强调企业级AI Agent需具备"动手能力",能嵌入业务流程、完成任务并监控维护,而非仅是对话助手。其watsonx平台构建了模型、数据、任务执行的完整技术栈,并通过三层架构(交互层、任务分解层、系统连接层)实现闭环运行。IBM还推出"AgentOps"体系,将智能体模块化、服务化,建立能力目录和监控机制,解决企业部署AI Agent时的系统对接、价值评估和管理难题。实践案例显示,制造业设备巡检Agent可节省70%人力成本。IBM认为AI Agent是企业数字化能力的延伸,需与业务流程深度融合,而非追赶技术潮流。