蚂蚁数科重磅发布金融推理大模型 Agentar-Fin-R1

2025-07-29 10:32 · 来源： AIbase基地

在今日举行的世界人工智能大会论坛上，蚂蚁数科隆重推出其最新研发的金融推理大模型 ——Agentar-Fin-R1。这款模型是基于阿里巴巴的通义千问 Qwen3大模型打造，专注于金融行业的专业性、推理能力以及安全合规能力，旨在为金融机构提供一个 “可靠、可控、可优化” 的智能中枢。

Agentar-Fin-R1在多个权威评测基准上表现出色，不仅超越了同尺寸的开源通用大模型 Deepseek-R1，还在 FinEval1.0和 FinanceIQ 等金融大模型评测中取得了优异的成绩。这一成果表明，蚂蚁数科在金融领域的 AI 应用已然迈入了新的高度。

为了满足不同金融机构在多样化场景下的需求，Agentar-Fin-R1提供了32B 和8B 参数两个版本，此外还有非推理版本的14B 和72B 参数模型。蚂蚁数科的 CEO 赵闻飙在发布会上表示，当前通用大模型与产业实际应用之间存在 “知识鸿沟”，因此构建专业的金融大模型是金融与 AI 深度融合的必然之路。未来，金融大模型的应用深度将成为金融机构竞争力的关键因素。

在数据层面，蚂蚁数科构建了一个业内最全面的金融任务分类体系，包括6大类、66小类场景，覆盖银行、证券、保险、基金、信托等金融全场景。借助千亿级金融专业数据语料和专家标注的金融长思维链（CoT）构造机制，Agentar-Fin-R1展现出其 “天生懂金融” 的能力。

如今，蚂蚁数科已经帮助上海某银行打造出一款 “AI 手机银行”，为用户提供自然对话式的金融服务。这种 “对话即服务” 的模式不仅提升了老年客户的满意度，还使得月活用户同比增长了25%。

论文地址：https://arxiv.org/pdf/2507.16802

相关推荐

易鑫正式发布汽车金融行业首个Agentic大模型

易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿，响应延迟低于200毫秒，支持语音实时交互，单卡吞吐达370 tokens/秒，可提升获客、风控与运营效率，解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台，研发投入超20亿元，率先实现AI全场景应用，将持续推动智能汽车金融生态建设。

汽车金融大模型易鑫
软件定义汽车的质量革命：AI Agent如何终结座舱OTA的“路测噩梦”

在“软件定义汽车”浪潮下，智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而，传统软件测试模式成本高、耗时长，难以覆盖复杂场景，易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破：需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式，测试工程师角色转向质量策略师。到2027年，超80%企业将集成AI测试工具，汽车行业2025年成为转型关键节点。

软件定义汽车智能汽车座舱体验
从“实时分账”到“智能问数”：汇付天下以“Data Agent”重塑支付业务决策效率

汇付天下作为技术驱动的数字化企业，践行“数字化+国际化”战略，为全球企业提供支付、账户、资金管理及数据集成解决方案。面对海量交易数据处理需求，公司依托火山引擎技术，构建湖仓一体架构，实现毫秒级风控响应与实时分账，并通过Data Agent智能平台支持自然语言查询与业务归因，推动数据驱动运营。该方案以流批一体能力优化数据处理效率，保障业务稳定与合规，助力企业实现全域增长与智能化风控协同。

数字化企业支付收款数据集成
国内首个！火山引擎推出融合国家级智库理论与大规模实战验证的 Data Agent 评测体系

火山引擎推出国内首个融合国家智库理论框架与大规模实战验证的数据智能体评测体系，同步发布《2025数据智能体实践指南》。该体系直面传统评测重技术轻业务、预设答案难适配动态场景、局部能力检验不足三大痛点，确立业务关联性、可操作性与前瞻性设计原则。覆盖分析洞察、可视化呈现、鲁棒性三大核心维度，通过151道测试题量化智能体能力并划分达标/工业可用/专业研究三级标准。采用标准化闭环流程与自动化评分机制，为数字化转型深水区企业提供选型优化依据，推动产业智能化进入精准量化新阶段。

数据智能体评测体系多模态数据
新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

苹果因自研大模型项目遇瓶颈，决定引入谷歌Gemini大模型升级Siri，计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数，将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能，支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送，后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

苹果谷歌Gemini Siri升级
大模型+反诈+算力三重突破腾讯云三项成果闪耀金融科技应用场景大赛

10月30日，2025金融街论坛年会金融科技大会公布“金融科技应用场景大赛”终评结果。腾讯云“金融反电诈治理方案”与“基于TCS的AI异构算力管理平台”凭借技术创新性与场景落地能力，从全国89家机构的280个项目中脱颖而出，双双荣获“十佳应用奖”。腾讯混元大模型信贷助手方案获“探索实践奖”。三大方案在金融风控、算力基座及大模型应用三个关键领域展现突出优势，获专家团高度认可。大赛自2021年启动，已成为金融科技领域极具影响力的赛事平台。

金融科技应用场景大赛腾讯云
一加全球首发！高通骁龙8 Gen5本月正式发布

高通将在本月正式发布全新旗舰平台骁龙8 Gen5。该博主透露，未来高通将会保持双旗舰的芯片布局，分别对标苹果的A和A Pro芯片。

骁龙8 Gen5 高通旗舰平台
机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM，实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用，通过统一“视频流+文本指令→动作轨迹”范式，融合800万条跨任务导航数据，在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施，为规模化商业落地奠定关键基础。

机器狗导航大模型 TrackVLA
苹果发布iOS 26.2 beta 2：动效更流畅、继续适配液态玻璃

苹果今天凌晨发布了iOS 26.2 beta 2，依然在适配更多的液态玻璃效果，并且还优化了动画效果，更流畅丝滑了。以下是本次主要更新内容：游戏库新增排序与筛选功能，支持手柄导航，且在播放过程中可实时更新分数。新版还强化了社交互动功能，用户可以直接从游戏”应用中邀请朋友进行挑战或实时多人游戏，当朋友打破你的高分纪录时，系统还会发送通知，方便你立即�

iOS 26.2 游戏库更新
蚂蚁的AI选择，押注下一个十年

蚂蚁做AI，要往何处去?答案正变得愈发清晰。上周，蚂蚁集团CEO韩歆毅在2025年世界互联网大会上表示，蚂蚁将聚焦AI应用，锚定生活服务、医疗健康服务、金融服务三大领域。尤其在AI健康应用上笃定方向，全力以赴。 “AI的核心价值在应用，”他说，“身心健康、财富增长是每个普通人的最大关切，我们希望用AI让专业服务普惠可及，为大家守护好健康和财富这两件生活

AI应用生活服务医疗健康

今日大家都在搜的词：

热文

3 天
7天

蚂蚁数科重磅发布金融推理大模型 Agentar-Fin-R1

易鑫正式发布汽车金融行业首个Agentic大模型

软件定义汽车的质量革命：AI Agent如何终结座舱OTA的“路测噩梦”

从“实时分账”到“智能问数”：汇付天下以“Data Agent”重塑支付业务决策效率

国内首个！火山引擎推出融合国家级智库理论与大规模实战验证的 Data Agent 评测体系

新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

大模型+反诈+算力三重突破腾讯云三项成果闪耀金融科技应用场景大赛

一加全球首发！高通骁龙8 Gen5本月正式发布

机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

苹果发布iOS 26.2 beta 2：动效更流畅、继续适配液态玻璃

蚂蚁的AI选择，押注下一个十年

今日大家都在搜的词：

热文

iPhone Pocket正式开售：联名三宅一生售价1299元起

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

微信小程序将在iOS端支持接入虚拟支付苹果抽成15%

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

卢伟冰：小米手机双11连续三年国产销量第一

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

95岁巴菲特每周还上5天班此前计划年底退休

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

站长商机