首页 > AI头条  > 正文

蚂蚁数科重磅发布金融推理大模型 Agentar-Fin-R1

2025-07-29 10:32 · 来源: AIbase基地

在今日举行的世界人工智能大会论坛上,蚂蚁数科隆重推出其最新研发的金融推理大模型 ——Agentar-Fin-R1。这款模型是基于阿里巴巴的通义千问 Qwen3大模型打造,专注于金融行业的专业性、推理能力以及安全合规能力,旨在为金融机构提供一个 “可靠、可控、可优化” 的智能中枢。

Agentar-Fin-R1在多个权威评测基准上表现出色,不仅超越了同尺寸的开源通用大模型 Deepseek-R1,还在 FinEval1.0和 FinanceIQ 等金融大模型评测中取得了优异的成绩。这一成果表明,蚂蚁数科在金融领域的 AI 应用已然迈入了新的高度。

image.png

为了满足不同金融机构在多样化场景下的需求,Agentar-Fin-R1提供了32B 和8B 参数两个版本,此外还有非推理版本的14B 和72B 参数模型。蚂蚁数科的 CEO 赵闻飙在发布会上表示,当前通用大模型与产业实际应用之间存在 “知识鸿沟”,因此构建专业的金融大模型是金融与 AI 深度融合的必然之路。未来,金融大模型的应用深度将成为金融机构竞争力的关键因素。

在数据层面,蚂蚁数科构建了一个业内最全面的金融任务分类体系,包括6大类、66小类场景,覆盖银行、证券、保险、基金、信托等金融全场景。借助千亿级金融专业数据语料和专家标注的金融长思维链(CoT)构造机制,Agentar-Fin-R1展现出其 “天生懂金融” 的能力。

如今,蚂蚁数科已经帮助上海某银行打造出一款 “AI 手机银行”,为用户提供自然对话式的金融服务。这种 “对话即服务” 的模式不仅提升了老年客户的满意度,还使得月活用户同比增长了25%。

论文地址:https://arxiv.org/pdf/2507.16802

  • 相关推荐
  • 北大张牧涵团队依托昇腾突破推理效率瓶颈 大模型推理百万tokens 成本仅 1 元

    北京大学张牧涵团队在昇腾算力支持下,研发出一套高效大模型训练推理架构,实现百万tokens输入成本低至1元。该成果包含三项关键技术:1)通过分离注意力头中的位置与非位置信息,仅用3%位置信息即可维持模型性能;2)采用联合KV低秩压缩方法,仅保留12.5%的KV Cache;3)基于昇腾硬件并行计算能力,实现Recurrent Decoding技术提升训练数据利用率。该架构显著降低AI大模型应用成本,验证了昇腾算力平台支撑尖端科研的实力。

  • A日报:Stability AI发布实时重建模型SPAR3D;火山引擎“奇美拉”数字人平台启动封测;京东重磅开源JoyAgent-JDGenie

    AI日报栏目精选了人工智能领域最新动态:1)Stability AI推出0.7秒单图3D重建模型SPAR3D;2)GitHub热门开源AI协作框架CrewAI获3.4万星;3)马斯克发布儿童AI聊天机器人Baby Grok引发安全争议;4)ComfyUI-C opilot工具简化AI工作流创建;5)CNNIC报告显示我国346款生成式AI完成备案;6)提示词管理工具AI Gist上线;7)开源语言学习工具WordPecker支持多语言学习;8)斯坦福推出多工具协作AI Agent OctoTools;9)Ope

  • OpenAI发布ChatGPT Agent智能体:支持写代码、做PPT、分析金融

    OpenAI推出ChatGPT智能体,整合网页交互、数据搜索与多模态协作功能,可完成代码生成、PPT制作、金融分析等复杂任务。该智能体融合Operator的网页自动化操作、Deep Research的数据分析能力及优化后的GPT-4对话引擎三大核心模块。目前面向付费用户开放,Pro版近乎无限使用,其他版本每月限50次任务。OpenAI承认其仍存在金融建模需人工验证、非英语文本解析准确率低等技术局限,并

  • PPIO亮相WAIC 2025,重磅推出国内首个Agentic AI基础设施服务平台

    7月26日至29日,中国领先的分布式云服务商PPIO在2025世界人工智能大会上发布国内首个Agentic+AI基础设施服务平台,加速智能体应用开发。平台推出通用版和企业版:通用版提供高性价比分布式GPU云底座,兼容E2B接口的智能体沙箱环境;企业版支持多模态协同、长时记忆等五大差异化功能,构建决策到执行闭环。PPIO智能体沙箱基于Firecracker微虚拟机技术,具备毫秒级启动、强隔离等特性,成本仅为行业标准的50%以下。在教育领域已有落地案例,帮助学校实现备课效率提升50%以上。CEO姚欣表示,该平台将降低开发者门槛,推动智能体从技术探索迈向规模化应用新阶段。

  • 从管理工具向“增长伙伴”蜕变 Agent重构CRM价值体系

    销售易在腾讯云城市峰会上发布中国首款AI+CRM产品NeoAgent,标志着CRM系统从流程化工具向智能化伙伴转型。该产品通过智能录入、场景赋能和自然交互三大功能,实现从被动执行到主动辅助的跨越。NeoAgent依托语音识别、对话解析等技术,能自动提取客户需求等关键信息并结构化存储,大幅降低操作成本。同时打破传统CRM菜单层级限制,通过语音或文字指令快速获取数据,响应速度提升80%以上。产品深度整合企业销售方法论与客户数据,为具体场景提供精准建议,并通过"湖仓一体"数据平台确保信息实时更新。其每月迭代机制紧密依赖业务场景,已成功应用于客户画像、渠道管理等场景,形成"试用-反馈-迭代-转化"闭环。

  • A日报:Kimi开放平台上线Kimi Playground;OpenAI重磅发布ChatGPT Agent;Suno推人声替换功能

    【AI日报】汇总了近期AI领域重要进展:1)月之暗面推出Kimi Playground平台,实现从对话助手到智能助理的转变;2)OpenAI发布ChatGPT Agent,支持自主执行浏览、购物等任务;3)Suno发布v4.5+版本,新增人声替换等音乐创作功能;4)谷歌Veo3视频生成模型上线,支持文本转视频;5)全球首个直播流扩散模型MirageLSD发布,实现实时视频转换;6)VSCode编程助手Traycer提升大型代码库处理效率;7)ART框架支持Python一键训练AI Agent;8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低;9)Mistral AI推出Le Chat挑战ChatGPT;10)百度小度上线首个支持物理交互的MCP Server;11)Lightricks的LTXV模型实现60秒高质量视频生成;12)开源模型LTX-Video13B支持30倍速高清视频生成。

  • 华为小艺AI竞赛Agent首战国际数学奥林匹克大赛(IMO)荣获佳绩!

    华为AI"小艺"在2025年国际数学奥赛(IMO)中斩获银牌,以34分(满分42分)的成绩仅落后金牌线1分。其创新性的"自然语言大模型+形式化证明"双脑协同架构,攻克了5道难题,其中4道获满分。该系统通过"思维风暴"生成多样化解题思路,再经"AI同行评审"筛选最优方案,并融合形式化验证反馈进行迭代优化。这一突破标志着AI在复杂数学推理领域达到新高度,未来将赋能教育领域,推动智能解题方法创新。IMO主席Gregor Dolinar教授评价其答卷"展现了非凡的成就"。

  • 每日互动AI一体机GAI Station:安全融合大模型与大数据 高效驱动企业业务增长

    文章介绍了GAI+Station智能工作站如何解决大模型产业应用中的安全与效率难题。该产品采用"本地小模型+云端大模型"混合部署模式,确保敏感数据不出域的同时调用大模型能力,支持27+文档格式解析和8大模型能力,可快速构建企业知识库。其特色包括:1)数据安全可控,原始数据本地处理;2)深度整合业务流与数据库,提升决策效率;3)预置16大权威知识库,支持行业定�

  • 钛动首战WAIC:用全球营销AI Agent重构出海底层逻辑

    2025世界人工智能大会(WAIC)在上海开幕,全球AI领域目光聚焦于此。钜动科技首次亮相大会,发布全球首个营销AI+Agent——Navos,覆盖营销全链路多个环节,助力企业出海营销效率提升。Navos通过多角色Agent协同,实现从洞察到优化的全流程智能化,并整合行业大数据提供精准决策。同时展出的智能创意营销工具Tec-Creative2.0,运用AIGC技术快速生成爆款营销素材。钜动科技CEO李述昊表示,AI正打破文化差异和效率瓶颈,推动营销从"经验驱动"迈向"智能决策"新时代。

  • 专为企业打造的智能体中台来了!迈富时AI-Agentforce 2.0让Agent正式走向工作岗位

    Gartner预测到2028年,15%的日常工作决策将由自主智能代理完成。迈富时最新发布的AI-Agentforce2.0作为企业级智能体中台,采用"技术赋能+场景落地"双轴驱动模式,重新定义企业智能化转型路径。该平台通过"模型-应用-开发平台"三位一体架构,提供从底层能力到上层应用的完整闭环,包含五大技术模块:模型管理、知识引擎、工具生态、流程编排和企业级基座。相比传统开发方式,该平台将Agent开发周期从3-6个月缩短至2分钟-2周,并已在金融、零售、供应链等行业实现规模化落地,典型应用包括智能导购、财务审批等场景。

今日大家都在搜的词: