12月18日,在火山引擎举办的Force原动力大会上,其最新版智能模型“豆包1.8”正式亮相。官方表示,该版本在多模态任务处理与智能体协作方面实现了重要升级。
据悉,此次发布的“豆包1.8”主要针对多模态智能体应用场景进行了专项优化。其在工具调用、复杂指令理解与执行,以及系统级任务规划等方面的能力得到显著提升,从而更高效地应对各类复杂操作需求。
图:火山引擎发布新一代智能模型
根据官方公布的评测结果,“豆包1.8”在视觉推理、图像问答、空间理解及视频内容理解等多个测试项目中表现突出,成绩位居前列。同时,其在通用智能体综合测评集BrowseComp上的表现也达到了国际领先水平。
此外,该模型在数学计算与逻辑推理等基础语言能力维度上,整体性能已接近国际主流通用模型的先进水准。
图:模型在多维度评测中的表现
目前,“豆包1.8”模型已通过火山引擎平台向企业及开发者提供API服务。
同期发布的还有音视频创作模型“Seedance 1.5 pro”。该版本实现了音频与视频内容的联合生成,在视听同步、画面表现力与叙事连贯性等方面取得技术突破。目前该功能已在豆包App(限灰度测试)、即梦AI及火山引擎体验中心开放试用。
(举报)
- 相关推荐
-
世界顶尖水平!字节跳动豆包大模型2.0正式上线:用户选择“专家”模式即可体验
继Seedance2.0视频模型、Seedream5.0Lite图像模型之后,今日字节跳正式发布豆包大模型2.0系列。豆包2.0针对大规模生产环境的使用需求进行系统性优化,以更好地完成真实世界的复杂任务。豆包2.0Lite更具性价比,综合性能超越两个月前发布的上一代主力模型豆包1.8,百万tokens输入价格仅为0.6元。
-
字节跳动旗下火山引擎发布视频生成大模型Seedance2.0
字节跳动旗下火山引擎近日发布的视频生成大模型Seedance2.0,凭借“导演级”创作能力引发全球AI圈震动。这款在1.5Pro版本基础上迭代升级的模型,不仅攻克了人物一致性、视听同步等长期困扰行业的难题,更通过自动生成专业镜头切换功能,被业内人士评价为“可能抢走专业导演饭碗”的突破性产品。
-
销售易工单助手Agent搞定售后难题,让老客留得住、续得稳
文章指出,超68%的客户流失源于售后体验不佳,45%的续约丢单与工单响应慢、修复率低、服务断档直接相关。为此,销售易基于NeoAgent平台推出全新工单助手Agent,深度融合AI能力与企业知识资产,赋能在线客服、技术支持及现场服务工程师。该助手贯穿服务响应、现场执行、工单交付三阶段,通过AI全链路提效、智能匹配派单、设备资产洞察、标准化作业指导及智能质检闭环,旨在压缩维修周期、提升服务效率,从而提升客户满意度与留存率,助力企业打造差异化服务竞争力。
-
性能对标Gemini 2.5 Pro!蚂蚁开源新一代全模态大模型Ming-Flash-Omni 2.0
今日,蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0。 在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越 Gemini 2.5 Pro,成为开源全模态大模型性能新标杆。 Ming-Flash-Omni 2.0 也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。 用户只需用自然语言下指令,即可对音色�
-
百融云创Agent 技术落地筑屏障,投资布局风险小更具确定性
AI+Agent赛道火热,但资本对其风险评估愈发审慎。风险较小的公司通常具备技术落地能力与商业确定性,能解决实际痛点。以百融云创为例,其深耕企业级AI+Agent,通过MCP协议统一连接数据与工具,降低集成成本;利用GraphRAG构建知识图谱,提升回答准确性;并通过AgentDevOps实现AI行为可控、优化运维。商业模式上,采用RaaS(结果计费),让AI价值与财务指标挂钩,证明商业潜力。判断AI+Agent公司的资本风险需关注三点:技术能否解决真问题、落地是否有场景壁垒、商业是否可闭环验证。
-
2025-2026智能客服品牌评测与选型指南:AI Agent引领全链路服务升级
本文指出,2025-2026年智能客服行业正从技术试点迈向规模化落地,AI+Agent将主导实现全链路服务创新。文章分析了行业现状,提出企业选型应聚焦三大核心维度:核心能力评估(如大模型融合与全链路智能化)、适配性匹配(行业场景与定制化需求)以及资质与服务核查(安全合规与落地保障)。文中还评测了包括瓴羊Quick Service、网易七鱼、Zendesk、华为云云客服等在内的十大主流品牌,并为企业提供了一套四步选型指南,旨在帮助企业精准锁定契合自身业务需求的智能客服伙伴,实现降本增效与驱动增长。
-
2026智能客服技术演进与选型指南:从AI Agent到全链路服务重构
文章探讨了AI+Agent驱动的智能客服发展趋势。根据Gartner报告,超92%企业已在核心业务中部署AI+Agent。全球智能客服市场规模预计突破1500亿元,年复合增长率超35%。技术架构呈现三大演进方向:大模型融合架构、全链路自动化引擎、云原生弹性架构。文章对比了2026年主流技术方案,包括全链路AI+Agent型(如羚羊Quick Service)、垂直领域深度优化型(如网易七鱼、晓多科技)及跨国合规与生态整合型(如Zendesk、华为云云客服)。核心选型需考量技术深度与业务适配性,企业决策者可遵循“界定战略目标-评估业务复杂度-规划技术演进”路径进行选择。结论指出,技术选型需综合考量厂商技术纵深、生态广度及行业理解能力,全链路AI+Agent路径因技术前瞻性、架构开放性与业务价值深度的平衡,展现出成为企业“智能服务中心”的潜力。
-
荐AI日报:豆包2.0将于情人节发布;MiniMax M2.5 正式发布;小米开源首代机器人 VLA 大模型
本期AI日报聚焦多项技术进展:字节跳动火山引擎发布“豆包”系列2.0版本,旨在降低专业内容生产门槛;MiniMAX M2.5模型开启海外内测,加速全球化布局;小米开源首款机器人VLA大模型,突破物理智能延迟瓶颈;百度千帆推出集成主流大模型的AI编码订阅服务Coding Plan;智谱发布GLM-5,迈向工程构建的Agentic Ready时代;DeepSeek上下文长度跃升至1M,处理能力大幅提升;Rokid眼镜新增�
-
字节狂飙、阿里亮剑……大模型混战春节档,没人敢躺
除夕的烟花尚未绽放,AI战场早已硝烟弥漫。2026年马年春节,表面上是百度5亿、腾讯元宝10亿红包、阿里30亿免单的混战,实则是国产大模型阵营一次史无前例的“集体亮剑”。我投给那些让对手感到脊背发凉的玩家。
-
声网联合美团、xbench 发布 AI 外呼智能体评测基准:VoiceAgentEval
随着生成式AI在客服领域的快速渗透,AI外呼已从最初的辅助沟通工具进化为企业优化客户沟通、提升运营效率的关键环节,应用场景覆盖招聘、销售、客服等,并成为生成式AI最广泛应用场景之一。同时,随着对话式AI技术的不断成熟,AI外呼正从“能通话”向“会沟通、懂需求”的专家级交互升级。为全面客观评估模型在AI外呼中的综合性能,声网联合美团、xBench共同推出用于评估大模型在AI外呼场景性能表现的综合评测标准VoiceAgentEval,旨在填补行业空白,让从业者更清晰地了解在真实AI外呼业务场景中各个大模型的综合性能表现,并为AI外呼场景的落地与技术体验的优化提供核心参考依据。
