豆包大模型1.6发布：全球梯队！可生成1080p高品质视频

2025-06-12 08:00 · 稿源：快科技

快科技6月12日消息，字节跳动旗下豆包大模型正式升级为1.6版，在推理、数学、指令遵循、Agent等方面的能力均有较大提升，同时豆包视频生成模型Seedance 1.0 pro、豆包语音播客模型也正式发布。

豆包大模型1.6包括三部分，分别是豆包1.6、豆包1.6-thinking、豆包1.6-flash。

其中，豆包1.6支持on/off/auto三种思考模式，豆包1.6-thinking强化了思考能力，支持多模态，在多个权威测评集上达到了全球第一梯队水平。

比如，GPQA Diamond测试成绩达到81.5分，是目前最好的推理模型之一。

再比如，数学测评AIME25成绩达到86.3分，相比豆包1.5深度思考模型大幅提升12.3分。

豆包大模型1.6系列均支持深度思考、多模态理解、256K长上下文(首个)、图形界面操作等能力，能够更好地支持复杂Agent的构建，促进AI生产力的提升。

目前，豆包大模型1.6系列已在火山引擎上线，企业和开发者可调用API体验。

价格方面，按照百万tokens：

0-32k上下文，输入0.8元，输出为8元；

32-128k上下文，输入1.2元，输出16元；

128-256k上下文，输入2.4元，输出24元。

豆包大模型1.6发布：全球第一梯队！可生成1080p高品质视频

豆包视频生成模型Seedance 1.0 pro支持文字与图片输入，可生成多镜头无缝切换的1080p高品质视频，主体运动稳定性与画面自然度较高。

通过调研影视创作者等群体的实际需求，Seedance 1.0 pro不仅将指令遵循、运动稳定性、画面质量等行业共识性指标纳入攻坚方向，同时，也将多任务生成、1080p高清生成、快速视频生成等难题作为核心目标。

新版模型在动态图像生成的各维度上，有较好的综合表现，尤其动作生成、指令遵循等关键能力处于业界前列，推理速度、用户好评度等方面也比较突出。

根据国际知名评测榜单Artificial Analysis，Seedance 1.0 pro在文生视频、图生视频两个任务的表现均排名首位。

豆包大模型1.6发布：全球第一梯队！可生成1080p高品质视频 Artificial Analysis 文生视频榜单，数据截至 2025-06-09 11:00 (GMT 8)

豆包大模型1.6发布：全球第一梯队！可生成1080p高品质视频 Artificial Analysis 图生视频榜单，数据截至 2025-06-09 11:00 (GMT 8)

豆包语音播客模型源于端到端实时语音的进一步拓展，能够实现从文本创作到双人对话式播客作品的秒级生成，同时具备互相附和、插话、犹豫等自然的播客元素生成，达到了媲美真人的生成效果。

用户可以在扣子空间（https://space.coze.cn/）体验语音播客相关功能。

同时，豆包产品已启动小流量测试，近期将全量上线播客模型。

（举报）

相关推荐

关键词：

荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

本期AI日报聚焦多项技术突破：火山引擎发布豆包视频生成模型1.0pro+fast，速度提升3倍且价格下降72%；百度与上海体育大学推出“上体体育大模型2.0”，拓展AI在运动员训练等场景应用；谷歌Gemini新增一键生成PPT功能；美团发布LongCat-Video模型，支持5分钟连贯视频生成；xAI推出虚拟女友Mika引发热议；MiniMax开源高性能M2编码模型；OpenAI上线企业知识管理功能；另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万，展现年轻创业者的技术影响力。

AI 视频生成火山引擎
升级版“蓝心小V”亮相，豆包大模型助力vivo打造AI原生体验

vivo发布全新OriginOS 6系统，升级私人助手“蓝心小V”。该系统依托蓝心大模型与豆包大模型协同，实现精准意图识别与多模态交互，支持新闻、教育、天气等场景的智能问答。通过火山引擎联网搜索及内容整合，提供低延迟、高情感语音响应。同时拓展无障碍服务，为视障用户提供实时视觉辅助。未来将持续深化AI生态建设，打造更智能便捷的原生体验。

originOS6 蓝心小V AI原生操作系统
易鑫正式发布汽车金融行业首个Agentic大模型

易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿，响应延迟低于200毫秒，支持语音实时交互，单卡吞吐达370 tokens/秒，可提升获客、风控与运营效率，解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台，研发投入超20亿元，率先实现AI全场景应用，将持续推动智能汽车金融生态建设。

汽车金融大模型易鑫
荐AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅升级；Soul语音模型SoulX-Podcast发布

本期AI日报聚焦多项技术突破：豆包推出全自动有声剧系统，实现98%角色识别准确率；Adobe Firefly Image 5支持400万像素原生输出及AI音轨生成；Soul发布90分钟无中断播客生成模型；360推出全球首款L2-L4全栈智能平台；IBM发布可在普通设备运行的Granite 4.0 Nano模型。市场方面，移动端AI用户突破7亿，豆包领跑原生应用；PayPal与OpenAI合作使ChatGPT集成支付功能；谷歌推出AI营销工具Pomelli，可基于URL自动生成营销内容。

AI有声剧豆包语音多角色语音合成
机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM，实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用，通过统一“视频流+文本指令→动作轨迹”范式，融合800万条跨任务导航数据，在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施，为规模化商业落地奠定关键基础。

机器狗导航大模型 TrackVLA
何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

小鹏汽车在2025科技日发布第二代VLA大模型，颠覆传统“视觉-语言-动作”架构，实现端到端直接输出动作指令，开创物理模型新范式。该模型具备动作生成与物理世界理解能力，参数规模达数十亿级，训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载，推动智驾技术显著进化，同步发布“小径NGP”功能，复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示，大模型将成为物理AI世界的操作系统，并宣布与大众汽车达成战略合作，共同推进智能出行发展。

小鹏汽车 VLA大模型智能出行
登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
Soul App开源播客语音合成模型SoulX-Podcast,支持流畅自然多轮语音对话

Soul App近日开源其播客语音合成模型SoulX-Podcast，专为多人多轮对话场景设计。该模型支持中、英、川、粤等多语言及方言，可生成超60分钟流畅自然、角色切换准确、韵律丰富的语音对话。除播客场景外，在通用语音合成及克隆任务中表现优异，能灵活调节节奏与副语言元素（如笑声），提升语音真实感与表现力。此次开源旨在携手开发者探索AI语音在内容创作与社交生态中的更多可能。

语音合成模型 SoulX-Podcast 多轮对话
新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

苹果因自研大模型项目遇瓶颈，决定引入谷歌Gemini大模型升级Siri，计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数，将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能，支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送，后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

苹果谷歌Gemini Siri升级
免费 GEO品牌可见度查询——让大模型信得过就这么玩

本文探讨在AI时代如何成为大模型信赖的信息源。关键点包括：可信信息源需具备数据来源清晰、内容结构化、可验证追踪等能力；提出五大实操要点——确保数据干净可追溯、采用RAG等技术增强可检索性、保持内容更新与时效性、强化品牌可见度、建立反馈优化机制。同时推荐使用AIBase平台的GEO排名查询工具免费监测内容可见度，通过持续优化提升在大模型入口的推荐概率。

文章搜索核心标签可信信息源

今日大家都在搜的词：

热文

3 天
7天

豆包大模型1.6发布：全球梯队！可生成1080p高品质视频

荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

升级版“蓝心小V”亮相，豆包大模型助力vivo打造AI原生体验

易鑫正式发布汽车金融行业首个Agentic大模型

荐AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅升级；Soul语音模型SoulX-Podcast发布

机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

Soul App开源播客语音合成模型SoulX-Podcast,支持流畅自然多轮语音对话

新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

免费 GEO品牌可见度查询——让大模型信得过就这么玩

今日大家都在搜的词：

热文

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

何小鹏回应机器人IRON里是真人质疑：感谢认可

站长商机