首页 > 业界 > 关键词  > 豆包大模型最新资讯  > 正文

豆包大模型1.6发布:全球梯队!可生成1080p高品质视频

2025-06-12 08:00 · 稿源: 快科技

快科技6月12日消息,字节跳动旗下豆包大模型正式升级为1.6版,在推理、数学、指令遵循、Agent等方面的能力均有较大提升,同时豆包视频生成模型Seedance 1.0 pro、豆包语音播客模型也正式发布。

豆包大模型1.6包括三部分,分别是豆包1.6、豆包1.6-thinking、豆包1.6-flash。

其中,豆包1.6支持on/off/auto三种思考模式,豆包1.6-thinking强化了思考能力,支持多模态,在多个权威测评集上达到了全球第一梯队水平。

比如,GPQA Diamond测试成绩达到81.5分,是目前最好的推理模型之一。

再比如,数学测评AIME25成绩达到86.3分,相比豆包1.5深度思考模型大幅提升12.3分。

豆包大模型1.6系列均支持深度思考、多模态理解、256K长上下文(首个)、图形界面操作等能力,能够更好地支持复杂Agent的构建,促进AI生产力的提升。

目前,豆包大模型1.6系列已在火山引擎上线,企业和开发者可调用API体验。

价格方面,按照百万tokens:

0-32k上下文,输入0.8元,输出为8元;

32-128k上下文,输入1.2元,输出16元;

128-256k上下文,输入2.4元,输出24元。

豆包大模型1.6发布:全球第一梯队!可生成1080p高品质视频

豆包视频生成模型Seedance 1.0 pro支持文字与图片输入,可生成多镜头无缝切换的1080p高品质视频,主体运动稳定性与画面自然度较高。

通过调研影视创作者等群体的实际需求,Seedance 1.0 pro不仅将指令遵循、运动稳定性、画面质量等行业共识性指标纳入攻坚方向,同时,也将多任务生成、1080p高清生成、快速视频生成等难题作为核心目标。

新版模型在动态图像生成的各维度上,有较好的综合表现,尤其动作生成、指令遵循等关键能力处于业界前列,推理速度、用户好评度等方面也比较突出。

根据国际知名评测榜单Artificial Analysis,Seedance 1.0 pro在文生视频、图生视频两个任务的表现均排名首位。

豆包大模型1.6发布:全球第一梯队!可生成1080p高品质视频Artificial Analysis 文生视频榜单,数据截至 2025-06-09 11:00 (GMT 8)

豆包大模型1.6发布:全球第一梯队!可生成1080p高品质视频Artificial Analysis 图生视频榜单,数据截至 2025-06-09 11:00 (GMT 8)

豆包语音播客模型源于端到端实时语音的进一步拓展,能够实现从文本创作到双人对话式播客作品的秒级生成,同时具备互相附和、插话、犹豫等自然的播客元素生成,达到了媲美真人的生成效果。

用户可以在扣子空间(https://space.coze.cn/)体验语音播客相关功能。

同时,豆包产品已启动小流量测试,近期将全量上线播客模型。

举报

  • 相关推荐
  • 荣耀MagicGUI大模型发布并开源!Magic V5首发搭载:跨应用/设备自动化

    该战略是荣耀新任CEO李健在3月的MWC 2025首次揭晓,是荣耀的全新人工智能战略计划,将从智能手机制造商向全球AI终端生态公司全面转型。 李健宣布,未来5年荣耀将投入100亿美元,与全球合作伙手共建AI设备生态。 分为三个实施阶段: 第一阶段是智慧手机,荣耀将与合作伙伴携手突破技术边界,共同创造代理型人工智能时代的新范式; 第二阶段是智慧生态系统,荣耀将打�

  • 猿辅导AI大模型:技术深融与场景革新,重构学习体验

    2025年教育科技领域迎来智能化新浪潮。猿辅导集团通过自主研发的"猿力大模型"与开源推理大模型DeepSeek深度融合,构建覆盖"数据-场景-交互"全链路的AI教育生态。其技术方案已获信通院"模型开发5级"认证,成为教育行业首个获此最高评级的大模型。硬件方面推出"小猿学练机"和"小猿AI学习机",实现学习平板与智能基座结合,支持打印、情感交互等功能。校园端覆盖25省市超1000所学校,通过"AI安全驾驶模拟"等项目培养学生计算思维。编程教育领域推出支持代码实时监测的AI-Agent工具。凭借300亿条学情数据和15亿题库构建的高质量素材库,显著降低"幻觉"风险68%。目前旗下出海产品已服务100多个国家,推动中国教育科技走向国际。

  • 工业大模型进入能力正赛,权威评测北电数智骄阳·工业大模型拿下综合排名第一

    国产工业大模型正从概念热潮走向应用深水区。7月24日,SuperCLUE发布中文工业大模型评测基准SC-Industry最新榜单,北电数智"骄阳·工业大模型"以83.44分获综合第一,在应用能力(90.07分)、工业数据分析(90.38分)和工业智能体(89.97分)三个细分维度均居榜首。报告指出,产业级应用能力成为新分水岭,国产模型在工业任务能力方面实现突破。北电数智通过建立工业数据标准体系、研发场景化微调数据生成技术等举措,构建了精准垂类认知、高质量数据治理和合规管控机制三大优势。该模型将亮相2025世界人工智能大会,分享"AI+生产"等核心场景的创新实践。

  • A日报:Trae 2.0 正式升级 SOLO 模式;通义发布Qwen3新模型;智谱AI重磅推出Zread

    本期AI日报聚焦多项AI领域突破:1)Trae 2.0推出SOLO模式,实现AI全流程自主开发;2)阿里通义发布Qwen3-235B大模型,支持256K文本处理;3)智谱AI推出Zread工具,一键转换GitHub项目为使用手册;4)零一万物发布万智企业大模型平台2.0及定制Agent方案;5)字节跳动推出通用机器人模型GR-3,具备高精度操作能力;6)Pika推出AI视频特效APP,降低创作门槛;7)Dia浏览器将上线AI驱动的"分身鼠标&

  • 从数字世界迈向物理世界!清华×生数发布最新成果Vidar,基于视频大模型实现机器人物理操作

    清华大学生数科技团队研发的Vidar模型实现具身智能重大突破,首次让通用视频大模型具备"手脚"功能。该模型通过三级数据架构(海量通用视频+中等规模具身视频+少量机器人特定数据),仅需20分钟机器人真机数据即可快速泛化到新机器人本体,数据量仅为行业领先方法的1/80-1/1200。Vidar创新性地将任务解构为上游视频预测和下游动作执行,结合逆动力学模型实现视觉-

  • 字节跳动TRAE2.0真的好用吗?同类型AI产品上哪找?

    字节跳动TRAE2.0 AI编程工具升级亮点:1)新增语音交互功能,支持中英文混合输入,实现"说话写代码";2)Builder模式迭代后项目生成成功率提升至92%,复杂需求可一次性跑通;3)免费版每月100次调用额度,支持GPT-4o和Claude-3.5模型;4)五大隐藏技巧:语音调试、图片生成代码、API批量测试等可提升300%效率;5)针对中文开发者优化,支持阿里云/腾讯云SDK调用。实测3分钟

  • 聚焦WAIC 2025 | 携全双工语音通话大模型亮相,Soul App重塑人机互动新范式

    Soul App在2025世界人工智能大会上展示了AI社交创新方案,重点呈现了全双工语音/视频通话大模型技术。该技术突破传统"轮次对话"模式,赋予AI自主决策对话节奏的能力,实现更自然的人机互动。平台通过"AI社交练习"主题,展示了AI在群聊派对中的主持能力,能有效活跃气氛、鼓励用户参与。同时,Soul还探索了多模态交互,基于全双工语音和实时视频生成技术,构建"数字人格"促进深度社交连接。作为社交平台,Soul持续深化AI与社区融合,通过智能推荐和虚拟人生态,为用户提供即时情感支持和共鸣,推动社交向"情感共生"进化。CTO陶明表示,AI正深入个体关系网络,将拓展"情价比消费"等全新市场机会。

  • 北大张牧涵团队依托昇腾突破推理效率瓶颈 大模型推理百万tokens 成本仅 1 元

    北京大学张牧涵团队在昇腾算力支持下,研发出一套高效大模型训练推理架构,实现百万tokens输入成本低至1元。该成果包含三项关键技术:1)通过分离注意力头中的位置与非位置信息,仅用3%位置信息即可维持模型性能;2)采用联合KV低秩压缩方法,仅保留12.5%的KV Cache;3)基于昇腾硬件并行计算能力,实现Recurrent Decoding技术提升训练数据利用率。该架构显著降低AI大模型应用成本,验证了昇腾算力平台支撑尖端科研的实力。

  • 告别模型搜寻困境:AIbase模型广场让你高效找到最佳AI模型

    文章探讨了在AI技术快速发展背景下,如何高效发现和评估适合需求的AI模型这一核心挑战。传统方式存在模型分散、评估门槛高、应用场景模糊等问题。AIbase模型广场通过聚合主流平台模型、提供多维度评估(性能指标、用户反馈、易用性等)、强化场景连接(按业务问题分类)和部署辅助信息,构建了完整的模型发现与应用生态。该平台能显著提升效率,帮助开发者快速锁�

  • 最新AI模型哪里看?8个国内优质AI模型库与获取渠道盘点

    文章探讨大模型API价格战背景下,开源模型+本地微调成为降本增效的新趋势。当前典型工作流已转变为:GitHub找代码→Hugging Face找权重→国内镜像站下载→本地/云端微调。模型库成为生产链起点而非单纯资源站。建议从三个维度筛选模型:1)协议类型决定商用权限;2)框架兼容性避免格式转换;3)场景标签匹配度节省检索时间。推荐8个国内优质模型获取渠道,包括AIbase(2.3万+模型)、阿里ModelScope(社区活跃)、百度EasyDL(零代码友好)等,各平台在电商、语音、交通等垂直领域各有优势。最后给出快速检索建议:商用需求优先查协议,垂直场景找专业平台,追踪更新可订阅RSS。

今日大家都在搜的词: