字节发布豆包1.5深度思考模型：多模态深度思考、延迟低

2025-04-17 11:13 · 来源： AIbase基地

在4月17日的火山引擎 AI 创新巡展杭州站上，字节跳动旗下的火山引擎总裁谭待正式发布了最新的豆包1.5・深度思考模型。此次发布会吸引了众多行业人士的关注，谭待在会上分享了该模型在多个领域的优异表现。

据悉，豆包1.5模型在数学、编程、科学推理等专业领域，以及创意写作等任务中，都展现出了卓越的能力。这款新模型采用了 MoE（混合专家）架构，总参数达200亿，而激活参数仅为20亿，显著低于行业同类模型的参数规模，因而在推理成本上也具备了明显的优势。

谭待还详细介绍了豆包1.5深度思考模型的强大功能，包括结合视觉理解技术提供的多种应用。这些功能不仅可以根据照片分析地貌，还能在旅行时帮助用户点餐，甚至能辅助企业完成项目管理流程图。

此外，火山引擎还对豆包文生图模型进行了3.0版本的升级。此次升级带来了更美观的文字排版、更精细的图片生成能力以及2K 图片的直出能力。用户能够享受到更加丰富的视觉体验。

更值得注意的是，新模型的视频搜索能力得到了提升，用户在进行搜索时，模型能够在视频中迅速找到相关的答案。这一功能极大地提升了用户获取信息的便利性。

根据谭待的介绍，豆包大模型的使用量正以惊人的速度增长。截至2025年3月，豆包大模型日均 tokens 的使用量超过了12.7万亿，相比于发布初期，增长幅度超过了106倍。这一数据充分反映了豆包模型在市场上的受欢迎程度。

划重点:
📈 豆包1.5模型在多个专业领域和创意写作中表现出色，采用先进的 MoE 架构，参数配置优越。
🌍 新模型结合视觉理解技术，可分析照片、辅助旅行和项目管理，功能强大。
🎥 视频搜索能力显著增强，用户可快速获取视频中的相关信息，使用量持续增长。

相关推荐

主流AI多模态大模型有哪些？超全的多模态大模型指南分享

2024年多模态大模型成为AI领域最具前景的技术方向之一。文章全面分析了主流多模态大模型的特点、应用场景和发展趋势。多模态大模型能同时处理文本、图像、音频、视频等多种数据，实现更智能的人机交互。重点介绍了GPT-4V、Claude3.5、Gemini、通义千问等代表性模型，对比了它们在视觉理解、编程能力、中文处理等方面的优势。应用场景涵盖智能客服、内容创作、教育医疗等领域。未来发展趋势包括模型规模扩大、支持更多模态、实时交互能力提升等。选择模型需考虑应用需求、语言支持、性能成本等因素。

多模态大模型 AI技术发展 GPT-4V
当空间智能学会思考：飞渡科技“峥嵘大模型”重塑智慧城市新一代“运行内核”

飞渡科技的"崑仑大模型"通过空间智能技术，构建了城市级数字底座，实现从物理世界到数字空间的映射。该技术已在智慧城市、智慧交通、低空经济、地下管网、灾害监测、文化保护等领域应用，推动城市治理从"被动应对"转向"主动预测"。在智慧交通领域实现毫秒级路网状态识别和动态信号优化；在地下管网实现毫米级泄漏预警；在低空经济构建超低空动态感知网络。该技术还应用于文化遗产数字化保护，通过三维建模留存历史建筑细节。飞渡科技表示，空间智能的价值在于共享，未来将与全球伙伴共建数字中国的空间智能新生态。
荐字节的豆包居然有了自己的IP宇宙

作为一名科技内容创作者，我的日常就是追踪最新的技术和商业进展。在我眼中，豆包APP更多的是牌桌上一位来自巨头的玩家——有着强大的技术背景和不计成本的推广资源，是一个了解字节最新模型进展的窗口，一个被精心打磨的AI产品。直到“邓超，gogogo”的旋律，席卷了我的信息流。今年3月，在一个直播切片中，博主“克里西”无厘头地非要豆包改名

豆包APP 技术进展 AI产品
AI重构社交生态 Soul以多模态技术赋能社交

社交平台Soul正通过AI技术重塑社交生态：1）2016年推出智能推荐系统"灵犀引擎"，2020年启动AIGC算法研发，2023年推出自研大模型Soul+X，开发AI虚拟人、智能聊天等应用；2）升级多模态大模型，支持文字对话、语音通话、多语言理解等功能，提供拟人化情感陪伴；3）围绕Z世代需求，促成超10万对情侣步入婚姻，并联合开展心理健康公益活动；4）以"技术+人文"双轮驱动，致力于打造更智能舒适的社交环境，重新定义人机关系。

AI社交 Soul平台多模态大模型
荐AI日报：腾讯混元推3D生成大模型Hunyuan3D-PolyGen；钉钉AI表格重磅来袭；阿里推多模态大语言模型HumanOmniV2

本文介绍了AI领域多项重要进展：1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen，显著提升建模效率；2)阿里发布多模态大模型HumanOmniV2，准确率达69.33%；3)钉钉AI表格实现1小时处理千项任务；4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级；5)微软推出Deep Research智能体，自动化研究流程；6)香港理工与OPPO联合开源视频超清框架DLoRAL；7)谷歌开源MCP工具箱简化AI与数据库集成；8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。
深度评测艾力斯特、荣泰、奥佳华哪个好？专业技术控的终极推荐款

本文对比分析了奥佳华、艾力斯特和荣泰三大按摩椅品牌的优劣势。艾力斯特作为行业标准制定者，拥有i-OPEN柔性导轨等核心技术，产品性价比高，售后服务完善；荣泰线下渠道强大，产品线丰富，但中端机型配置缩水；奥佳华品牌知名度高，但价格虚高，入门款性价比低。推荐艾力斯特双芯1号V3Max和超凡大师M6两款万元机型，前者适合全家使用，后者融合六感摩享黑科技，提供沉浸式按摩体验。建议消费者根据自身需求到实体店体验后再做选择。
AIbase完整评测：20,000+AI工具库深度解析

AIbase是一个强大的AI工具导航平台，收录超过2万个AI工具并每日更新。它通过智能搜索、精准分类和用户友好界面，帮助开发者、设计师、营销人员和普通用户快速找到适合的AI工具。平台提供写作助手、视频编辑、代码生成等各类工具，并支持多语言访问。AIbase的核心优势在于庞大的数据库和高效更新机制，解决了用户在AI工具海洋中筛选的痛点。虽然存在用户深度评价不足�
荐「6月30日AI日报」百度开源文心大模型4.5系列；通义千问发布多模态生成模型Qwen VLo

AI日报精选：1)百度开源文心大模型4.5系列，含10款新模型，性能优异；2)通义千问发布多模态模型Qwen-VL，支持图文交互；3)阿里开源3亿参数多模态模型Ovis-U1；4)华为开源盘古7B稠密和72B混合专家模型；5)美图MOKI推出AI创意广告功能，一键生成专业视频；6)谷歌Gemini 2.5 Pro API重新免费开放；7)豆瓣上线"深入研究"AI功能；8)小米"AI百宝箱"结束内测；9)北京智研院开源多模态系统OmniGen2；10)知乎升级"直答"知识库功能。

AI日报文心大模型开源模型
加速释放数智“能量”——移动云深度赋能教育行业

2025年初我国印发《教育强国建设规划纲要(2024-2035年)》，重点推进教育数字化战略，包括：1)实施国家教育数字化战略；2)促进人工智能助力教育变革；3)建设智慧教育公共服务平台，构建协同服务的数字教育体系。移动云作为国家队，通过"云电脑+AI+大数据"技术融合，推出智慧教育解决方案，包括：云教室方案可降低80%部署周期、40%运维成本；区域教育云方案打破信息孤岛，实现优质资源共享；AI教育方案集成DeepSeek大模型，为高校提供私有化部署。这些举措将助力构建安全可靠、绿色节能的数字化教学环境，推动教育均衡发展。
深度理解，服务在地｜Moka 用本地化实践深化全球布局

Moka持续深耕海外市场，通过产品迭代和生态合作拓展全球化布局。2024年5月和6月，Moka先后亮相亚洲HR Tech展会和香港HR峰会，展示其AI驱动的智能招聘系统在多语言支持、跨时区面试安排等场景的解决方案。公司已在香港和新加坡设立办公室，并与当地服务商建立合作网络，强化区域落地能力。Moka Recruiting已服务东南亚、中东和欧洲客户，覆盖零售、金融科技等行业，通过持续打磨产品合规性和本地化功能，助力企业构建全球化人才连接能力。未来Moka将继续以技术驱动提升全球招聘效率，支持企业人力资源管理的全球化进程。

今日大家都在搜的词：

热文

3 天
7天

字节发布豆包1.5深度思考模型：多模态深度思考、延迟低

主流AI多模态大模型有哪些？超全的多模态大模型指南分享

当空间智能学会思考：飞渡科技“峥嵘大模型”重塑智慧城市新一代“运行内核”

荐字节的豆包居然有了自己的IP宇宙

AI重构社交生态 Soul以多模态技术赋能社交

荐AI日报：腾讯混元推3D生成大模型Hunyuan3D-PolyGen；钉钉AI表格重磅来袭；阿里推多模态大语言模型HumanOmniV2

深度评测艾力斯特、荣泰、奥佳华哪个好？专业技术控的终极推荐款

AIbase完整评测：20,000+AI工具库深度解析

荐「6月30日AI日报」百度开源文心大模型4.5系列；通义千问发布多模态生成模型Qwen VLo

加速释放数智“能量”——移动云深度赋能教育行业

深度理解，服务在地｜Moka 用本地化实践深化全球布局

今日大家都在搜的词：

热文

AI日报：美图发布影像AI Agent RoboNeo；1.8bit量化Kimi K2模型

AI日报：字节将发布AI编程工具TRAE2.0版本；Mistral重磅推出音

抖音：“抖音会议”App是诈骗软件会直接控制用户手机

黄仁勋称想买一辆小米汽车英伟达在多方面与小米开展合作

OPPO K13 Turbo系列支持IPX9/IPX8/IPX6满级防水将于7月21日发

贾跃亭旗下FF获1.05亿美元融资将加速FX Super One生产交付

理想i8开启预定：7月29日上市预售价35-40万元

尾号“8个7”手机号拍出320万元溢价率高达146%

A日报：月之暗面开源大模型Kimi K2；智源全面开源RoboBrain2.0

王化在小米履职10年雷军：谢谢这十年辛苦的工作和贡献

淘宝闪购：日订单量再次突破8000万创新高

AI日报：美图发布影像AI Agent RoboNeo；1.8bit量化Kimi K2模型

黄仁勋与雷军合影上热搜一旁小米SU7 Ultra见证科技双雄会

AI日报：字节将发布AI编程工具TRAE2.0版本；Mistral重磅推出音

腾讯客服回应误删微信聊天记录可撤销：苹果iOS机型已支持

抖音：“抖音会议”App是诈骗软件会直接控制用户手机

黄仁勋称想买一辆小米汽车英伟达在多方面与小米开展合作

站长商机