首页 > AI头条  > 正文

字节发布豆包1.5深度思考模型:多模态深度思考、延迟低

2025-04-17 11:13 · 来源: AIbase基地

在4月17日的火山引擎 AI 创新巡展杭州站上,字节跳动旗下的火山引擎总裁谭待正式发布了最新的豆包1.5・深度思考模型。此次发布会吸引了众多行业人士的关注,谭待在会上分享了该模型在多个领域的优异表现。

QQ_1744859338893.png

据悉,豆包1.5模型在数学、编程、科学推理等专业领域,以及创意写作等任务中,都展现出了卓越的能力。这款新模型采用了 MoE(混合专家)架构,总参数达200亿,而激活参数仅为20亿,显著低于行业同类模型的参数规模,因而在推理成本上也具备了明显的优势。

谭待还详细介绍了豆包1.5深度思考模型的强大功能,包括结合视觉理解技术提供的多种应用。这些功能不仅可以根据照片分析地貌,还能在旅行时帮助用户点餐,甚至能辅助企业完成项目管理流程图。

此外,火山引擎还对豆包文生图模型进行了3.0版本的升级。此次升级带来了更美观的文字排版、更精细的图片生成能力以及2K 图片的直出能力。用户能够享受到更加丰富的视觉体验。

更值得注意的是,新模型的视频搜索能力得到了提升,用户在进行搜索时,模型能够在视频中迅速找到相关的答案。这一功能极大地提升了用户获取信息的便利性。

根据谭待的介绍,豆包大模型的使用量正以惊人的速度增长。截至2025年3月,豆包大模型日均 tokens 的使用量超过了12.7万亿,相比于发布初期,增长幅度超过了106倍。这一数据充分反映了豆包模型在市场上的受欢迎程度。

划重点:

📈 豆包1.5模型在多个专业领域和创意写作中表现出色,采用先进的 MoE 架构,参数配置优越。  

🌍 新模型结合视觉理解技术,可分析照片、辅助旅行和项目管理,功能强大。  

🎥 视频搜索能力显著增强,用户可快速获取视频中的相关信息,使用量持续增长。  

  • 相关推荐
  • 主流AI多模态大模型有哪些?超全的多模态大模型指南分享

    2024年多模态大模型成为AI领域最具前景的技术方向之一。文章全面分析了主流多模态大模型的特点、应用场景和发展趋势。多模态大模型能同时处理文本、图像、音频、视频等多种数据,实现更智能的人机交互。重点介绍了GPT-4V、Claude3.5、Gemini、通义千问等代表性模型,对比了它们在视觉理解、编程能力、中文处理等方面的优势。应用场景涵盖智能客服、内容创作、教育医疗等领域。未来发展趋势包括模型规模扩大、支持更多模态、实时交互能力提升等。选择模型需考虑应用需求、语言支持、性能成本等因素。

  • 当空间智能学会思考:飞渡科技“峥嵘大模型”重塑智慧城市新一代“运行内核”

    飞渡科技的"崑仑大模型"通过空间智能技术,构建了城市级数字底座,实现从物理世界到数字空间的映射。该技术已在智慧城市、智慧交通、低空经济、地下管网、灾害监测、文化保护等领域应用,推动城市治理从"被动应对"转向"主动预测"。在智慧交通领域实现毫秒级路网状态识别和动态信号优化;在地下管网实现毫米级泄漏预警;在低空经济构建超低空动态感知网络。该技术还应用于文化遗产数字化保护,通过三维建模留存历史建筑细节。飞渡科技表示,空间智能的价值在于共享,未来将与全球伙伴共建数字中国的空间智能新生态。

  • 字节的豆包居然有了自己的IP宇宙

    ​作为一名科技内容创作者,我的日常就是追踪最新的技术和商业进展。 在我眼中,豆包APP更多的是牌桌上一位来自巨头的玩家——有着强大的技术背景和不计成本的推广资源,是一个了解字节最新模型进展的窗口,一个被精心打磨的AI产品。 直到“邓超,gogogo”的旋律,席卷了我的信息流。 今年3月,在一个直播切片中,博主“克里西”无厘头地非要豆包改名

  • AI重构社交生态 Soul以多模态技术赋能社交

    社交平台Soul正通过AI技术重塑社交生态:1)2016年推出智能推荐系统"灵犀引擎",2020年启动AIGC算法研发,2023年推出自研大模型Soul+X,开发AI虚拟人、智能聊天等应用;2)升级多模态大模型,支持文字对话、语音通话、多语言理解等功能,提供拟人化情感陪伴;3)围绕Z世代需求,促成超10万对情侣步入婚姻,并联合开展心理健康公益活动;4)以"技术+人文"双轮驱动,致力于打造更智能舒适的社交环境,重新定义人机关系。

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • 深度评测艾力斯特、荣泰、奥佳华哪个好?专业技术控的终极推荐款

    本文对比分析了奥佳华、艾力斯特和荣泰三大按摩椅品牌的优劣势。艾力斯特作为行业标准制定者,拥有i-OPEN柔性导轨等核心技术,产品性价比高,售后服务完善;荣泰线下渠道强大,产品线丰富,但中端机型配置缩水;奥佳华品牌知名度高,但价格虚高,入门款性价比低。推荐艾力斯特双芯1号V3Max和超凡大师M6两款万元机型,前者适合全家使用,后者融合六感摩享黑科技,提供沉浸式按摩体验。建议消费者根据自身需求到实体店体验后再做选择。

  • AIbase完整评测:20,000+AI工具库深度解析

    AIbase是一个强大的AI工具导航平台,收录超过2万个AI工具并每日更新。它通过智能搜索、精准分类和用户友好界面,帮助开发者、设计师、营销人员和普通用户快速找到适合的AI工具。平台提供写作助手、视频编辑、代码生成等各类工具,并支持多语言访问。AIbase的核心优势在于庞大的数据库和高效更新机制,解决了用户在AI工具海洋中筛选的痛点。虽然存在用户深度评价不足�

  • 「6月30日AI日报」百度开源文心大模型4.5系列;通义千问发布多模态生成模型Qwen VLo

    AI日报精选:1)百度开源文心大模型4.5系列,含10款新模型,性能优异;2)通义千问发布多模态模型Qwen-VL,支持图文交互;3)阿里开源3亿参数多模态模型Ovis-U1;4)华为开源盘古7B稠密和72B混合专家模型;5)美图MOKI推出AI创意广告功能,一键生成专业视频;6)谷歌Gemini 2.5 Pro API重新免费开放;7)豆瓣上线"深入研究"AI功能;8)小米"AI百宝箱"结束内测;9)北京智研院开源多模态系统OmniGen2;10)知乎升级"直答"知识库功能。

  • 加速释放数智“能量”——移动云深度赋能教育行业

    2025年初我国印发《教育强国建设规划纲要(2024-2035年)》,重点推进教育数字化战略,包括:1)实施国家教育数字化战略;2)促进人工智能助力教育变革;3)建设智慧教育公共服务平台,构建协同服务的数字教育体系。移动云作为国家队,通过"云电脑+AI+大数据"技术融合,推出智慧教育解决方案,包括:云教室方案可降低80%部署周期、40%运维成本;区域教育云方案打破信息孤岛,实现优质资源共享;AI教育方案集成DeepSeek大模型,为高校提供私有化部署。这些举措将助力构建安全可靠、绿色节能的数字化教学环境,推动教育均衡发展。

  • 深度理解,服务在地|Moka 用本地化实践深化全球布局

    Moka持续深耕海外市场,通过产品迭代和生态合作拓展全球化布局。2024年5月和6月,Moka先后亮相亚洲HR Tech展会和香港HR峰会,展示其AI驱动的智能招聘系统在多语言支持、跨时区面试安排等场景的解决方案。公司已在香港和新加坡设立办公室,并与当地服务商建立合作网络,强化区域落地能力。Moka Recruiting已服务东南亚、中东和欧洲客户,覆盖零售、金融科技等行业,通过持续打磨产品合规性和本地化功能,助力企业构建全球化人才连接能力。未来Moka将继续以技术驱动提升全球招聘效率,支持企业人力资源管理的全球化进程。

今日大家都在搜的词: