AI日报：抖音测试接入豆包AI；即梦接入DeepSeek支持智能提示词生成；Grok语音模式全面开放

2025-03-05 15:21 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

抖音App正在测试接入豆包AI，标志着字节跳动加速推进AI生态布局。通过在短视频界面和消息列表中开放入口，抖音旨在打破AI产品与流量平台的壁垒，提升AI能力并引入更多用户流量。字节内部还在推进多条AI产品业务线，展现出全方位的AI产品生态系统。

【AiBase提要:】
📱 抖音正在测试接入豆包AI，开放两个战略性入口，提升AI能力和用户流量。
💡 字节跳动内部推进多条AI产品线，覆盖多个领域，展现全方位的AI生态系统。
🏆 互联网巨头对AI技术在内容生态中的应用高度重视，开启新的AI服务生态时代。

2、强强联合!即梦接入DeepSeek 从提示词到绘画一步到位

即梦与DeepSeek的合作为AI绘画爱好者带来了极大的便利。通过DeepSeek的智能提示词生成功能，用户不再需要为创作灵感而烦恼，只需简单输入需求，便能获得精准的提示词，进而生成高质量的图像。这一创新的联动不仅提升了创作效率，还让绘画过程变得更加流畅和愉悦。

【AiBase提要:】
🖌️ 即梦接入DeepSeek，提供智能提示词生成功能，解决用户创作难题。
✨ 用户只需输入简单需求，DeepSeek即可生成详细精准的提示词，提升创作效率。
🌟 DeepSeek生成的提示词质量高，能够有效引导AI生成高质量图像，用户反馈良好。

3、Grok 语音模式全面开放:11种模式上线，自带字幕成英语学习利器

xAI公司的AI助手Grok正式向所有用户开放其备受期待的语音模式，带来了11种独特的语音交互模式和语音字幕功能。这一更新不仅增强了用户的互动体验，还为英语学习者提供了新的学习工具。用户对这一更新反响热烈，虽然目前仅支持英文，但Grok的多样化表达和流畅度已获得用户的高度评价，未来扩展语言支持的期待也在不断增加。

【AiBase提要:】
🎤 Grok的语音模式现已向所有用户开放，提供11种独特的交互风格，包括2种18+限制模式。
📚 新增的语音字幕功能帮助用户更好地理解内容，成为英语学习的实用工具。
🌍 用户对Grok的流畅度和情感表达给予高度评价，期待未来能支持更多语言。

4、vivo重组调整，成立新AI部门并将大模型训练转向端侧

vivo最近在其组织架构上进行了重要调整，成立了新的AI部门，显示出其在人工智能领域的持续投入与战略布局。新部门将专注于大模型的端侧训练，并且暂停了对商业化的考核，反映出vivo对AI技术长远发展的重视。此外，vivo还推出了DeepSeek-R1，提升了AI助手的智能化水平，进一步推动了用户体验的提升。

【AiBase提要:】
🆕 vivo新设立AI部门，标志着公司在人工智能技术上的持续投入和战略布局。
📉 由于管理干预，vivo决定暂时不对AI大模型的商业化进行考核，并暂停资金投入。
🚀 最新推出的DeepSeek-R1提升了AI助手的智能化水平，用户体验得到了显著改善。

5、全新技术 Fast3R :实现千张图片一键3D 重建，速度惊人!

Fast3R是一种创新的多视角3D重建技术，能够在一次前向传播中处理多达1500张图片，显著提高重建速度。与传统的DUSt3R方法相比，Fast3R利用基于Transformer的架构并行处理视图信息，省去复杂的对齐过程，提升了推理速度并减少误差积累。

【AiBase提要:】
🌟 Fast3R技术可以在一次前向传播中处理多达1500张图片，大幅提高3D重建速度。
⚡ Fast3R的Transformer架构支持并行处理，省去传统方法的复杂对齐过程。
🚀 与DUSt3R相比，Fast3R在时间和内存使用上展现出显著优势，适用于大规模3D重建应用。
详情链接:https://fast3r-3d.github.io/

6、音乐创作领域投下核弹!DiffRhythm 炸裂问世:10秒 AI 神曲，人声伴奏一键搞定!

DiffRhythm的问世标志着音乐创作的新时代，它通过扩散模型实现了端到端的自动生成音乐，用户只需输入歌词和风格，即可在短短10秒内获得一首完整的歌曲。DiffRhythm不仅能生成伴奏，还能自动创作歌词，完美契合旋律，颠覆了传统音乐创作的模式，开启了AI音乐创作的新纪元。

【AiBase提要:】
🎤 DiffRhythm通过扩散模型实现端到端的音乐创作，用户只需输入歌词和风格即可生成完整歌曲。
⚡ 生成速度极快，仅需10秒钟便可完成一首4分45秒的歌曲，速度是传统方法的50倍。
🎼 内置强大的大语言模型，能够自动创作歌词并与旋律完美匹配，彻底颠覆传统作曲方式。
详情链接:https://huggingface.co/spaces/ASLP-lab/DiffRhythm

7、微软开源图片模型ART，可生成多图层透明图片

在图像生成领域，微软研究人员推出的“Anonymous Region Transformer”（ART）技术，革新了用户与生成模型的互动方式。通过匿名区域布局，ART能够根据全球文本提示直接生成多层透明图像，并引入逐层区域裁剪机制，大幅提升生成效率，速度比传统方法快12倍。

【AiBase提要:】
🌟 ART可根据全球文本提示和匿名区域布局，直接生成多层透明图像。
⚡️ 采用逐层区域裁剪机制，显著提高了图像生成效率，比传统方法快12倍。
💡 新型高质量自编码器支持多层透明图像的精确控制与生成，推动交互式内容创作。
详情链接:https://art-msra.github.io/

8、AI思维导图神器 MindMapper :扔个链接就能生成交互式思维导图

在信息爆炸的时代，Mind Mapper 应用程序成为了思维整理的得力助手。它能够将用户的想法转化为生动的思维导图，只需输入网址、YouTube 视频链接或文本提示，便能快速生成互动式思维导图。

【AiBase提要:】
🖥️ Mind Mapper 能够将想法转化为生动的思维导图，支持网址、视频链接和文本提示输入。
🎨 采用 Mermaid.js 技术，思维导图不仅美观，还具备动态交互功能，用户可轻松获取详细信息。
📤 提供将思维导图下载为 PNG 图片的功能，方便用户分享知识和灵感。
详情链接:https://github.com/misbahsy/MindMapper

9、雷军亮相首场代表通道:小米将把最新的AI技术应用到各个终端上

在全国人大十四届三次会议的首场“代表通道”上，小米创办人雷军接受了记者提问，深入探讨了小米在制造业中的角色及科技创新方向。他强调制造业是国家的基石，小米将加大研发投入，特别是在人工智能领域，以提升消费者的科技体验，并助力中国式现代化。

【AiBase提要:】
🏭 制造业是国家立国之本，小米将坚定走科技创新和高端化发展道路。
💰 小米计划在2021至2025年间投入1050亿元用于研发，2025年预计投入300亿元，AI相关业务占四分之一。
🌍 小米致力于将最新的AI技术应用于手机、汽车和智能家居等领域，提升全球市场的影响力。

10、爱诗科技完成A5轮融资，剑指AI视频生成领域新高地

爱诗科技近日宣布完成A5轮融资，由靖亚资本独家投资，融资额已超4亿元，成为AI视频生成领域的明星企业。公司成立于2023年，由前字节跳动视觉技术负责人王长虎创立，团队背景强大，迅速获得多方投资者青睐。此次融资将用于加速研发和引进人才，致力于打造领先的AI视频生成大模型及应用。

【AiBase提要:】
📈 爱诗科技完成A5轮融资，融资额已超4亿元，成为AI视频生成领域的明星企业。
🌍 其产品PixVerse已拥有超过4000万用户，月活跃用户达1500万，技术实力领先。
💼 公司计划加速模型研发与高端人才引进，积极拓展B端企业服务，面临商业化挑战。

（举报）

相关推荐

关键词：

字节跳动回应即将发布AI眼镜：早期探索阶段没有发布计划

近日，有媒体报道字节跳动即将推出一款AI眼镜产品，并详细披露了所谓的产品供应链信息，引发行业广泛关注。据传，该产品方案由RXKJ提供，MCU（微控制单元）由HXKJ供应，核心SOC采用高通AR1芯片，整机代工则交由LQKJ负责。针对这一市场传闻，字节跳动相关负责人迅速作出回应。该负责人明确表示，相关产品目前还处在早期探索阶段，暂时没有明确的发布计划。

字节跳动 AI眼镜供应链
深入实施“人工智能+”，伊顿助力皓扬数据打造 AI 算力中心标杆

近日，备受瞩目的《关于深入实施“人工智能+”行动的意见》正式发布，提出六大行动覆盖科技、产业、全球合作等领域。到2030年，新一代智能终端、智能体等应用普及率超90%，为数字基础设施建设勾勒出了宏大版图。北京皓扬云数据科技有限公司（以下简称:皓扬数据）作为国内 AI 算力中心开拓先锋，以覆盖全国的超大规模交付能力服务于数百家头部企业。两位创始人已在�

人工智能数字基础设施 AI算力中心
政策引领人工智能教育全面启动，猿力科技人工智能通识课覆盖千校

国务院推动“人工智能+”行动，北京中小学新学期首次系统开设人工智能通识课程，每学年不少于8课时。猿力科技旗下飞象星球成为重要推动力量，其课程覆盖小学至初中全学段，包含10门课程、160节课，实践导向突出。该课程已服务北京298所学校、9.8万名学生，并推广至全国25个省市超1000所学校，覆盖15万学生，成为国内覆盖最广的人工智能通识课程之一。

人工智能教育中小学课程国务院政策
字节跳动否认将推手机产品：探索把自己的AI能力开放给硬件厂商

字节跳动否认年底推出自有手机产品传闻，表示专注于AI大模型技术开发，为手机厂商提供基于大模型的软件解决方案，推动智能交互和个性化推荐功能，旨在改善用户体验并促进行业发展。

字节跳动手机产品 AI能力
荐AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Generator；微软开源 VibeVoice-1.5B 模型

本期AI日报聚焦多项技术突破：阿里通义万相发布Wan 2.2-S2V模型，实现视频音频同步生成；字节跳动研发3D模型生成工具，降低建模门槛；面壁智能推出MiniCPM-V4.5端侧多模态模型；苹果提出RLCF训练法提升模型性能；微软开源VibeVoice-1.5B支持超长语音合成；谷歌Imagen 4正式上线；英伟达发布Jetson Thor机器人计算平台；Genspark推出AI Designer一键生成品牌方案；豆包上线未成年人保护模式。

AI视频生成多模态AI 阿里通义万相
北电数智亮相世界人工智能大会，“四链融合”推动AI产业落地

2025世界人工智能大会“人工智能+”战略领军人才与创新发展论坛圆满落幕。论坛聚焦“人才领航智启未来”主题，汇聚中科院、社科院专家及中国联通、腾讯云等机构代表，围绕“人工智能+”行动分享经验，为AI高质量发展筑牢人才根基、激发创新动能。北电数智CMO杨震出席并发表演讲，分享AI行业落地实践，强调紧跟国家战略，推进产业、创新、人才、资本四链融合，打造面向不同场景的AI解决方案，全方位助力AI产业发展。

人工智能人才领军创新发展
三旺通信入选大湾区人工智能+重点企业榜单TOP50

8月27日，三旺通信在2025深圳国际通用人工智能大会上荣登“2025粤港澳大湾区人工智能+重点企业TOP50”榜单。该公司深耕工业互联领域二十余年，凭借在工业通信、边缘计算等领域的技术积累，积极布局AI应用，将人工智能能力融入智能制造、智慧交通等重点场景，推动产业实现更高效、更安全的数字化升级。未来，三旺通信将继续依托深圳及大湾区创新沃土，以开放姿态拥抱AI产业生态，携手产业链上下游共同推动人工智能与工业互联网的深度融合。

人工智能工业互联边缘计算
迎“人工智能+”政策东风！2025中国智能产业大会&吴文俊人工智能创新大会即将落地常州

在全球AI竞争加剧背景下，国务院印发《关于深入实施“人工智能+”行动的意见》，推动AI与经济社会深度融合。中国人工智能学会主办的“2025第十四届中国智能产业大会暨吴文俊人工智能创新大会”将于8月30-31日在常州举行，聚焦破解AI产业“卡脖子”难题。大会设置15场专题会议和3场特色活动，覆盖基础技术突破、核心应用落地、交叉学科融合等领域，为产学研各界搭建高

人工智能政策利好产业大会
在抖音，AI让心智成为超级链接

你有没有想过，为什么有些品牌内容「爆得很玄」，而有些却能精准击中消费者心扉? 以蓝月亮为例，当这个品牌被提及，有人立刻想到其领先的生物科技「秒溶术」，有人脱口而出「至尊洗衣三锦囊」的洗护智慧，还有人联想到它推动的快洗时代变革。这些多样化的记忆点，不仅塑造了消费者对产品的认知，更在无形中引导着市场需求与品牌之间的精准对接，促成了用户偏

品牌心智消费者认知市场需求
微算法科技(NASDAQ：MLGO)基于人工智能优化构建混合ARIMA模型，提高比特币价格预测准确性

随着数字资产市场兴起，比特币等加密货币价格预测成为焦点。传统模型难以准确捕捉其非线性波动，微算法科技引入AI技术优化ARIMA模型，结合LSTM网络构建混合模型，提升预测准确性。通过AI算法自动处理数据缺失、异常值检测及参数优化，实现更可靠的比特币价格预测，为投资者提供决策支持。

比特币价格预测混合ARIMA-LSTM模型数字资产市场

今日大家都在搜的词：

热文

3 天
7天

AI日报：抖音测试接入豆包AI；即梦接入DeepSeek支持智能提示词生成；Grok语音模式全面开放

字节跳动回应即将发布AI眼镜：早期探索阶段没有发布计划

深入实施“人工智能+”，伊顿助力皓扬数据打造 AI 算力中心标杆

政策引领人工智能教育全面启动，猿力科技人工智能通识课覆盖千校

字节跳动否认将推手机产品：探索把自己的AI能力开放给硬件厂商

荐AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Generator；微软开源 VibeVoice-1.5B 模型

北电数智亮相世界人工智能大会，“四链融合”推动AI产业落地

三旺通信入选大湾区人工智能+重点企业榜单TOP50

迎“人工智能+”政策东风！2025中国智能产业大会&吴文俊人工智能创新大会即将落地常州

在抖音，AI让心智成为超级链接

微算法科技(NASDAQ：MLGO)基于人工智能优化构建混合ARIMA模型，提高比特币价格预测准确性

今日大家都在搜的词：

热文

雷军凌晨3点就奔赴阅兵观礼台佩戴小米AI眼镜前往

小米澎湃OS 3首批Beta版更新“3.0.0.24”发布

华为发布首款MateTV：超薄设计搭载旗舰性能 8999元起预售

三大运营商回应是否支持eSIM版iPhone：需等待通知

OPPO A6 Pro定档 9 月 9 日发布：开启手机六年耐用新时代

AI日报：抖音打击AI技术滥用行为；OpenAI 收购开发数据分析平台

尊界S800选配星空顶涨价3万：价格上调至 8 万元

AI日报：苹果明年推出SiriAI搜索；OpenAI放开ChatGPT Projects

苹果折叠屏iPhone或将采用真全面屏形态：告别刘海与挖孔

曝苹果Vision Air头显2027年登场：售价腰斩重量更轻

雷军凌晨3点就奔赴阅兵观礼台佩戴小米AI眼镜前往

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列

小米澎湃OS 3首批Beta版更新“3.0.0.24”发布

华为发布首款MateTV：超薄设计搭载旗舰性能 8999元起预售

华为MatePad Mini外观公布支持蜂窝网络通话功能

AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

腾讯回应被米哈游起诉：没正式程序不能违规提供QQ用户资料

苹果新增三款过时产品 iPhone 8 Plus被列为复古产品

抖音升级AI内容标识功能上线两项核心功能

站长商机