首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:抖音测试接入豆包AI;即梦接入DeepSeek支持智能提示词生成;Grok语音模式全面开放

2025-03-05 15:21 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、抖音打通豆包AI,字节跳动开启超级AI生态战略

抖音App正在测试接入豆包AI,标志着字节跳动加速推进AI生态布局。通过在短视频界面和消息列表中开放入口,抖音旨在打破AI产品与流量平台的壁垒,提升AI能力并引入更多用户流量。字节内部还在推进多条AI产品业务线,展现出全方位的AI产品生态系统。

【AiBase提要:】

📱 抖音正在测试接入豆包AI,开放两个战略性入口,提升AI能力和用户流量。

💡 字节跳动内部推进多条AI产品线,覆盖多个领域,展现全方位的AI生态系统。

🏆 互联网巨头对AI技术在内容生态中的应用高度重视,开启新的AI服务生态时代。

2、强强联合!即梦接入DeepSeek 从提示词到绘画一步到位

即梦与DeepSeek的合作为AI绘画爱好者带来了极大的便利。通过DeepSeek的智能提示词生成功能,用户不再需要为创作灵感而烦恼,只需简单输入需求,便能获得精准的提示词,进而生成高质量的图像。这一创新的联动不仅提升了创作效率,还让绘画过程变得更加流畅和愉悦。

2.png

【AiBase提要:】

🖌️ 即梦接入DeepSeek,提供智能提示词生成功能,解决用户创作难题。

✨ 用户只需输入简单需求,DeepSeek即可生成详细精准的提示词,提升创作效率。

🌟 DeepSeek生成的提示词质量高,能够有效引导AI生成高质量图像,用户反馈良好。

3、Grok 语音模式全面开放:11种模式上线,自带字幕成英语学习利器

xAI公司的AI助手Grok正式向所有用户开放其备受期待的语音模式,带来了11种独特的语音交互模式和语音字幕功能。这一更新不仅增强了用户的互动体验,还为英语学习者提供了新的学习工具。用户对这一更新反响热烈,虽然目前仅支持英文,但Grok的多样化表达和流畅度已获得用户的高度评价,未来扩展语言支持的期待也在不断增加。

image.png

【AiBase提要:】

🎤 Grok的语音模式现已向所有用户开放,提供11种独特的交互风格,包括2种18+限制模式。

📚 新增的语音字幕功能帮助用户更好地理解内容,成为英语学习的实用工具。

🌍 用户对Grok的流畅度和情感表达给予高度评价,期待未来能支持更多语言。

4、vivo重组调整,成立新AI部门并将大模型训练转向端侧

vivo最近在其组织架构上进行了重要调整,成立了新的AI部门,显示出其在人工智能领域的持续投入与战略布局。新部门将专注于大模型的端侧训练,并且暂停了对商业化的考核,反映出vivo对AI技术长远发展的重视。此外,vivo还推出了DeepSeek-R1,提升了AI助手的智能化水平,进一步推动了用户体验的提升。

【AiBase提要:】

🆕 vivo新设立AI部门,标志着公司在人工智能技术上的持续投入和战略布局。

📉 由于管理干预,vivo决定暂时不对AI大模型的商业化进行考核,并暂停资金投入。

🚀 最新推出的DeepSeek-R1提升了AI助手的智能化水平,用户体验得到了显著改善。

5、全新技术 Fast3R :实现千张图片一键3D 重建,速度惊人!

Fast3R是一种创新的多视角3D重建技术,能够在一次前向传播中处理多达1500张图片,显著提高重建速度。与传统的DUSt3R方法相比,Fast3R利用基于Transformer的架构并行处理视图信息,省去复杂的对齐过程,提升了推理速度并减少误差积累。

【AiBase提要:】

🌟 Fast3R技术可以在一次前向传播中处理多达1500张图片,大幅提高3D重建速度。

⚡ Fast3R的Transformer架构支持并行处理,省去传统方法的复杂对齐过程。

🚀 与DUSt3R相比,Fast3R在时间和内存使用上展现出显著优势,适用于大规模3D重建应用。

详情链接:https://fast3r-3d.github.io/

6、音乐创作领域投下核弹!DiffRhythm 炸裂问世:10秒 AI 神曲,人声伴奏一键搞定!

DiffRhythm的问世标志着音乐创作的新时代,它通过扩散模型实现了端到端的自动生成音乐,用户只需输入歌词和风格,即可在短短10秒内获得一首完整的歌曲。DiffRhythm不仅能生成伴奏,还能自动创作歌词,完美契合旋律,颠覆了传统音乐创作的模式,开启了AI音乐创作的新纪元。

image.png

【AiBase提要:】

🎤 DiffRhythm通过扩散模型实现端到端的音乐创作,用户只需输入歌词和风格即可生成完整歌曲。

⚡ 生成速度极快,仅需10秒钟便可完成一首4分45秒的歌曲,速度是传统方法的50倍。

🎼 内置强大的大语言模型,能够自动创作歌词并与旋律完美匹配,彻底颠覆传统作曲方式。

详情链接:https://huggingface.co/spaces/ASLP-lab/DiffRhythm

7、微软开源图片模型ART,可生成多图层透明图片

在图像生成领域,微软研究人员推出的“Anonymous Region Transformer”(ART)技术,革新了用户与生成模型的互动方式。通过匿名区域布局,ART能够根据全球文本提示直接生成多层透明图像,并引入逐层区域裁剪机制,大幅提升生成效率,速度比传统方法快12倍。

image.png

【AiBase提要:】

🌟 ART可根据全球文本提示和匿名区域布局,直接生成多层透明图像。

⚡️ 采用逐层区域裁剪机制,显著提高了图像生成效率,比传统方法快12倍。

💡 新型高质量自编码器支持多层透明图像的精确控制与生成,推动交互式内容创作。

详情链接:https://art-msra.github.io/

8、AI思维导图神器 MindMapper :扔个链接就能生成交互式思维导图

在信息爆炸的时代,Mind Mapper 应用程序成为了思维整理的得力助手。它能够将用户的想法转化为生动的思维导图,只需输入网址、YouTube 视频链接或文本提示,便能快速生成互动式思维导图。

image.png

【AiBase提要:】

🖥️ Mind Mapper 能够将想法转化为生动的思维导图,支持网址、视频链接和文本提示输入。

🎨 采用 Mermaid.js 技术,思维导图不仅美观,还具备动态交互功能,用户可轻松获取详细信息。

📤 提供将思维导图下载为 PNG 图片的功能,方便用户分享知识和灵感。

详情链接:https://github.com/misbahsy/MindMapper

9、雷军亮相首场代表通道:小米将把最新的AI技术应用到各个终端上

在全国人大十四届三次会议的首场“代表通道”上,小米创办人雷军接受了记者提问,深入探讨了小米在制造业中的角色及科技创新方向。他强调制造业是国家的基石,小米将加大研发投入,特别是在人工智能领域,以提升消费者的科技体验,并助力中国式现代化。

【AiBase提要:】

🏭 制造业是国家立国之本,小米将坚定走科技创新和高端化发展道路。

💰 小米计划在2021至2025年间投入1050亿元用于研发,2025年预计投入300亿元,AI相关业务占四分之一。

🌍 小米致力于将最新的AI技术应用于手机、汽车和智能家居等领域,提升全球市场的影响力。

10、爱诗科技完成A5轮融资,剑指AI视频生成领域新高地

爱诗科技近日宣布完成A5轮融资,由靖亚资本独家投资,融资额已超4亿元,成为AI视频生成领域的明星企业。公司成立于2023年,由前字节跳动视觉技术负责人王长虎创立,团队背景强大,迅速获得多方投资者青睐。此次融资将用于加速研发和引进人才,致力于打造领先的AI视频生成大模型及应用。

image.png

【AiBase提要:】

📈 爱诗科技完成A5轮融资,融资额已超4亿元,成为AI视频生成领域的明星企业。

🌍 其产品PixVerse已拥有超过4000万用户,月活跃用户达1500万,技术实力领先。

💼 公司计划加速模型研发与高端人才引进,积极拓展B端企业服务,面临商业化挑战。

举报

  • 相关推荐
  • 北京国际人力获评世界品牌莫干山大会“人工智能+”生态创新实践范本

    5月9日,第十个中国品牌日之际,2026世界品牌莫干山大会“搜索·点赞·传播品牌好故事论坛”在浙江德清举办,发布“人工智能+”生态创新实践范本。北京国际人力旗下万维招聘AI智能招聘平台获评“人工智能+”创新产品。论坛聚焦品牌强国建设,北京国际人力以47年行业积淀,推出全流程智能招聘平台,针对传统招聘痛点,运用大模型等技术构建PC端、微信小程序、线下求职一体机三位一体服务矩阵,赋能企业招聘管理与求职者职业成长,彰显国企担当,助力“中国服务”品牌高质量发展。

  • OpenAI成立OpenAI部署公司:帮助企业构建人工智能系统

    OpenAI正式成立OpenAI 部署公司”,在帮助企业构建人工智能系统。 同时,OpenAI已同意收购Tomoro一家专注于将AI转化为运营优势的应用 AI 咨询与工程公司。 新成立的部署公司由OpenAI控股,无论客户是与OpenAI、OpenAI部署公司,还是与两者同时合作,都将获得统一的服务体验。

  • 得一微担任世界人工智能眼镜联盟(WAEA)董事会员,共推AI眼镜存力新前景

    近日,“2026AI眼镜产业生态大会”在深圳举行,汇聚全球顶尖企业与专家,探讨产业创新趋势。得壹微电子(YEESTOR)作为国内领先AI存力芯片设计企业受邀出席,被授予“世界人工智能眼镜联盟(WAEA)董事会成员单位”。大会指出,AI眼镜正从极客玩具迈向大众消费品,预计2026年全球出货量将突破2368万台。得壹微电子深耕存力主控芯片,为AI眼镜提供从端到云的全栈存力支持,推动端侧AI与智能穿戴生态规模化商用。

  • 豆包付费是字节整理Agent生态的开始

    这是《窄播weekly》的第89期,本周我们关注的商业动态是:豆包开始筹划付费,国内头部AI助手的竞争要从免费的Chatbot阶段进入到付费的Agent阶段了。 5月4日,豆包的App Store页面出现了订阅服务声明,在免费的基础版之外,增加了三个付费版本:标准版连续包月每月68元,连续包年每年688元;加强版连续包月每月200元,连续包年每年2048元;专业版连续包月每月500元,连续包年每年5088�

  • 字节腾讯扎堆入局AI恋陪,女性向游戏要变天?

    游戏界打开AI新市场,作为近年来异军突起的女性向游戏赛道同样也开始引入AI。 女性向游戏已经在大众视野中崭露头角。伽马数据发布的《女性向游戏调研报告》显示,女性向游戏近年来成为游戏产业增长最快的赛道,展现出显著的商业潜力与市场拉动作用。2024年中国女性向游戏市场规模达80亿元,同比提升124.1%,增速远超行业平均水平。 从去年起,腾讯、米哈游、网易等

  • 全球首个大规模量产AI Box亮相北京车展,面壁智能与英特尔持续深化端侧AI合作

    在第十九届北京国际汽车展览会上,面壁智能与英特尔联合推出全球首款大规模量产的AI Box解决方案。该方案基于英特尔Core Ultra平台,提供高达180Tops的AI算力,支持35B参数模型运行,覆盖多种模型形态。它通过低耦合方式为存量车型提供智能升级,并为新车提供灵活算力扩展,推动座舱交互从“功能智能”向“类人智能体”演进。双方长期合作,此次产品是技术适配走向成熟产品的重要成果,展示了端侧AI在汽车场景的巨大潜力。

  • 领润生态落子 AI 基建?超掘科技重塑地下智能掘进新范式

    地下工程面临三大痛点:地质复杂导致设备停机事故频发、传统施工依赖人工经验且熟练技工加速流失、恶劣环境影响工程稳定性。超掘科技提出"AI装备+群体智能"解决方案,通过地质感知融合、物联网泛在感知、边缘计算协同、大数据集群控制四张王牌,实现毫秒级地质模型更新、多设备自主分工与无人化集群作业。对标马斯克The Boring Company,更聚焦中国硬岩地质,采用"装备销售+管控制授权+数据运营"复合模式,切入千亿美元级市场。

  • Moka 2026 产品发布会:用三位 AI “同事”,迎接 AI 原生组织时代

    Moka于2026年5月13日在北京举办产品发布会,将旗下HR SaaS全面升级为Moka AI,推出三位AI“同事”——招聘Eva、人事Eva和BP Eva,以及底层引擎Moka AI Studio。这标志着Moka从工具向智能伙伴的转型,旨在帮助组织应对AI原生时代的挑战。通过AI同事主动推进招聘、人事事务和人才管理,Moka试图将HR从执行者转变为组织架构师,同时实现软件定制化,迎接千企千面的新时代。

  • 中国优秀的AI企业有哪些?科技巨头——联想集团用“AI原生”战略给出答案

    联想集团作为中国优秀AI企业的标杆,通过混合式AI战略和ESG双重底色展现多维竞争力。其不仅在CDP气候、水安全及供应商参与度三项评级中获最高“A”级,连续三年蝉联供应商参与度A级,更在AI领域加速布局,提出成为AI原生公司目标,预计营收突破5600亿元。通过构建从终端到云端的全栈AI能力,联想推动AI规模化应用,并深度融合绿色供应链管理,实现技术与社会责任的平衡,成为全球AI竞赛中不可忽视的中国力量。

  • 抖音和QQ抢“杀马特”?

    ​抖音做社交多年,一直困扰于一个基本问题:到底做哪个人群的社交? 以前,抖音试图和微信PK,做所有人的社交。但过去一段时间,抖音开始有了新的答案:抓住05后乃至10年后的年轻人,和QQ抢人。 这种新策略,体现在了最新的产品功能上。 近日,抖音悄然上线了一个新功能“星光商城”,入口位于App首页下方“消息”标签页的左上角。 用户可充值获取虚拟货币“星光”

今日大家都在搜的词: