首页 > 原创 > 关键词  > AI有声剧最新资讯  > 正文

AI日报:豆包推全自动多人配音系统;Adobe Firefly Image 5重磅升级;Soul语音模型SoulX-Podcast发布

2025-10-29 16:07 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、AI有声剧革命爆发!豆包推全自动多人配音系统,98%角色识别准确率,媲美专业广播剧

豆包语音团队推出的‘AI多人有声剧’全自动生产方案,该方案能够从原始小说文本直接生成高质量的广播剧,无需人工干预。其核心在于高自然度多角色语音合成引擎,能精准区分角色并赋予符合性格和情绪的语调,同时智能添加背景音乐与音效,提升沉浸感。该技术已在番茄小说APP落地,用户反响热烈,标志着AI在音频内容领域的重大突破。

image.png

【AiBase提要:】

🤖 AI多人有声剧全自动生产方案,实现端到端无人化制作。

🔊 高自然度多角色语音合成引擎,角色识别准确率达98%以上。

🎼 智能添加背景音乐与音效,营造电影级沉浸听觉体验。

2、Adobe Firefly Image 5重磅升级:400万像素原生生成、AI音轨+自定义模型,创作者迎来“全栈式”AI创作时代

Adobe Firefly Image 5的发布标志着AI图像生成进入专业级赛道。该版本支持400万像素原生输出,提供分层式提示编辑、自定义艺术风格模型以及AI语音与配乐生成功能,全面打通图像、视频和音频的AI创作闭环。

image.png

【AiBase提要:】

🔥 Firefly Image 5支持400万像素原生生成,显著提升图像质量与细节表现。

🎨 用户可训练专属艺术风格模型,确保输出内容符合个人艺术语言。

🎵 新增AI语音与配乐生成功能,结合ElevenLabs语音模型,降低创作门槛。

3、Soul语音模型SoulX-Podcast震撼发布:90分钟无中断播客生成,AI语音革命再升级

SoulX-Podcast语音模型的发布标志着AI语音技术在播客领域的重大突破,其高保真、稳定性以及多语言支持为内容创作提供了全新可能。

image.png

【AiBase提要:】

🎙️ 支持中英双语及方言,实现多语言播客生成。

🔊 实现90分钟无中断语音生成,提升播客内容质量。

🗣️ 零样本克隆技术,支持个性化语音定制。

详情链接:https://github.com/Soul-AILab/SoulX-Podcast

4、360发布全球首款L2-L4全栈智能体平台!政企AI转型迎来“开箱即用”时代

360集团发布了全球首款L2-L4全栈智能体平台,旨在为政府与企业提供一站式AI落地解决方案,解决了政企在引入智能体时的三大障碍,并启动了行业生态合作计划以加速产业渗透。

【AiBase提要:】

🧠 360发布全球首个覆盖L2至L4全阶段能力的智能体操作系统,推动智能体从单点突破走向规模化复制。

🔒 SEAF智能体工厂支持私有化部署与信创环境适配,确保数据不出域、模型可审计,解决政企“不能用、不好用、不放心”的问题。

🤝 启动“千行行业生态合作计划”,联合软硬件厂商、系统集成商与行业ISV,打造标准化智能体解决方案。

5、IBM 发布 Granite 4.0 Nano 模型,突破小型 AI 模型的性能极限

IBM 推出了四款新的 Granite 4.0 Nano 模型,这些模型可以在普通笔记本电脑或浏览器中本地运行,展示了公司在人工智能领域对高效与可及性的重视。所有模型均在 Apache2.0 许可下发布,适合研究人员、企业和独立开发者使用,并且支持商业用途。

image.png

【AiBase提要:】

🧠 IBM 发布 Granite 4.0 Nano 模型,支持在普通硬件上运行,提升了小型 AI 模型的可用性。

🛠️ 所有模型均在 Apache2.0 许可下发布,适合研究和商业用途,确保了开放性和兼容性。

📈 最新基准测试显示,Granite 4.0 模型在性能上超越同类产品,展现了高效的处理能力。

详情链接:https://huggingface.co/blog/ibm-granite/granite-4-nano

6、2025年三季度AI应用市场现状:移动端用户突破 7 亿,豆包夺原生AI APP月活第一

2025年三季度AI应用市场展现出强劲的增长势头,移动端AI应用用户规模突破7亿,其中AI应用插件表现尤为突出。然而,PC端应用增速相对缓慢,仅少数应用实现正增长。

image.png

【AiBase提要:】

📱 移动端 AI 应用用户突破 7 亿,增长主要源于厂商的模型升级和生态协同。

🚀 AI 应用插件表现突出,特别是在月活跃用户中占据领先地位。

📉 PC 端应用增速放缓,85% 以上的网页应用月活跃用户低于 50 万。

7、PayPal与OpenAI达成合作,ChatGPT成为首个集成支付平台!

PayPal 与 OpenAI 达成重要合作,ChatGPT 成为首个集成支付平台,将极大便利线上购物体验,并推动智能代理型电商的发展。

【AiBase提要:】

🤖 ChatGPT 将成为 PayPal 首个集成支付钱包,用户可直接在其中完成购物支付。

💰 PayPal 股价盘前飙升超15%,显示出市场对合作的高度认可。

🛍️ OpenAI 正在拓展 ChatGPT 的电商功能,已与 Shopify、Etsy 和沃尔玛达成合作。

8、谷歌推AI自动营销工具Pomelli,输入网站URL即可生成营销内容

谷歌与DeepMind合作推出的Pomelli AI工具,旨在帮助中小型企业快速生成符合品牌调性的社交媒体营销内容,降低营销门槛并提升效率。

image.png

【AiBase提要:】

🧠 品牌剖析:通过扫描网站和图像,构建全面的品牌画像。

💡 创意生成:基于品牌DNA,自动生成针对性营销活动idea。

🎨 资产输出:产出高质量营销资产,并支持实时调整。

详情链接:https://labs.google.com/u/0/pomelli/about/

举报

  • 相关推荐
  • 豆包语音识别模型2.0发布:能听懂字看懂图 支持13种外语

    今日,火山引擎发布豆包语音识别模型2.0(Doubao-Seed-ASR-2.0),依托Seed混合专家大语言模型架构构建。 据介绍,2.0版本模型推理能力提升,可以通过深度理解上下文完成精准识别,上下文整体关键词召回率提升20%。 同时支持多模态视觉识别,不仅听懂字”还能看懂图”,通过单图和多图等视觉信息输入让文字识别更精准。

  • 对标豆包!微信输入法iOS版3.0开启内测:支持方言语音输入

    微信输入法自上线以来,凭借无广告、界面简洁、支持PC联动等特点获得良好口碑。近期,豆包输入法正式上线,给微信团队带来竞争压力。目前iOS微信输入法已开启3.0版本内测,主要升级了语音输入体验,包括模型升级、支持更多方言和英文识别、超长语音记录及待机时长功能。新版本语音识别准确度高,甚至能自动标注标点。不过,多数用户仍不习惯语音输入,对于习惯打字的用户而言,此次升级体验变化不大。

  • 豆包输入法iOS版迎来首次更新!优化耗电、语音输入更方便了

    日前,豆包输入法iOS版迎来发布后的首次更新,最新版本升级至0.8.1。 本次更新重点优化了耗电表现、设置首页样式,并新增语音输入后的修改推荐功能,同时修复了多项已知问题,整体体验进一步完善。

  • 李楠:豆包手机是今年技术最激进的AI设备

    怒喵科技创始人李楠发文表示,豆包手机是今年技术上最激进的AI设备。 自从豆包手机上架以来,市场给予了近乎狂热的反馈,该机定价是3499元,一经上市便被抢购一空,二手平台炒至8000元以上,这款AI设备由字节跳动旗下的豆包团队和努比亚联合打造。 你只需发出语音指令,豆包手机上的AI助手就能自动在屏幕上点击、滑动,跨越App的边界,完成点外卖、比价等一系列操�

  • 黄仁勋:未来两三年90%的新知识由AI合成

    英伟达CEO黄仁勋近日在一档节目中表示,未来两到三年内,全球约90%的新知识可能都将由人工智能合成生成。 但他同时指出,这尽管听起来令人震惊,但其本质与人们从陌生人编写的教科书中学习并无不同:无论知识来自人类还是AI,我们仍然需要对其进行事实核查,并验证其是否基于可靠原理。问题的核心并不在于由谁生成”,而在于信息是否可靠”。 此外,黄仁勋提到�

  • 天一冷就长胖的原因找到了:脂肪合成速度变快

    课本上不是说热胀冷缩”吗?为什么寒流一来,身材却像气球似的膨胀起来了?一夏天的成果转眼就被冷风吹回来了。不少网友问,为什么天冷容易发胖呢? 据报道,当气温降低,为了维持体内恒温,人体会本能地储存更多的脂肪来抵御寒冷。此时人体脂肪合成代谢速度比平时快2~4倍,而脂肪分解代谢速度低于平时的10%。如此一来,脂肪合成多于代谢,脂肪囤积导致肥胖。 �

  • 罗永浩点赞豆包手机 称AI助手一定会遍地开花

    罗永浩发文支持豆包手机,称技术革命不可阻挡,无论大小应用或国家都无法阻拦。他赞扬字节跳动迈出第一步的勇气,并相信AI助手未来将如繁花般普及,成为生活不可或缺的一部分。此外,豆包手机系统软件中出现锤子科技遗留字样及经典铃声,引发网友猜测与讨论。

  • 努比亚总裁倪飞回应与字节合作推出“豆包手机”:AI手机发展势不可逆

    豆包手机”在上周横空出世,这是字节为了展示豆包手机助手发布技术预览版,与中兴努比亚合作开发的工程样机,型号是nubia M153。 该机配备骁龙8至尊版芯片,定价3499元,开售后被火速抢光。 在各大博主和用户体验过之后,其深度AI操作引发了巨大关注,隐私等问题也导致一些主流App进行封禁。

  • 荣耀工程师谈豆包手机:AI时代新的交互模式探索

    字节跳动AI模型豆包发布手机助手技术预览版,内置与中兴合作的工程样机努比亚M153上小范围发售。豆包手机被视为AI时代交互模式新探索,尝试将AI能力深度整合进硬件闭环。但不少应用已对其限制,互联网厂商想借鸡下蛋建护城河挑战不小。未来AI手机需更多体验闭环,需战略耐心。豆包助手团队称将限制部分使用场景,包括刷分、刷奖励等,部分游戏类场景,暂时下线操作银行、互联网支付等金融类应用能力。同时正积极寻求与各应用厂商深度沟通,希望推动形成更清晰、可预期的规则。

  • 方飞:豆包手机让荣耀团队兴奋 荣耀AI赛道有了新伙伴

    荣耀终端股份有限公司产品线总裁方飞在微博发文表示,豆包手机”这两天被高度关注,AI手机赛道有了新伙伴的加入,这让荣耀的AI团队振奋。 我们看到演示视频中展示了与豆包助手视频通话,让豆包全网比价、收藏咖啡厅等等场景,看过视频的朋友是否觉得眼熟?没错,豆包手机助手实现了对通用场景的支持并自动执行,这与荣耀AI从特定任务向通用化执行的发展道路是一

今日大家都在搜的词: