11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。
本期AI日报聚焦多项技术突破:MiniMax发布低延迟语音合成系统Speech 2.6,实现实时交互;蚂蚁数科与宁波银行打造的金融AI方案入选国际标准;智源推出具身操作能力的Emu3.5多模态模型;Cursor 2.0通过自研模型实现多智能体协同编程;xAI升级Grok新增视频生成功能;OpenAI推出可定制安全模型;TikTok推出AI剪辑工具Smart Split;微软发布强化学习框架Agent Lightning提升大模型训练效率。
Soul App近日开源其播客语音合成模型SoulX-Podcast,专为多人多轮对话场景设计。该模型支持中、英、川、粤等多语言及方言,可生成超60分钟流畅自然、角色切换准确、韵律丰富的语音对话。除播客场景外,在通用语音合成及克隆任务中表现优异,能灵活调节节奏与副语言元素(如笑声),提升语音真实感与表现力。此次开源旨在携手开发者探索AI语音在内容创作与社交生态中的更多可能。
本期AI日报聚焦多项技术突破:豆包推出全自动有声剧系统,实现98%角色识别准确率;Adobe Firefly Image 5支持400万像素原生输出及AI音轨生成;Soul发布90分钟无中断播客生成模型;360推出全球首款L2-L4全栈智能平台;IBM发布可在普通设备运行的Granite 4.0 Nano模型。市场方面,移动端AI用户突破7亿,豆包领跑原生应用;PayPal与OpenAI合作使ChatGPT集成支付功能;谷歌推出AI营销工具Pomelli,可基于URL自动生成营销内容。
在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周,微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器,夸克则在国内推出了新的「对话助手」功能。 这一系列消息背后,新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化,入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式,自然语言就是未来的编程语言。 在海外市场,OpenA
苹果在前不久正式推出了新款M5 MacBook Pro,不过在外观上缺乏明显变化,可能给人留下了苹果只是升级了M5芯片就完事”的印象。 然而最新的测试显示,其固态硬盘速度也有着大幅提升,对比M4 MacBook Pro,读写速度最高竟提升了211%。 根据Max Tech的对比测试,M5和M4 MacBook Pro在内部布局、单风扇和单热管散热方案上保持一致,都采用了两颗NAND闪存芯片以最大化SSD性能。 不过,在
小米商城最新上架了一款REDMI显示器A27Q Type-C版2026”,售价899元。 27英寸IPS面板,分辨率25601440(2K),16:9显示比例,静态对比度1300:1,典型亮度300nits,响应时间6ms,支持120Hz高刷新率与178广视角。
亚数TrustAsia推出LiteSSL公益项目,旨在解决HTTPS普及中TLS/SSL证书部署成本高、流程复杂等痛点。该项目提供免费、自动化证书服务,基于国产可信根证书实现全球兼容,通过本土化验证节点提升效率,并支持ACME协议实现一键部署。LiteSSL致力于构建开放安全生态,邀请开发者共同推动HTTPS成为互联网默认配置,筑牢数据传输安全基石。
本文汇总近期AI领域重要动态:月之暗面再获数亿美元融资,显示资本对国产大模型的信心;Anthropic为Claude推出记忆功能,兼顾个性化与隐私保护;中科大与字节发布MoGA长视频生成模型,实现分钟级高质量生成;腾讯ima2.0升级任务模式,可自主拆解复杂流程;阿里夸克AI眼镜开启预售,融合拍摄与智能功能;微软Copilot新增群聊、记忆与Edge AI模式;Opera推出深度研究代理ODRA提升�
在AI与高性能计算推动下,存储技术不再局限于容量突破,更致力于性能、能效与兼容性的全局优化。忆联消费级SSD AE531以QLC介质为基础,通过架构创新与智能温控实现存储密度提升超30%、运行温度≤60℃及无缝兼容三大突破。其采用优化的DRAM-less架构,顺序读写达6800/5600MB/s,4K随机读写达700K/800K IOPS,突破传统QLC性能瓶颈。产品通过7000余项测试,支持全平台兼容与硬件加密,以高密度、低功耗、强兼容的核心竞争力重新定义消费级SSD的TCO价值体系,推动TB级存储普及。