11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。
本期AI日报聚焦多项技术突破:MiniMax发布低延迟语音合成系统Speech 2.6,实现实时交互;蚂蚁数科与宁波银行打造的金融AI方案入选国际标准;智源推出具身操作能力的Emu3.5多模态模型;Cursor 2.0通过自研模型实现多智能体协同编程;xAI升级Grok新增视频生成功能;OpenAI推出可定制安全模型;TikTok推出AI剪辑工具Smart Split;微软发布强化学习框架Agent Lightning提升大模型训练效率。
ColorOS 16正式版于10月30日启动推送,首批覆盖11款OPPO和一加热门机型。该系统引入极光引擎、潮汐引擎与繁星编译器三大流畅技术,实现感官、性能与底层的全方位提升。极光引擎打造业内首个“无缝隙架构”,确保全场景丝滑交互;潮汐引擎首发芯片级动态追帧技术,系统重载流畅度提升37%,功耗降低13%;繁星编译器首创安卓跨级融合编译技术,大幅提升低算力芯片性能。此次升级将增强品牌市场竞争力,为用户带来更出色的使用体验。
Soul App近日开源其播客语音合成模型SoulX-Podcast,专为多人多轮对话场景设计。该模型支持中、英、川、粤等多语言及方言,可生成超60分钟流畅自然、角色切换准确、韵律丰富的语音对话。除播客场景外,在通用语音合成及克隆任务中表现优异,能灵活调节节奏与副语言元素(如笑声),提升语音真实感与表现力。此次开源旨在携手开发者探索AI语音在内容创作与社交生态中的更多可能。
本期AI日报聚焦多项技术突破:豆包推出全自动有声剧系统,实现98%角色识别准确率;Adobe Firefly Image 5支持400万像素原生输出及AI音轨生成;Soul发布90分钟无中断播客生成模型;360推出全球首款L2-L4全栈智能平台;IBM发布可在普通设备运行的Granite 4.0 Nano模型。市场方面,移动端AI用户突破7亿,豆包领跑原生应用;PayPal与OpenAI合作使ChatGPT集成支付功能;谷歌推出AI营销工具Pomelli,可基于URL自动生成营销内容。
苹果计划在明年推出自研基带C2,采用台积电4nm工艺,由iPhone 18系列首发,取代高通方案,实现更自主的通信技术。今年iPhone 16已首发C1基带,支持5G,赢得市场关注。C2将支持5G毫米波技术,提升网络体验。随着苹果自研基带逐步上线,高通在苹果调制解调器市场份额预计到2026年降至20%,对其市场地位产生重大影响。此外,iPhone 18还将首发台积电2nm工艺的A20芯片,标志iPhone进入2nm时代,带来更优性能与能效。
苹果正在研发搭载OLED显示屏的iPad mini、iPad Air、MacBook Pro和MacBook Air机型,苹果已在iPad Pro中采用OLED屏,并计划在未来数月及数年内将OLED推广到更多设备上,从而淘汰LCD屏幕。 具体来看,iPad mini最快会在2026年配备OLED屏,同时会提升防水性能,新款iPad mini也因此涨价100美元。 至于iPad Air,其商用OLED的时间要晚于iPad mini,爆料称2026年春季亮相的iPad Air将继续使用LCD屏幕,但后续
苹果公司10月29日向iPhone用户推送iOS 26.1 RC版更新,内部版本号23B82。此次更新作为iOS 26.1的准正式版本,若无重大漏洞,将成为正式版发布前的最后一次系统更新。正式版预计下周推送。主要更新包括:新增液态玻璃特效开关,用户可切换至"色调"模式提升界面可读性;优化锁屏滑动相机功能,支持关闭避免误触启动;扩展Apple Intelligence语言支持至丹麦语、荷兰语等。值得注意的是,苹果CEO库克此前透露正积极推动Apple Intelligence进入中国市场,但具体落地时间仍待官方确认。整体来看,iOS 26.1在细节优化和功能扩展上表现积极,但国行版Apple Intelligence的缺失仍让用户感到遗憾。
为庆祝iPhone诞生20周年,苹果计划推出特别版机型。该机将首次搭载苹果定制图像传感器及LOFIC技术,通过横向溢出积分电容收集溢出光电子,有效避免高光过曝,显著提升动态范围和光影还原能力。今年7月苹果已提交相关专利,目前正优化原型机。相比传统索尼双层传感器,新技术集成度更高、占用空间更小,有望为iPhone影像系统带来突破性提升。
在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周,微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器,夸克则在国内推出了新的「对话助手」功能。 这一系列消息背后,新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化,入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式,自然语言就是未来的编程语言。 在海外市场,OpenA