11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。
Soul App近日开源其播客语音合成模型SoulX-Podcast,专为多人多轮对话场景设计。该模型支持中、英、川、粤等多语言及方言,可生成超60分钟流畅自然、角色切换准确、韵律丰富的语音对话。除播客场景外,在通用语音合成及克隆任务中表现优异,能灵活调节节奏与副语言元素(如笑声),提升语音真实感与表现力。此次开源旨在携手开发者探索AI语音在内容创作与社交生态中的更多可能。
本期AI日报聚焦多项技术突破:豆包推出全自动有声剧系统,实现98%角色识别准确率;Adobe Firefly Image 5支持400万像素原生输出及AI音轨生成;Soul发布90分钟无中断播客生成模型;360推出全球首款L2-L4全栈智能平台;IBM发布可在普通设备运行的Granite 4.0 Nano模型。市场方面,移动端AI用户突破7亿,豆包领跑原生应用;PayPal与OpenAI合作使ChatGPT集成支付功能;谷歌推出AI营销工具Pomelli,可基于URL自动生成营销内容。
2025世界人工智能大会圆满落幕,Soul+App携自研端到端全双工语音通话大模型等创新成果亮相,展示AI重塑社交体验的潜力。该技术打破传统对话模式,支持多人语音互动,提升群聊参与度。Soul还展示多模态交互突破,包括实时视频生成能力,推动社交向“情感共生”进化。未来Soul将继续以“AI+社交”为核心,打造更智能、真实的社交体验,在AI社交赛道持续领跑。
2025年8月1日,第二十二届ChinaJoy将在上海新国际博览中心开幕。作为亚洲规模最大、最具影响力的数字娱乐盛会,ChinaJoy不仅是青年流行文化的标杆性事件,更是全球数字创意产业发展的风向标。社交平台Soul App以"Soul树洞情绪疗愈酒吧"为主题亮相,推出原创IP"莫比乌斯·第三弹"限定款数字文创,展现平台孵化的原生潮流文化。现场观众还能体验Soul最新的AI社交技术,包括与虚拟人即时互动等。Soul通过数字文创产品深度融合平台标志性的"捏脸"文化,让用户通过个性化形象设计展现独特风格,实现情感表达。数据显示,Soul 18-30岁主力用户群体正通过数字文创实现自我探索与身份重构,反映了当代年轻人"情价比"取代传统"性价比"的消费心理。此外,Soul还展示了AI社交创新实践,致力于打造"超类真人"和"深度沉浸"的社交体验,重新定义AI社交范式。
Soul App在2025世界人工智能大会上展示了AI社交创新方案,重点呈现了全双工语音/视频通话大模型技术。该技术突破传统"轮次对话"模式,赋予AI自主决策对话节奏的能力,实现更自然的人机互动。平台通过"AI社交练习"主题,展示了AI在群聊派对中的主持能力,能有效活跃气氛、鼓励用户参与。同时,Soul还探索了多模态交互,基于全双工语音和实时视频生成技术,构建"数字人格"促进深度社交连接。作为社交平台,Soul持续深化AI与社区融合,通过智能推荐和虚拟人生态,为用户提供即时情感支持和共鸣,推动社交向"情感共生"进化。CTO陶明表示,AI正深入个体关系网络,将拓展"情价比消费"等全新市场机会。
TECNO发布PHANTOM Ultimate G Fold概念机,采用创新双屏内折设计,配备9.94英寸柔性大屏,折叠状态下厚度仅11.49mm,展开后最薄处3.49mm,刷新三折手机轻薄纪录。其核心创新在于独特的G型三折结构,通过左右双内折实现屏幕完全内藏保护,并配备外屏保证折叠状态下的常规使用体验。该机采用精密双铰链系统,支持多角度悬停,搭配2000MPa高强度钢铰链和0.3mm超薄钛纤维背板,兼顾强度与轻薄。量产版将搭载高性能芯片、多焦段三摄系统和超5000mAh电池,重新定义旗舰折叠屏体验。
4chan 之死是“一个时代的终结”,互联网的边缘或许已被铺平,但它的幽灵依然萦绕在互联网中……
IEEE国际计算机视觉与模式识别会议CVPR2025公布论文录用结果,社交平台SoulApp技术论文《Teller:Real-TimeStreamingAudio-DrivenPortraitAnimationwithAutoregressiveMotionGeneration》被接收。SoulApp团队在论文中提出了一个新的面向实时音频驱动人像动画的自回归框架,解决了视频画面生成耗时长的行业挑战外实现了说话时头部生成以及人体各部位运动的自然性和逼真性。Soul将把最新的AI能力尽快落地到站内多元场景中,如即将上线的实时视频通话能力将融入平台的AI虚拟人情感化陪伴体系“虚拟伴侣”、多对多互动场景“群聊派对”等功能中,进一步提升平台AI虚拟人的交互能力,以及人机交互的在场感和情感温度,为用户带来有趣、温暖的社交体验。
在三星Unpacked活动中,三星展示了它和谷歌合作开发的头戴式设备三星ProjectMoohanVR耳机。从工业设计上来看,ProjectMoohan很像苹果VisionPro,用户看完还以为是苹果的头戴式设备。新品会在2025年晚些时候上市。