11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
Soul App在2025世界人工智能大会上展示了AI社交创新方案,重点呈现了全双工语音/视频通话大模型技术。该技术突破传统"轮次对话"模式,赋予AI自主决策对话节奏的能力,实现更自然的人机互动。平台通过"AI社交练习"主题,展示了AI在群聊派对中的主持能力,能有效活跃气氛、鼓励用户参与。同时,Soul还探索了多模态交互,基于全双工语音和实时视频生成技术,构建"数字人格"促进深度社交连接。作为社交平台,Soul持续深化AI与社区融合,通过智能推荐和虚拟人生态,为用户提供即时情感支持和共鸣,推动社交向"情感共生"进化。CTO陶明表示,AI正深入个体关系网络,将拓展"情价比消费"等全新市场机会。
支付宝5月12日上线好友语音通话功能,支持转账双方直接语音核验身份。该功能特点包括:通话过程展示对方认证真实姓名;不支持变声功能确保真实性;不保存通话内容保护隐私。用户可在隐私设置中选择是否向好友公开真实姓名,通话界面会显示昵称及"已认证"标识。功能支持麦克风和扬声器开关,可开启小窗模式查看支付记录等。通话界面除显示昵称外,还会在头像下方直接展示对方真实姓名。
微信近期对其多人通话功能进行了重要升级,用户现在可以在不创建群组的情况下,直接在双人私聊语音通话界面中邀请更多朋友加入通话。这一更新极大地简化了多人通话的流程,提升了用户体验。此次升级意味着无论是家庭聚会、朋友闲聊还是工作讨论,用户都可以更加轻松地实现多方通话,无需再经过繁琐的群组创建步骤。
微信近日在部分用户中重新启动了一项名为“微信多人邀请通话”的内测功能,该功能允许用户在进行单向通话时邀请多达13位好友加入通话,从无需通过群聊即可实现多人通话。这一功能曾在之前的内测阶段出现,但在正式版本中一度消失,现在又重新回归,目前可能仍处于小范围覆盖测试阶段,其全面上线的可能性尚未确定。微信的这一更新旨在提升用户间的沟通效率,特别是在需要多人同时参与讨论的场景中,如工作会议、家庭团聚或紧急情况沟通。
多名网友在社交平台发帖反映,使用iPhone进行微信语音或视频通话时遭遇频繁中断的问题,尤其是当切换到其他应用程序时,通话会被立刻中断。出现问题的微信版本主要为8.0.53。微信官方尚未对此事做出正式回应,用户们期待问题能够得到尽快解决,以恢复正常的通讯体验。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Kimi推出多功能语音通话模式支持更换声音语速调节Kimi人工智能助手最近推出了备受期待的语音通话功能,为用户带来了丰富的互动体验。Nvidia稳固主导AI芯片市场,市值仅次于苹果,展现强大实力。
社交平台SoulApp语音大模型再次升级,上线自研端到端全双工语音通话大模型,具备超低交互延迟、快速自动打断、超真实声音表达和情绪感知理解能力等特点,能够直接理解丰富的声音世界,支持超拟人化的多风格语言,实现更接近生活日常的交互对话和“类真人”的情感陪伴体验。Soul自研的端到端语音通话大模型能力已上线旗下“异世界回响”实时通话场景,并将在后续拓展至AI苟蛋等多个AI陪伴、AI互动场景。Soul将持续推进多模态端到端大模型能力建设和应用落地,以AI辅助社交、提升关系建立的质量和效率的同时,构建人机交互新场景,让用户可以与AI进行更加有温度、沉浸、趣味的互动交流,不断创新社交体验。
腾讯宣布,腾讯主导的新一代实时语音编码行业标准AVS3P10,即将正式对外发布。由腾讯会议天籁实验室携手腾讯AILab研发的Penguins编解码器,把经典信号处理和最新的深度学习技术结合在一起,突破了传统编码器的天花板。AVS3P10标准,原型是腾讯首款神经网络语音编解码器腾讯会议PenguinsAl语音引擎,在稳定服务腾讯会议、QQ语音通话亿级用户后,开始用这项技术推动行业发展。
IBM研究人员发现了一种相对简单的方法,可以利用生成式AI工具劫持语音通话。这一发现引发了对金融机构等依赖电话验证身份的组织的担忧。这将使聊天机器人困扰,因为它们仍然难以理解基本的会话提示。
如果人工智能真的来抢人类的工作,那么这个星期可能是个好时机,尤其是帮助地球上最忙碌的人的时候。总部位于西雅图的创业公司Fixie,专注于帮助企业将大型语言模型融入其软件堆栈,推出了HiSanta.ai。该公司于三月份完成了一轮1700万美元的种子轮融资。