11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
标贝科技发布"十万音色·自然语音数据集",覆盖中英双语,包含10万种音色样本(中文5万、英文5万),基于近百万小时原始数据经智能生产线精细打磨。该数据集在规模、真实性和准确性三大核心指标实现突破,支持多情感表达和跨场景应用,涵盖基础情绪到特定风格,话题涉及多个领域。通过音频质量筛选、文本转写校正、说话人分离等技术,从海量数据中甄选出高质量样本,为语音识别、合成等AI模型训练提供坚实基础,助力实现更自然、真实的语音交互体验。
7月16日,语音输入创企 Willow Voice 宣布完成420万美元天使融资,由 YC 领投;而就在几天前,6月25日另一家语音输入创企 Wispr Flow 也宣布完成了3000万美元 A 轮融资。 此前,我们一直在观察 AI 语音赛道,但能拿到融资的基本都是做语音合成,也就是“输出”。比如赛道头部的 ElevenLabs,在今年1月份,完成了 C 轮2.5亿美元融资,估值达到30亿美元以上。 但最近的2笔融资,貌似在释�
OpenAI推出新一代语音模型GPT-4o系列,包括语音转文本和文本转语音功能,开发者可通过API接入。趣丸科技推出的"趣丸千音"平台依托MaskGCT模型,在语音相似度、质量和稳定性上取得突破,实现视频翻译全流程自动化,日处理量超1000分钟,效率提升10倍。该技术已应用于短剧出海、新闻视频多语言分发等场景,使译制周期从30天缩短至3天,海外用户增长300%。AI语音技术正�
快科技3月4日消息,今天全国人大代表、小米集团创始人、董事长兼CEO雷军在2025全国两会上将提出5项建议。其中,雷军提出了关于加强AI换脸拟声”违法侵权重灾区治理的建议”。雷军看到了AI换脸拟声”积极的一面:人工智能深度合成技术的快速发展,推动了AI换脸拟声”在影视、广告、社交等领域的广泛兴起,成为喜闻乐见、传播力强、易成热点的技术应用。但同时雷军也�
联发科与意腾科技宣布,将协同合作为车用、智慧家庭,以及智慧零售市场打造创新的AI语音解决方案,并于CES2025展出。双方合作将致力于提升用户与汽车、智能设备的互动体验,为全球用户带来更智能、安全且直观的生活方式。联发科与意腾科技合作,不仅把业界先进的AI声学前处理技术导入至全系列天玑汽车座舱平台,同时也将先进的AI解决方案带入智慧家庭市场和智慧零�
对话嘉宾:Ping,闪念贝壳创始人,前久邦数码、淘宝设计师,前爱范儿合伙人&副总裁对话背景:做了一款AI语音笔记,但又不只做一款语音笔记。我想让科技不像科技;他说,我讨厌人们说世界是个草台班子,没必要太努力;他说,每一个想法都有可能变成珍珠;他说,成功最快的方法是立马行动;他说,改变世界是一个非常有向往、非常有价值、非常有勇气的事情。我的「闪念贝壳�
两名声优PaulSkyeLehrman和LinneaSage在周四在纽约联邦法院对人工智初创公司Lovo提起了诉讼,指控该公司在其AI配音技术中非法复制和使用他们的声音。他们声称Lovo欺骗他们提供声音样本后,未经许可销售他们声音的AI版本。该案件编号为hrmanv.LovoInc,美国纽约南区联邦地区法院,案号1:24-cv-03770。
AI语音再进化,人耳还能听出AI和真人的差别吗?以上两段音频demo来自微软最近更新的AI语音角色“晓晓”。逼真、情绪到位、语气自然、断句近乎完美,是绝大多数网友听到“晓晓”声音时给出的评价。在技术抹平内容创作门槛的同时,内容创作也将前所未有的“卷”,如何打造差异化内容,是每一个创作者都需要思考的问题。
微软近期对其AzureAI语音服务进行了重大升级,推出了9种新的更真实的AI语音,旨在为用户带来更加自然和沉浸式的对话体验。这次升级的核心是引入了零样本学习的文本到语音模型,这些模型在提高合成语音自然度的同时,更好地模仿了提示语音中的特征。微软的这次升级,无疑将为各种业务场景提供更加丰富和真实的语音交互体验。
一款名为O1的AI语音设备引起了广泛关注。这款设备可以让用户无论身处何地,都能轻松地通过语音控制家里的电脑完成任务。随着AI技术的不断发展,我们有理由相信,O1将会为用户带来更加便捷、智能的生活。