首页 > 业界 > 关键词  > AI最新资讯  > 正文

AI入侵播客圈!比真人配音还逼真?实测爆火的微软AI语音角色“晓晓”

2024-04-26 17:58 · 稿源:​头号AI玩家公众号

AI语音再进化,人耳还能听出AI和真人的差别吗?以上两段音频demo来自微软最近更新的AI语音角色“晓晓”。逼真、情绪到位、语气自然、断句近乎完美,是绝大多数网友听到“晓晓”声音时给出的评价。在播客App小宇宙上,“Hacker News”账号用“晓晓”的声音制作了一期节目,听众在评

......

本文由站长之家合作伙伴自媒体作者“​头号AI玩家公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • 屏幕背后一定是真人?警惕AI换脸:公众应仔细甄别

    近期AI换脸技术被不法分子利用进行诈骗活动,引发社会关注。该技术通过面部识别追踪、特征提取和融合等环节,能精准替换人脸图像,甚至支持实时视频换脸。专家指出此类诈骗存在明显破绽:视频通话时面部轮廓可能出现异常模糊。建议公众注意观察对方面部特征,必要时要求其做大幅头部动作来验证身份。遇到亲友视频借款等情况,务必通过多渠道核实身份。同时需警惕陌生人发起的群聊、视频会议等邀请,避免落入犯罪陷阱。

  • 火山引擎推出豆包·语音播客模型:文本秒变双人对话播客,5 秒生成热点音频!

    5月20日,火山引擎推出豆包·语音播客模型,实现文本秒转专业播客内容。该模型三大优势:1)自然流畅的双人对话效果,语音拟真度高;2)支持热点话题即时生成,5秒产出最新资讯播客;3)提供端到端创作链路,支持超长文本/网页链接转播客。相比传统AI播客,解决了内容重复、机械感强等问题。模型即将登陆豆包APP及PC端,6月11日将在火山引擎大会上展示更多功能。

  • 谷歌推出 Beam AI:将普通视频通话,转为逼真的 3D 沉浸式体验

    一位测试用户表示: “你甚至会忘记自己是在用科技交流。眼神是真实的,你能看出对方什么时候想说话,就像现实生活中一样。”

  • AI语音迎来「特斯拉时刻」,一条工作流「吃掉」全球百亿市场

    OpenAI推出新一代语音模型GPT-4o系列,包括语音转文本和文本转语音功能,开发者可通过API接入。趣丸科技推出的"趣丸千音"平台依托MaskGCT模型,在语音相似度、质量和稳定性上取得突破,实现视频翻译全流程自动化,日处理量超1000分钟,效率提升10倍。该技术已应用于短剧出海、新闻视频多语言分发等场景,使译制周期从30天缩短至3天,海外用户增长300%。AI语音技术正�

  • AI搜索混战:谷歌搜索AI Mode反击,纳米AI中国登顶

    文章探讨了AI搜索领域的变革与竞争。谷歌在ChatGPT发布后意识到威胁,迅速调整战略推出AI Overview功能。目前AI搜索产品主要分为三类:原生AI搜索(如Perplexity)、传统搜索增强AI能力(如New Bing)和大模型厂商的搜索产品(如Kimi)。Perplexity凭借"答案引擎"的创新模式快速崛起,通过优化用户提问方式、提供精准答案并标注信息来源,月活用户突破千万。但这类产品面临�

  • 产业不需要炸裂的AI,但需要有用的AI

    我的工作搭子终于懂我的工作了! “昨天开会说了哪些重点?”“这个季度的目标在哪个文档?”以前一旦涉及到动态私有化的工作环境,哪怕是再聪明的大模型产品也无法搞定,工作搭子不懂具体的工作场景,只能手动查找、反反复复传资料。 5月21日,飞书上线了「知识问答」功能,它巧妙地激活企业沉淀在飞书的消息、文档、知识库等丰富信息资产,通过AI实时解析、推理�

  • 微信官方整理多款好用的微信工具:涉及AI效率、AI创意、AI学习

    微信官方近日推出多款AI工具,覆盖效率、创意、学习等场景。AI效率工具可自动生成公众号配图,输入文字描述即可获得AI图片;小程序开发助手能帮助程序员快速生成代码;AI编程学习平台让K12师生5分钟完成小程序开发;"微信搜一搜"新增深度思考功能,提供两种AI模型选择;"微信读书"和输入法也接入AI问答功能,可快速解答问题。这些工具均需在微信生态内使用,旨在提升用户体验和工作效率。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • 雷军不掩饰AI野心了

    搞定汽车和芯片后,雷军下一个攻关目标会是什么?小米在最新一季财报中给出了部分线索。 5月27日晚发布的2025年第一季度财报中,小米公告称由于进一步增加了对AI业务的投入,自2025年第一季度起,小米智能电动汽车等创新业务经营分部,更名为智能电动汽车及AI等创新业务经营分部。 这已经是过去一年中小米第二次更改业务架构。2024年第二季度,在小米首款汽车SU7正式�