首页 > AI头条  > 正文

Claude 移动应用即将推出语音模式,支持多种声音选项

2025-05-06 11:09 · 来源: AIbase基地

Anthropic 的 Claude 移动应用即将迎来一次重要升级,新增的语音模式功能备受期待。据 TestingCatalog 周日的报道,Claude 的语音模式将采用推按式对话方式,并且支持多种声音选项。

在语音模式下,Claude 不仅可以进行语音对话,还具备了网页搜索的能力。用户在使用时,搜索结果将以列出来源的方式呈现,类似于其桌面版本。输出结果会被整理成要点,使得用户更容易理解和跟进。同时,用户也可以在一个可滚动的视图中浏览 Claude 的回复,提升了互动体验。

QQ_1746500903571.png

此外,语音模式还支持文件上传功能。用户可以将图片或文档添加到对话中,并在与 Claude 进行语音交流时将这些文件作为上下文参考。这一功能的引入使得 Claude 在处理复杂任务时更加灵活和高效。

不过,报道指出,Claude 的语音模式在使用时不支持对话中的中断。用户需要手动点击按钮,随时发送输入,以控制对话的进程。这一点与 ChatGPT 的语音模式有所不同,但报道称 Claude 在语音输入的稳定性和可靠性上表现更佳。

语音模式的引入使得 AI 聊天机器人在实时翻译、模拟面试、克服写作障碍、会议准备及导游服务等方面应用广泛。例如,一位来自印度的学生通过 ChatGPT 用卡纳达语与司机讨价还价,体现了语音助手在实际生活中的便利。

划重点:

📢  Claude 移动应用即将上线语音模式,采用推按式对话并支持多种声音选项。  

🔍  语音模式支持网页搜索,输出结果以要点形式呈现,用户可方便浏览。  

📁  该功能还支持文件上传,让用户可以在对话中使用图片或文档作为上下文参考。

  • 相关推荐
  • “无限量”供应Claude,就是AI IDE们的百亿补贴

    Anthropic于2025年7月28日宣布,将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用,一次使用成本甚至高达数万美元,远远超过普通订阅预期。 同样在上个月,Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制,导致大量用户抱怨“实际上并非无限”,纷纷在社群中吐槽,迫使公司CEO出面道歉、甚至给出退款补偿。 这两�

  • GPT-5和Claude 4 Opus谁更强?用这个AI大模型对比工具一眼明了

    OpenAI正式发布GPT-5,与Claude4Opus和Gemini2.5Pro进行对比测试。GPT-5在编程能力(SWE-bench测试74.9%)和数学推理(AIME2025测试94.6%)表现突出;Claude4Opus编程优异(72.5%)但数学较弱(33.9%);Gemini2.5Pro擅长长文本处理(100万token窗口)和多模态应用。价格方面,GPT-5和Gemini2.5Pro定价相近($1.25-$10),Claude4Opus较高($15-$75)。建议根据需求选择:GPT-5适合综合应用,Claude4Opus适合专业编程,Gemini2.5Pro适合长文档�

  • ChatGPT语音模式增添新功能:可调语速 支持0.5到2.0倍速

    OpenAI为其ChatGPT网页应用的语音模式推出新功能,加入语音速度”调节与自定义指令前缀”,同时配合此前升级的模型选择器,进一步提升用户体验。 新增的语音速度”选项让用户可通过滑块自由调整ChatGPT的语速,范围从0.5倍速到2.0倍速,不过该功能目前仍处于隐藏状态,尚未正式开放。 自定义指令前缀”功能则允许语音模式记住用户的特定要求,避免重复输入。系统明确�

  • GPT-5正式发布:与Claude 4、Gemini 2.5等主流大模型谁更胜一筹?

    2025年8月7日,OpenAI正式发布GPT-5,官方称其为"最智能、最快速、最实用"的AI模型。GPT-5在数学推理能力上大幅提升,在AIME2025测试中取得94.6%的高分,处理速度也有明显改善。但与竞争对手相比仍存在差距:Claude4在代码生成和逻辑推理方面表现优异,支持200K token长文本;Gemini2.5具备2M超大上下文窗口和全模态支持;国产模型DeepSeek R1在中文理解和性价比方面具有优势。AI�

  • 蓝耘元生代MaaS × Kimi K2 × Claude CodeUI,开启编程效率革命

    蓝戟元生代MaaS平台推出"Kimi K2×Claude CodeUI"AI编程解决方案,通过国产首个万亿参数MoE架构开源模型Kimi K2驱动Claude Code,实现本地化部署。该方案具有三大优势:1)成本直降90%,免翻墙使用;2)支持128K超长上下文处理,编程能力超越主流模型;3)提供600万token免费额度。平台采用交互式界面设计,支持移动端操作和WebSocket通信,集成文件管理、Git工具和会话追踪功能,�

  • 三星推出Galaxy Buds3 FE耳机新品:带来更加智能、时尚的音频新体验

    三星电子于2025年8月18日发布新款智能耳机Galaxy Buds3 FE,主打亲民价格与高端性能。新品延续标志性刀锋设计,配备升级版主动降噪(ANC)和Galaxy AI功能,支持跨设备无缝切换和语音交互。通过增强型扬声器实现三频均衡音效,超宽频通话技术确保清晰沟通。耳机采用哑光双色半透明设计,支持与三星生态设备联动,提供智能翻译等AI功能。将于9月5日上市,提供银雾灰、暗羽黑两种配色,进一步扩展三星Galaxy生态体验。

  • AI日报:百度推全球首批AI数字员工;Claude Opus4.1出世;谷歌DeepMind发布世界模型Genie 3

    AI日报栏目聚焦人工智能领域最新动态:1)Claude Opus4.1发布,编程能力提升74.5%;2)OpenAI开源GPT-OSS-120B和20B模型;3)谷歌DeepMind推出革命性3D世界模型Genie3;4)谷歌Gemini新增AI故事书生成功能;5)ElevenLabs推出商用AI音乐生成器;6)百度智能云发布首批AI数字员工;7)OpenAI估值或达5000亿美元;8)00后创业者推出云端AI协作开发工具Vinsoo;9)腾讯启动2026校园招聘,重点培养AI人才;10)马斯克宣�

  • 大模型技术赋能声音创作:逗哥配音引领AI语音合成新浪潮‌

    逗哥配音作为国内领先的AI配音平台,凭借自主研发的语音合成大模型技术,已服务超千万创作者,累计生成音频量突破270亿次。其核心技术突破包括:1)支持40种语言,语音质量MOS分提升0.25,拟人度超83%;2)首创"AI分角功能",将多角色配音效率提升90%以上;3)建成覆盖近千款发音人的全球声库,包含方言、外语及影视角色音;4)创新"真人声纹+AI增强"模式,

  • 奔跑的爱缺少主角的声音!歌手乐队招募,每个声音都值得被珍藏!

    “奔跑的爱·快递小歌”音乐作品征集活动引发全国关注,但暴露出快递员群体参与度低的现实问题。活动虽收到105首歌曲和137篇歌词,但快递小哥报名者寥寥。项目组推出三大行动呼吁企业推荐员工、开辟绿色投稿通道、号召同行转发,并提供品牌植入舞台等专属权益。这场专为千万快递人打造的音乐会,能否真正让主角站上舞台,取决于行业企业的支持力度。

  • 夜宵顶流小龙虾为何“不香”了:受多种因素影响

    曾经红极一时的小龙虾夜宵经济,近期正经历前所未有的寒冬。据餐饮行业数据显示,2024年以来全国小龙虾门店闭店率达37.2%,多地出现养殖户低价抛售、网红店批量倒闭的景象。这场席卷产业链的危机,暴露出供需失衡、消费分流、创新乏力等多重困境。 某小龙虾摊主无奈表示:"现在年轻人更爱泰式柠檬虾、潮汕生腌这些新口味,十三香和蒜蓉已经提不起兴趣。"这�

今日大家都在搜的词: