首页 > AI头条  > 正文

​谷歌 Docs 上线 AI 语音朗读功能,文档阅读更轻松

2025-08-20 09:32 · 来源: AIbase基地

谷歌近日宣布,Google Docs 推出了一项全新的功能,用户现在可以通过 AI 生成语音来朗读他们的文档。此功能旨在提升用户的阅读体验,使得信息的获取更加便捷和生动。

在这一功能的使用过程中,用户可以自定义 AI 的音频输出,包括选择不同的声音和调整播放速度。这种个性化设置能够帮助用户根据自己的喜好来选择最适合的听觉体验,使得文档内容的传达更具吸引力。

image.png

不仅仅是文档的创建者可以使用这一功能,其他读者也能够轻松访问共享文档的 AI 生成音频。用户只需在工具菜单中选择 “音频” 选项,再点击 “收听此标签” 即可开始聆听。此外,文档的作者也可以通过插入音频按钮,将可自定义的音频添加到文档中,读者点击按钮后即可开始收听。这种设计让阅读和分享文档变得更加有趣。

谷歌早在四月份就曾透露将推出将文档转换为 AI 播客的计划,而这次的新功能则提供了一个更直接的听取文档内容的方式,特别是对于那些希望聆听自己创作的内容的用户。目前,该功能仅支持在桌面设备上生成英文文档的音频版本。

谷歌目前正向拥有商业、企业或教育计划的 Workspace 用户,以及订阅 AI Pro 和 Ultra 的用户推出此功能。随着这项新功能的逐步上线,用户将能以更便捷和灵活的方式享受文档的内容,进一步提升工作效率和阅读体验。

划重点:

🎤 AI 语音朗读:Google Docs 推出 AI 语音朗读功能,提升文档阅读体验。  

🔗 共享音频访问:读者可以通过简单操作聆听共享文档的 AI 生成音频。  

⚙️ 个性化定制:用户可自定义音频的声音和播放速度,享受个性化听觉体验。

  • 相关推荐
  • 百度搜索PC端全量上线AI功能

    百度对外宣布其搜索PC端首页已完成全量升级,将传统信息入口一举升级为任务中枢,为用户带来前所未有的智能搜索体验,进一步巩固了其在国内AI搜索行业的领先地位。 此次升级后的百度搜索PC端首页亮点纷呈。新增的“超级智能双行框”成为一大核心亮点,它支持用户一键进行深度搜索,无论是面对复杂的专业问题,还是多维度信息需求,都能快速给出精准且全面的解答

  • ChatGPT语音模式增添新功能:可调语速 支持0.5到2.0倍速

    OpenAI为其ChatGPT网页应用的语音模式推出新功能,加入语音速度”调节与自定义指令前缀”,同时配合此前升级的模型选择器,进一步提升用户体验。 新增的语音速度”选项让用户可通过滑块自由调整ChatGPT的语速,范围从0.5倍速到2.0倍速,不过该功能目前仍处于隐藏状态,尚未正式开放。 自定义指令前缀”功能则允许语音模式记住用户的特定要求,避免重复输入。系统明确�

  • CleanMyMac上线云存储清理功能

    CleanMyMac推出全新"云存储清理"功能,支持iCloud和OneDrive两大主流云服务。该功能提供统一可视化界面,可批量删除云端和本地的重复文件,或仅解除同步保留云端文件。通过滚动列表和可视化图谱两种模式,帮助用户高效管理存储空间。所有操作均在本地完成,确保数据安全。软件提供7天免费试用,并推出Basic基础版和Plus高级版两种套餐,现有用户可免费升级体验Plus全部功能。未来计划支持腾讯云、百度云等中国本土云平台,持续优化Mac存储管理体验。

  • 腾讯推出「鹅家守护」功能:守护老人孩子安全,已全国上线

    腾讯地图推出"鹅家守护"功能,专为老人和儿童家庭设计。该功能支持实时定位、行动轨迹查看、紧急求助及电子围栏设置,当被守护人超出安全范围或出现跌倒等异常时,系统会立即向守护人发出提醒。通过微信服务号实现信息即时触达,并采用多重身份验证和数据加密保障隐私安全。目前该功能已在全国上线,用户可通过最新版腾讯地图创建守护圈,支持多人协同守护,让家人随时掌握老人和孩子的安全状况。

  • AI日报:可灵2.1推出全新首尾帧功能;昆仑万维上线AI音乐模型Mureka V7.5;腾讯云推出AI开发工具CloudBase AI CLI

    本文介绍了AI领域最新动态:1)快手可灵2.1推出首尾帧功能,提升视频生成效果;2)昆仑万维发布Mureka V7.5音乐模型,优化人声表现;3)腾讯云推出AI开发工具CloudBase AI CLI,可减少80%编码量;4)海外新品MuleRun通过虚拟机和AI Agent带来创新游戏体验;5)Meta开源DINOv3视觉模型,无需标注即可实现卓越性能;6)宇树科技人形机器人H1获1500米赛跑金牌;7)谷歌Gemini新增记忆功能和隐私聊天模式;8)香港大学开源OpenCUA框架,打造个性化电脑助手;9)OpenAI考虑在ChatGPT引入广告;10)谷歌发布超小型开源模型Gemma 3 270M,支持手机端运行。

  • 苹果新功能曝光!Siri可通过语音指令操控第三方APP:2026年上线

    苹果公司正在积极开发一套全新的AI系统,计划通过Siri取代用户在智能手机上的手动操作流程。 这一创新功能将纳入新的系统架构App Intents”,使Siri能够在多款第三方应用中替用户执行指令,用户只需通过语音下达指令即可完成任务。 据彭博社报道,此次 AI 升级将引入生成式AI技术,显著提升Siri对上下文的理解能力,甚至可以读取屏幕内容,从而增强交互体验。 新功能预�

  • AI日报:阿里开源Qwen-Image-Edit;淘宝“AI万能搜”功能灰度测试;小红书发布DynamicFace人脸生成技术

    本期AI日报聚焦多项AI领域创新:1)阿里开源Qwen-Image-Edit图像编辑模型,支持中文渲染与精准文本编辑;2)淘宝测试"AI万能搜"功能,重构电商搜索体验;3)小红书发布DynamicFace人脸生成技术,实现高质量图像视频换脸;4)Gemini API新增URL Context功能,简化网页内容获取流程;5)Nvidia推出小型开放模型Nemotron-Nano-9B-v2,支持智能推理开关;6)马斯克发布Grok Imagine 0.1测试版,进军AI图像生成领域;7)Vercel推出iOS版AI开发工具v0;8)理想汽车发布MindGPT 3.1模型,处理速度提升5倍;9)ToonComposer工具简化动画制作流程;10)ElevenLabs推出视频到音乐生成流程。

  • 重磅!标贝科技推出「十万音色·自然语音数据集」 重构AI语音训练基础设施

    标贝科技发布"十万音色·自然语音数据集",覆盖中英双语,包含10万种音色样本(中文5万、英文5万),基于近百万小时原始数据经智能生产线精细打磨。该数据集在规模、真实性和准确性三大核心指标实现突破,支持多情感表达和跨场景应用,涵盖基础情绪到特定风格,话题涉及多个领域。通过音频质量筛选、文本转写校正、说话人分离等技术,从海量数据中甄选出高质量样本,为语音识别、合成等AI模型训练提供坚实基础,助力实现更自然、真实的语音交互体验。

  • 豆包悄悄上线的这个新功能,也能用眼睛推理全世界了。

    ​上周我写过一篇AI产品自用分享,当时我说,AI知识问答方面,我会选择openai o3和豆包。 PC场景下,o3比较多,而手机场景下,我用的比较多的还是豆包。 虽然ChatGPT也有app,但一旦手机开了魔法,微信啥的还有一些其他的应用,就很容易卡,非常的不方便。 所以我前两天在上海逛ChinaJoy的时候,看到一些忘了的图,或者是我不懂的梗,我都是随时随地问豆包。 比如这个暴�

  • 苹果iOS 18.6.1正式版发布:美版Apple Watch血氧功能上线

    今日,苹果公司如期向iPhone用户推送了iOS18.6.1正式版更新,距离上一次正式版发布仅过去16天。尽管此次更新并未给国行用户带来功能上的显著变化,但它却为美版Apple Watch用户带来了一个期待已久的好消息——血氧检测功能的回归。 据更新日志详细说明,此次iOS18.6.1更新特别针对美国市场的Apple Watch Series9、Series10以及Apple Watch Ultra2用户,重新启用了血氧检测功能。用户现在�

今日大家都在搜的词: