首页 > 外闻 > 关键词  > 谷歌最新资讯  > 正文

谷歌语音输入新增自动加标点功能:看起来搞砸了用户们的信息

2020-02-08 11:51 · 稿源: cnbeta.com

据外媒报道,谷歌开始在其语音输入中加入了自动加注标点符号的功能,看起来这个功能让事情变得一团糟,并且用户还不能关掉它。值得注意的是,Gboard听写不受该功能影响,只有没有实体键盘输入的谷歌语音输入模式才在影响范围内。用户需要在一个名为“谷歌语音输入(Google voice ty

......

本文由站长之家合作伙伴自媒体作者“cnbeta.com”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 亚马逊入局竞逐AR眼镜行业,Meta/谷歌/微美全息以“硬件+生态”双赛道策略领先

    亚马逊正加速布局AR眼镜市场,开发两款产品:面向物流司机的"Amelia"和面向消费者的"Jayhawk"。科技巨头纷纷入局,Meta、谷歌、苹果等均在研发相关产品。中国消费级AR眼镜市场2025年上半年增长显著,销量达26.2万台,同比增长73%。行业预计未来三年规模有望达千亿级别,AR眼镜正从"小众玩具"迈向"大众智能终端"。

  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

  • 微博CEO称iOS 26微信语音没声音 网友同样中招 以为手机坏了

    微博CEO王高飞反映,iOS 26 Beta 1更新后微信语音通话首次接通无声音,需挂断重拨。多名网友反馈相同问题,甚至怀疑手机故障。微博智搜称,这是Beta系统的兼容性缺陷,已提供临时解决方案。iOS 26.1 Beta新增Apple Intelligence多语言支持及AirPods实时翻译功能,电话应用键盘采用全新液态玻璃设计。

  • 逗哥配音平台:千款AI配音演员覆盖全行业,重新定义语音创作边界

    随着内容创作行业蓬勃发展,高质量、多风格的配音需求日益增长。国内领先的AI语音技术平台——逗哥配音,凭借上千款精选音色和全面的行业适配能力,成为众多专业机构和个人创作者的首选方案。平台拥有超千款声音,覆盖不同年龄、声线和风格,可调参数达数十种,实现“千声千面”的语音多样性。其声音资源具备极强的行业适配性,适用于小说、影视解说、新闻播报、课程培训等多种场景,并针对ASMR、角色对话等专项优化。逗哥配音已整合文案提取、视频去水印等工具,打造一站式创作平台,显著提升内容产出效率。未来计划扩大声音库规模,深化垂直行业适配,并开放自定义音色训练功能,推动AI配音从技术辅助逐步进化为创意产业的核心生产力工具。

  • 全球AI计算规模效应拐点凸显,谷歌/阿里/微美全息开启云智算“战略博弈”之争

    谷歌作为英伟达顶级芯片大买家,通过云服务向OpenAI等客户提供算力,同时加速自研AI芯片布局。阿里巴巴加大AI与云计算投资,与博世深化合作推动企业数字化转型。微美全息构建全场景算力覆盖体系,聚焦新型算力系统突破。AI产业持续发力,从消费转向AI与云计算投资,行业有望受益于新老玩家共同推动的高韧性增长。AI算力应用价值进一步凸显,推动技术迭代与行业水平提升。

  • 小米开源首个原生端到端语音大模型 支持音频重建任务和音频转文本任务

    小米发布首款开源端到端语音大模型Xiaomi-MiMo-Audio,拥有12亿参数,在智能性、情感表达和交互适配方面接近人类水平。该模型最大技术突破在于少样本学习能力,通过创新预训练架构和超一亿小时训练数据,成功突破传统语音模型依赖大规模标注数据的技术瓶颈。基于Transformer架构,支持音频重建和音频转文本等多任务处理。小米已在Huggingface平台发布预训练和指令微调版本,并在Github开源Tokenizer模型,为研究者和开发者提供完整工具链。

  • 即构发布云端实时语音识别服务

    ZEGO云端实时语音识别服务针对直播、语聊、在线课堂和会议等场景,提供低延迟(端到端600ms)、高准确率(提升40%)、低成本(节省50%以上)的解决方案。支持30多种语言及方言,适配多厂商接入,具备降噪和回声消除能力。核心应用包括实时字幕和AI观众互动,显著提升用户体验和业务效率,助力企业全球化布局。

  • AI日报:小米开源首个原生端到端语音大模型;通义万相Wan2.2-Animate正式开源;Suno v5即将上线

    AI日报今日聚焦多项技术突破:小米开源首个端到端语音大模型Xiaomi-MiMo-Audio;通义万相推出全新动作生成模型Wan2.2-Animate;Suno即将发布革命性音乐模型v5;生数科技获数亿融资,视频生成技术商业化加速。同时关注OpenAI修复ChatGPT安全漏洞,谷歌将Gemini集成至Chrome浏览器,Luma AI发布支持16位色的Ray3视频生成模型,法国Mistral推出开源推理模型Magistral Small 1.2,Notion发布AI智能体,腾讯混元3D Studio提升3D创作效率。

  • 谷歌Gmail新功能“Help Me Write”将很快支持语音输入

    谷歌的人工智能辅助电子邮件起草功能“HelpMeWrite”即将迎来语音输入的支持。这一新功能旨在使用生成式人工智能帮助用户更轻松地起草电子邮件,并目前仍处于实验室测试阶段。这一系列举措显示了谷歌在整合人工智能技术方面的持续努力。

  • 小红书语音评论更新:可识别音色了 支持甜嗓、气泡音、元气音等

    近日,小红书平台上的语音评论功能引发网友热议。据媒体报道及多名网友在社交平台分享,小红书不仅推出了语音评论,还进一步升级,新增了音色识别功能,用户现在可以选择甜嗓、气泡音、元气音等多种音色进行评论。 回溯至7月下旬,小红书的部分用户便惊喜地发现,评论区悄然出现了语音评论的选项。当时,小红书官方明确表示,该功能尚处于内测阶段,并未全量�

今日大家都在搜的词: