谷歌搜索引入语法检查模型EdiT5 提高语法纠正准确性

2023-10-27 15:08 · 稿源：站长之家

💡 划重点:
- Google研究团队开发了一种高效的语法纠正模型，基于EdiT5架构，使用户能够在Google搜索中检查查询的语法。
- 这一模型采用了新颖的文本编辑方法，降低了解码延迟，提高了纠正的准确性，同时结合了大型语言模型（LLMs）的优点。

站长之家（ChinaZ.com）10月27日消息:Google的研究团队最近开发了一种高效的语法检查模型，它将语法检查引入了Google搜索，为用户提供了一种在查询语法方面的辅助工具。这一模型基于EdiT5架构，通过新颖的文本编辑方法，极大地减少了解码延迟，提高了语法纠正的准确性。

传统的语法错误纠正（GEC）方法通常将其视为翻译问题，并使用自回归变换器模型逐个标记解码响应，条件是以前生成的标记。然而，这种方法的效率较低，因为解码不能并行进行。文章指出，通常只需要对输入文本进行少量修改，因此可以将GEC视为文本编辑问题，仅使用自回归解码器生成修改，从而显著降低GEC模型的延迟。

EdiT5模型基于T5变换器编码器-解码器架构，采用了一些关键的修改。它使用编码器来确定要保留或删除的输入标记，这些保留的标记构成了初步的输出。此后，解码器输出缺失的标记，并使用指针机制指示每个新标记的放置位置，以生成语法正确的输出。与传统的GEC方法相比，解码器只运行少量步骤，从而提高了效率。

为了降低解码器延迟，研究团队将解码器减少到单层，并通过增加编码器的大小来进行补偿。实验结果表明，EdiT5大型模型相比具有248M参数的T5基础模型，提供了9倍的速度提升，同时提高了修正的准确性。EdiT5模型的平均延迟仅为4.1毫秒。

此外，研究团队还介绍了如何使用大型语言模型（LLMs）的优点，结合EdiT5的低延迟，通过硬蒸馏技术训练了教师LLM，用于生成学生EdiT5模型的训练数据。他们还详细解释了如何生成更干净和一致的训练数据，并通过自训练和迭代改进等技术提高了数据的质量。

他们开发了两种基于EdiT5的模型，分别用于语法错误校正和语法分类。在使用语法检查功能时，查询首先经过校正模型，然后通过分类模型检查输出是否确实正确。这种分离的分类模型有助于更容易在精度和召回率之间进行权衡，并减少了为模糊或无意义的查询提供错误或混乱校正的风险。

谷歌的这一语法检查功能基于EdiT5模型架构，为用户提供了一种检查其查询语法的有效方式，进一步提升了Google搜索的用户体验。

（举报）

相关推荐

关键词：

荐AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测试；小红书发布DynamicFace人脸生成技术

本期AI日报聚焦多项AI领域创新：1）阿里开源Qwen-Image-Edit图像编辑模型，支持中文渲染与精准文本编辑；2）淘宝测试"AI万能搜"功能，重构电商搜索体验；3）小红书发布DynamicFace人脸生成技术，实现高质量图像视频换脸；4）Gemini API新增URL Context功能，简化网页内容获取流程；5）Nvidia推出小型开放模型Nemotron-Nano-9B-v2，支持智能推理开关；6）马斯克发布Grok Imagine 0.1测试版，进军AI图像生成领域；7）Vercel推出iOS版AI开发工具v0；8）理想汽车发布MindGPT 3.1模型，处理速度提升5倍；9）ToonComposer工具简化动画制作流程；10）ElevenLabs推出视频到音乐生成流程。

AI 开源图像编辑
荐AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃发布语音大模型Step-Audio 2 mini

AI日报栏目每日更新AI领域热点内容，聚焦开发者需求。本期重点包括：阶跃星辰发布端到端语音大模型Step-Audio2 mini，在多项基准测试中表现优异；9月1日起AI生成内容需强制标识；美团推出开源大模型LongCat；上海AI实验室发布多模态大模型InternVL3.5；腾讯ARC团队推出音频生成模型AudioStory；OpenAI发布实时语音模型GPT-realtime；Meta与UCSD合作推出DeepConf技术；xAI代码库遭窃事件；阿里巴巴Qwen团队发布GUI自动化框架；微软推出Copilot Labs实验中心；小红书自动化工具xiaohongshu-mcp上线。

AI 语音大模型 Step-Audio2mini
百度正式发布AI搜索APP“梯子AI”：主打无广告智能搜索！

百度旗下的AI搜索AppTizzy.ai”已完成了前期的测试，并正式更名为梯子AI”上架。这款应用最初于8月10日发布，当时名称为Tizzy.ai”，更新后版本号从1.0.0直接跳至1.2.0。据介绍，梯子AI定位为智能搜索助手，依托百度多个大模型能力开发而成，主打无广告智能搜索，整合深度思考、资源检索及影视娱乐功能，致力于为用户提供简单搜索，一触即达”的极致体验。

AI搜索智能助手百度大模型
荐AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”发布；谷歌推全新Gemini 2.5 Flash图像编辑模型

本文汇总了AI领域最新动态：谷歌推出Gemini 2.5 Flash图像编辑模型，字节发布Waver 1.0视频生成工具；百度“梯子AI”提供无广告搜索；文心快码新增终端编码功能；腾讯游戏VISVISE工具集提升动画制作效率；自动驾驶配送机器人RM5进军外卖行业；DeepSeek V3.1出现字符Bug已修复；谷歌翻译升级实时同传和AI陪练；全球首现AI勒索软件PromptLock威胁网络安全；Anthropic推出Chrome浏览器AI助手Claude。

AI Gemini 2.5
谷歌Pixel 10系列发布：首发Tensor G5芯片售价799美元起

今日凌晨，谷歌Pixel10系列正式发布，该系列包含Pixel10、Pixel10Pro及Pixel10Pro XL三款直板旗舰机型，起售价定为799美元（约合人民币5733元）。与此同时，谷歌还推出了首款折叠屏旗舰Pixel10Pro Fold，进一步丰富了产品线。在设计语言上，Pixel10系列延续了上代的经典

谷歌Pixel10 Pixel10系列折叠屏旗舰
5岁男童牙齿长肿瘤手术取出几十颗医生：这些情况务必检查

近日，河南省儿童医院口腔科接诊了一例特殊病例:5岁男童乐乐（化名）因龋齿就医时，意外发现下颌骨内藏有牙瘤。CT影像显示，病变区域布满数十颗形态各异的牙齿状组织，犹如被封存的“牙齿森林”。主刀医生介绍，这种名为牙瘤的病变虽非恶性肿瘤，却是牙胚组织异常增生形成的瘤样畸形，若未及时干预可能影响颌骨发育。手术过程中，医疗团队从乐乐颌骨内完整�

牙瘤儿童口腔疾病龋齿并发症
推荐2025年必种草的AI一键ppt转视频创作工具

文章介绍了三款AI工具（课件帮、Visionstory、Fliki），可将静态PPT快速转换为动态视频微课。这些工具操作简便，支持自动生成口播稿、多语言配音、智能字幕及动画效果，适用于教育、企业培训等多种场景，无需专业技能即可上手，大幅提升视频制作效率。

PPT转视频视频创作工具 AI视频制作
AI最新资讯在哪里看？AIbase：高效获取国内外AI新闻头条与行业动态

文章探讨了AI时代信息过载的困境：有价值的前沿动态、重磅模型发布和行业解读分散各处，筛选成本高、效率低下。AIbase资讯导航站应运而生，通过四大核心功能解决痛点：1)聚合主流信源，过滤低质噪音；2)结构化分类呈现大模型动态、行业应用等六大板块；3)提炼核心要点，拒绝标题党；4)高频更新确保信息鲜度。该平台致力于成为AI领域的"信息雷达"，帮助用户节省70%信息搜集时间，将精力聚焦于思考与创造。适用于技术负责人快速掌握行业动态、产品经理调研案例、投资人捕捉趋势等多元场景。

人工智能 AI资讯科技媒体
荐因为GPT-5，这群人决定在Reddit上起义。

这个周末，对OpenAI的抗诉，好像从未如此热闹过。起因自然还是因为GPT-5。 OpenAI上了GPT-5当天，做了一个非常神奇的操作，他们只保留了GPT-5，然后把GPT-4.5、GPT-4o、o3什么的，全都砍掉了。

GPT-5
电子证件（Digital ID）的全球信任度全景：亚洲、中东与非洲领先，欧美市场滞后

Checkout.com最新全球调研报告显示，不同地区对电子证件（digital ID）的接受度存在显著差异。亚洲、中东和非洲消费者对电子证件和生物识别认证表现出高度信任，而欧洲和北美则态度谨慎。AI电商代理的兴起进一步凸显了数字身份验证在交易中的重要性。报告强调，建立数字信任对全球商业发展至关重要，需行业和政策制定者优先考虑数字身份管理方式。

电子证件生物识别认证数字身份系统

今日大家都在搜的词：

热文

3 天
7天

谷歌搜索引入语法检查模型EdiT5 提高语法纠正准确性

荐AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测试；小红书发布DynamicFace人脸生成技术

荐AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃发布语音大模型Step-Audio 2 mini

百度正式发布AI搜索APP“梯子AI”：主打无广告智能搜索！

荐AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”发布；谷歌推全新Gemini 2.5 Flash图像编辑模型

谷歌Pixel 10系列发布：首发Tensor G5芯片售价799美元起

5岁男童牙齿长肿瘤手术取出几十颗医生：这些情况务必检查

推荐2025年必种草的AI一键ppt转视频创作工具

AI最新资讯在哪里看？AIbase：高效获取国内外AI新闻头条与行业动态

荐因为GPT-5，这群人决定在Reddit上起义。

电子证件（Digital ID）的全球信任度全景：亚洲、中东与非洲领先，欧美市场滞后

今日大家都在搜的词：

热文

华为MatePad Mini外观公布支持蜂窝网络通话功能

AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃

抖音升级AI内容标识功能上线两项核心功能

苹果新增三款过时产品 iPhone 8 Plus被列为复古产品

小米汽车8月交付量超3万台全年交付量有望冲击42万

特斯拉Model 3长续航后轮驱动版降价1万元售价25.95万起

小鹏汽车：8月共交付新车37709台单月交付量创历史新高

零跑汽车8月交付57066台增长超88%

腾讯回应被米哈游起诉：没正式程序不能违规提供QQ用户资料

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

华为MatePad Mini官宣9月4日发布

2025民营企业500强揭晓：京东第一

今日七夕节微信 520 元大额红包限时上线

AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

realme真我15000mAh电池容量手机亮相

华为三折叠屏手机Mate XTs非凡大师上架开启预约

史上最大Mate！华为智慧屏MateTV将于9月4日发布

AI日报：海螺AI首尾帧功能上线；元石科技发布问小白5；OpenAI发

小米澎湃OS 3发布：帧率更稳功耗更低

站长商机