首页 > 业界 > 关键词  > Google最新资讯  > 正文

谷歌工程师通过优化信息内容片段而提升搜索结果质量

2022-08-11 17:00 · 稿源: cnbeta

在周四的一篇博客文章中,谷歌研究员兼搜索副总裁 Pandu Nayak,谈到了该团队如何帮助用户找到更高质量信息的新方法。据悉, 尽管 Google 搜索本意通过特色信息片段(Featured Snippets)来增强用户体验,但它也会在有些时候帮倒忙 —— 比如助长虚假信息在搜索文本框下的传播。

1.jpg

(来自:Google Search Blog)

好消息是,通过近日的一项更新,谷歌搜索团队已经做到了让搜索答案更加准确,同时避免错误的前置议题、或没有明确答案的那一些。

具体说来是,最新改进主要体现在“关于此结果”(About This Result)的选项扩展、对低质量数据空缺的警告、以及旨在提升初高中学生“信息素养”的合作计划。

信息“片段”会出现在许多搜索结果中,但直接调用页面信息的传统呈现方式,有时也会与信息的精准传达背道而驰。相比之下,标准查询响应并不该是这个样子。

举个例子,当你检索“太阳光传播到地球需要多长时间”时,Google 一度摘抄了太阳与冥王星之间的距离。

2.jpg

好消息是,据 Pandu Nayak 所述,这一问题的解决方案,在于一项共识 —— 即在多个热门搜索结果中匹配上事实。

其在与记者电话连线时解释称,共识源于已被 Google 指定的高质量页面,我们希望可以避免类似的片段轰炸。

因为它并不能确定某件事是否值得信赖,而只是简单地查看最佳结果。

但通过查询受信任的几个页面,就可以从中找到共同点、进而更好地避免将那些错误细节顶到前面。

3.gif

至于“虚假前提”,则源于 Google 试图用信息片段提供帮助的意外状况。

多年来,如果用户输入了一个从未发生过的事件问题,谷歌搜索经常会给出模棱两可的“真实片段”—— 即从半相关的页面中,提取上下文之外的文本片段。

比如在搜索“史努比何时刺杀了林肯”时,系统可能曾在某个片段信息中附上了林肯的遇难日期。

虽然这种清醒并不常见,但 Google 还是坚称其一直在努力训练搜索系统,以更好地分辨事实、并承诺将不恰当的内容发生率降低 40% 。

4.gif

不过 Paudu Nayak 也承认,上述两套机制仍不足以彻底解决去年曝出的一个问题。

当时 Google 搜索给出了与“癫痫病发作时的正确处置方式”完全相反的建议,列出了一系列“不要做”的禁止事项。

好消息是,他表示 Google 搜索团队仍在持续改进,以防类似问题再度发生。

最后,Google 还在扩展“关于此页面”,以便用户查看给定搜索结果的来源网站的详情。

目前英文版 iOS 客户端已率先上线,Android 平台要等到今年晚些时候,且未来几个月内会陆续提供对更多语言的支持。

举报

  • 相关推荐
  • 大家在看
  • Free Email Extractor from Website:强大的免费网络电子邮件抓取工具,自动访问网站以快速提取批量电子邮件、电话号码和社交资料,支持域名到电子邮件查找。

    My Email Extractor是一个强大的免费网络电子邮件抓取工具,它可以自动访问网站并快速提取电子邮件、电话号码和社交资料。它支持从不同域名提取电子邮件,并将结果保存到CSV文件中。用户可以使用它来生成销售线索、进行市场研究以及数据自动化。My Email Extractor的准确性取决于数据来源,它实时从网页中收集电子邮件。

  • WizardLM-2:新模型,多种型号,AI驱动合成数据训练

    WizardLM-2是WizardLM推出的新一代大型语言模型,包含三种型号:8x22B、70B和7B。该产品采用AI驱动的合成数据训练系统,通过数据分析、加权抽样、渐进式学习和AI互校AI等方法,优化模型性能。它能够自动生成高品质的指令和响应,提供多样化的对话能力,适用于多种编程和开发场景。

  • idefics-80b:一个通用的多模态模型,可用于问答、图像描述等任务

    HuggingFaceM4/idefics-80b-instruct是一个开源的多模态模型,它可以接受图像和文本的输入,输出相关的文本内容。该模型在视觉问答、图像描述等任务上表现出色,是一个通用的智能助手模型。它由Hugging Face团队开发,基于开放数据集训练,提供免费使用。

  • Video2Game:从单一视频创建实时互动游戏环境

    Video2Game是一项技术,可以将单一视频转换成具有实时、互动、真实感和浏览器兼容性的高质量虚拟环境。它通过构建大规模的NeRF模型来实现高质量的表面几何形状,然后将该模型转换为带有对应刚体动力学的网格表示,以支持交互。使用UV映射的神经纹理,既能表达丰富,又与游戏引擎兼容。最终得到的是一个虚拟环境,虚拟角色可以与之互动,响应用户控制,并能从新的相机视角实时提供高分辨率渲染。

  • Cohere Compass:多方面数据索引与搜索模型

    Cohere Compass是一款新型的多方面嵌入模型,专为解决企业数据中的多重概念和关系检索挑战而设计。它能够将数据以JSON格式传递至嵌入模型,转换后存储在向量数据库中,保持元数据和文本的同时,捕捉多方面数据中概念间的关系。与传统的RAG流程相比,Compass通过其SDK将电子邮件及其附件解析为单一JSON,生成包含多方面表示的嵌入输出,从而在搜索时能够准确理解和匹配查询中的不同方面。

  • Ctrl-Adapter:视频生成的精细控制工具

    Ctrl-Adapter是一个专门为视频生成设计的Controlnet,提供图像和视频的精细控制功能,优化视频时间对齐,适配多种基础模型,具备视频编辑能力,显著提升视频生成效率和质量。

  • Reka Core:强大的多模态LLM,商业解决方案

    Reka Core是一个GPT-4级别的多模态大型语言模型(LLM),具备图像、视频和音频的强大上下文理解能力。它是目前市场上仅有的两个商用综合多模态解决方案之一。Core在多模态理解、推理能力、编码和Agent工作流程、多语言支持以及部署灵活性方面表现出色。

  • 2txt:快速将图片中的文字转换为可编辑文本

    2txt是一个在线OCR工具,能够将图片中的文字内容快速识别并转换成可编辑的文本格式。它支持多种语言的识别,并且操作简单,用户只需上传图片即可获得结果。该工具不存储用户上传的图片,保证了用户数据的隐私安全。

  • 法行宝:AI智能法律分析工具

    法行宝是一款集成了人工智能技术的法律服务平台,旨在为用户提供专业的法律意见和文书参考。通过预设问题引导用户提供必要信息,结合《中华人民共和国民法典》等相关法律法规,生成详细的法律意见书。法行宝不仅提供离婚流程指导、文书模板下载,还包含人性化的行动建议和扩展资料,帮助用户全面理解并应对法律问题。

  • Adobe Acrobat AI Assistant:AI智能助手,文档快速理解与生成

    Adobe Acrobat的AI助手是一个集成在Acrobat中的创新功能,它可以帮助用户通过提问来理解文档内容,快速获取信息并生成内容。这项功能特别适合需要从文档中提取关键信息并快速创建电子邮件、演示文稿、会议记录等的用户。AI助手可以生成文档摘要,提供基于文档内容的建议问题,帮助用户更有效地探索和理解内容。此外,Adobe Acrobat的AI助手遵循Adobe的AI伦理原则,确保用户数据的安全和透明。

  • AI Voice Generator Bot:使用人工智能将文本转换为音频

    AI语音生成器是一个简单易用的产品,它使用人工智能技术将文本转换为音频。它提供了多达25种不同的声音,完美演绎英语。您只需在Telegram上输入文本,我们即可回复相应的音频,无需等待。立即试用,快速将文本转换为语音。

  • Glaze:保护艺术家风格的AI工具

    Glaze是一个旨在保护人类艺术家免受AI风格模仿的系统。通过机器学习算法对艺术作品进行微小改动,使其对人类眼睛看起来不变,但对AI模型则呈现出完全不同的艺术风格。这样,当有人试图模仿特定艺术家的风格时,AI生成的结果将与预期大相径庭。Glaze不是永久解决方案,但是一个必要的第一步,为艺术家提供抵抗AI模仿的工具。

  • FastBots:无需编码,快速创建AI聊天机器人

    FastBots.ai是一个强大的AI聊天机器人平台,允许用户通过上传自己的数据,如网站内容、文档、PDF文件等,来训练并创建定制化的聊天机器人。这些机器人可以无缝集成到网站中,提供24/7的客户支持、销售辅助、个人助理等多种功能。FastBots.ai支持95种语言,提供军事级别的数据加密,无需编程即可通过简单的复制粘贴代码嵌入聊天机器人,还支持与超过5000个应用程序通过Zapier集成。

  • Limitless:超越思维限制的个性化AI助手

    Limitless是一款由人工智能驱动的生产力工具,旨在帮助用户突破思维限制,通过保存对话和提供个性化AI问答来增强记忆力和专注力。产品形态包括可穿戴设备和应用程序,支持会议准备、实时转录、自动笔记和会议总结等功能,无需额外的机器人加入会议,且提供无限存储空间。

  • Adobe Premiere Pro:AI驱动的视频编辑软件

    Adobe Premiere Pro是一款功能强大的视频编辑软件,集成了AI技术,旨在简化复杂的编辑任务并加速编辑流程。软件提供了文本基础编辑、音频分类标签、语音转文字、增强语音、场景检测、自动色彩调整、形态变换、颜色匹配、音频自动调节、自动重构等功能,大大提高了编辑效率和创作可能性。Premiere Pro适用于社交媒体短视频制作到长片电影的编辑,帮助用户节省时间,专注于创意和故事讲述。今年晚些时候,Adobe Premiere Pro计划推出第三方AI模型功能,使编辑人员能够选择最适合其素材的模型,从而提升编辑体验。这些AI模型包括OpenAI的Sora模型、Runway AI和Pika的视频模型。此外,Premiere Pro还将提供内容验证功能,帮助用户了解他们是否使用了AI以及使用了哪个模型来进行媒体创作。

  • SuperMemory:用打造你的第二大脑

    supermemory是一个帮助用户整理和回顾互联网上保存内容的工具,类似于为书签打造的ChatGPT。用户可以通过导入推文或使用Chrome扩展保存网站和内容。它包含三个主要模块:主Web UI、Chrome扩展和AI后端处理。旨在帮助用户更有效地管理和回顾信息,提高生产力。

  • Pile-T5:基于Pile数据集训练的T5模型

    Pile-T5是EleutherAI推出的一款自然语言处理模型,它在原有的T5模型基础上,采用了Pile数据集和LLAMA分词器进行训练,以改善对代码任务的理解能力。该模型经过了2万亿个token的训练,是原T5模型训练量的两倍。Pile-T5在多项下游任务中表现出色,尤其是在代码相关任务上。此外,EleutherAI还提供了中间检查点,以便研究人员研究模型随时间的演变。

  • SoraPix AI:创建您梦想中的动漫女孩

    SoraPix是一个AI驱动的图片生成工具,内置多种独特模型,通过简单的几步操作,您可以创建您梦想中的动漫女孩。SoraPix提供衣橱、动漫和图片生成等功能,具有4K高清图像质量和更快的服务速度。您可以通过购买宝石来解锁更多功能和选择。

  • PostHunt:写病毒式推特,AI辅助

    PostHunt是一款通过AI辅助撰写病毒式推特的工具。用户可以描述内容、选择模板,快速在Twitter上获得病毒式传播。PostHunt结合了GPT 4、Claude 3和Gemini 1.5 Pro的强大功能,使用者可以通过三个简单步骤,在15秒内撰写一条病毒式推特。100多位创作者选择了PostHunt,用于撰写病毒式推特,其强大的功能和简单易用的界面备受好评。

  • MejoraImagen:提升图片质量

    MejoraImagen是一个在线图片增强工具,使用智能算法提升像素化、低分辨率、光线不佳等问题的图片质量。只需上传图片到我们的表单,几秒钟内就能得到100%增强的结果。

今日大家都在搜的词: