首页 > 优化 > 关键词  > Google最新资讯  > 正文

Google工程师 讲述网页搜索排名背后的技术

2008-07-18 08:56 · 稿源:Chinaz用户投稿

这是 Google 工程师 Amit Singhal 发表在 Google 官方博客的一篇文章,讲述了 Google 搜索排名背后的一些技术,涉及到 Google 对网页,对语义,对用户意图的理解。

Google 搜索排名的核心技术源自已有50年历史的学术课题 Information Retrieval (IR),IR 技术使用统计学原理对文字的使用频率等属性进行研究并对结果进行排名。建立在 IR 理论上的 Google 搜索同时借助链接,网页结构等等技术形成独特的搜索技术。

理解网页:

Google 多年来在网络爬虫与索引系统上投入巨资,因此,Google 拥有非常庞大并且是最新的网页索引,除此之外,Google 还使用一些最新技术提高索引质量,比如,他们开发了一种技术,可以在字面意思之外理解一个网页所表达的重要概念,人们使用意大利语言搜索 "galleria sprovieri londra",会找到伦敦的 Sprovieri Gallery,尽管 Sprovieri Gallery 主页上既没有 London,也没有 Londra 字样。在美国,人们搜索 "cool tech pc vancouver, wa",会找到 www.cooltechpc.com,然而 www.cooltechpc.com 的主页上没有任何文字表明他们位于 Vancouver。其它技术包括,区分一个网页中的重要或非重要文字,以及网页内容的新鲜度。

理解语义:

Google 可以通过用户提供的几个搜索关键词,理解用户的真实意图。他们在拼写纠正,词义,以及概念分析方面处于非常领先的位置。很多人都或多或少体验过 Google 的拼写纠正功能,比如搜索 "kofee annan",Google 会问你搜索的是否 "kofi annan",然而,当有人搜索 "kofee beans",Google 会纠正成 "coffee beans"。(Google 事实上已经在尝试语义技术 - 译者)

词义是 Google 尝试理解查询语义的基础,也是 Google 遇到的最大难题。一些在人看来显而易见的东西,机器却很难自动处理。用户并不想对使用什么词汇进行查询而费神,人们甚至压根不知道该使用什么进行查询。在这种时候,Google 的词义系统便可以发挥作用,词义系统可以对查询语句进行非常复杂的修正,比如,查询 "Dr Zhivago" 的时候,Google 知道 Dr 代表 Doctor ,而查询 "Rodeo Dr" 的时候,Dr 代表 Drive。用户搜索 "back bumper repair" 的时候,结果是 rear bumper repair,而搜索 "Ramstein ab",Google 能够将 ab 理解成 Air Base,"b&b ab" 会理解为 Alberta 的 Bed and Breakfasts 。Google 将这种词义理解系统发展到上百种不同语言。

Google 在搜索排名中使用的另一项技术是概念识别,该技术可以对查询的内容进行概念识别,比如,我们查询 "new york times square church",Google 知道我们实际上查询的是纽约时代广场上的那座著名教堂,而不是纽约时报中的某篇文章。概念识别技术并不止这些,Google 还对其进行加强以正确地识别语义,比如,搜索 "PC and its impact on people",事实上是搜索计算机对社会的影响。Google 的搜索分析算法中这类技术比比皆是,而且面向几乎所有语言。

理解用户:

Google 尝试理解用户的目的是为用户返回他们真正需要的结果,而不是他们在搜索语句中所说的东西。该技术基于一个世界级的本地化系统,外加先进的个性化技术,以及各种用户意图识别技术。

Google 对本地结果的重视体现在他们的本地化工作中。同样一个查询语句在不同国家会返回不同结果,比如,查询 "bank]",在美国返回的是银行,而英国则可能是 Bank Fashion 的服装连锁店,或者英国的银行,而在其它英语国家,如澳大利亚,加拿大,新西兰,南非,返回的则应仍旧是当地的银行。如果你在一些非英语国家查询这个词,象埃及,以色列,日本,俄罗斯,沙特,瑞士,返回的结果将更有趣。就象 Football 在美国和英国表示不同的运动项目一样,同一个词在不同国家查询的结果可能截然不同。

个性化查询是 Google 另一项先进搜索技术,一个已经登录的用户,如果开通了 Web History 服务,随着他查询时间的增长,Google 会根据他的查询历史,自动调整返回的结果,比如,一个经常查询 Football 相关话题的人,会逐渐从 Google 得到更多足球相关的结果。如果你青睐某个购物站返回的结果,在以后的查询中,会从那个购物站得到更多结果。

Google 在返回用户真正想要的结果方面的另一个例子是,假如你搜索 "chevrolet magnum",我们知道 Magnum 不是 Chevrolet 产的,是 Dodge 产的,Google 会自动返回 dodge magnum 的结果。还有一个例子,有人搜索 "bangalore",不仅返回 Bangalore 这个城市的主页,而且返回 Bangalore 的地图,以及一些与 Bangalore 市景,交通相关的视频,这些视频会让你有身临其境的感觉。

本文国际来源:https://googleblog.blogspot.com/2008/07/technologies-behind-google-ranking.html

中文翻译:COMSHARP CMS 官方网站

举报

  • 相关推荐
  • A日报:Stability AI发布实时重建模型SPAR3D;火山引擎“奇美拉”数字人平台启动封测;京东重磅开源JoyAgent-JDGenie

    AI日报栏目精选了人工智能领域最新动态:1)Stability AI推出0.7秒单图3D重建模型SPAR3D;2)GitHub热门开源AI协作框架CrewAI获3.4万星;3)马斯克发布儿童AI聊天机器人Baby Grok引发安全争议;4)ComfyUI-C opilot工具简化AI工作流创建;5)CNNIC报告显示我国346款生成式AI完成备案;6)提示词管理工具AI Gist上线;7)开源语言学习工具WordPecker支持多语言学习;8)斯坦福推出多工具协作AI Agent OctoTools;9)Ope

  • 苹果最强平板!全新iPad Pro将带来4大升级点

    苹果将于今年秋季推出新款iPad Pro,这是苹果最强大的平板电脑,新品将带来4大升级点,具体如下。 首发全新M5芯片 M5是这代iPad Pro最重大的升级点之一,目前关于M5芯片的升级细节尚不明确,这颗芯片采用台积电3nm工艺制程,其CPU、GPU和神经网络引擎将会迎来常规的升级迭代。 双前置摄像头 去年的iPad Pro M4将前置摄像头移至横向一侧,这次全新iPad Pro将在横向、纵向位置均

  • 七牛云上线Agent和MCP托管服务

    七牛云AI大模型推理平台推出Agent与MCP托管服务,通过标准化接口实现LLM与多工具协同。MCP协议统一了应用程序与云端服务调用方式,LLM+MCP成为AI Agent生态核心。平台提供一站式模型推理和工具调用服务,支持复杂Agent应用开发,具备三大优势:1)统一接入管理多种工具和模型;2)集中托管敏感密钥确保安全;3)简化本地环境配置。开发者可通过Token API直接调用托管MCP工具,或使用SSE协议接入外部工具。典型应用场景包括:聚合多工具调用、灵活编排服务、安全密钥管理等。该服务显著降低AI应用开发门槛,加速智能化应用构建。

  • 新iPad Pro将配备前置双摄像头:横屏竖屏都能用

    据爆料,苹果将在下半年发布的新款iPad Pro M5将配备两颗前置摄像头,解决当前M4版本单摄像头在竖屏模式下体验不佳的问题。新机将搭载基于台积电3nm工艺的M5芯片,首次采用SoIC封装技术实现3D堆叠,带来性能和能效双重提升。屏幕方面延续M4版OLED方案,外观设计变化不大。

  • 腾讯云GooseFS团队与厦门大学合作成果 AC-Cache入选 PPOPP

    腾讯云研发的AC-Cache内存缓存系统入选并行编程顶会PPOPP2025。该系统针对小型对象存储场景,通过感知访问关联性的创新设计,成功解决负载不均衡问题。实测显示,AC-Cache可降低80.2%尾部延迟,提升5倍以上访问吞吐量。该技术已开源并应用于腾讯云GooseFS产品,在手机制造、自动驾驶等领域取得显著成效:某手机厂商模型分发速度达300MB/s,带宽提升10倍;某车企训练效率提高30%,数据命中率超90%。AC-Cache的突破将助力企业突破存储性能瓶颈。

  • 华为旗舰平板MatePad Pro 12.2今日发布

    今日下午,华为将正式发布MatePad Pro12.22025款平板电脑,该机目前已在官网开启销售。作为华为平板系列的又一力作,MatePad Pro12.2提供了普通版和柔光版两种选择,并配备12GB内存与256GB/512GB两种存储组合,满足用户多样化的需求。在配色方面,该机推出了砚黑、宣白、飞天青三款时尚配色,供消费者挑选。

  • 智汇普陀,第五届BPAA算法大赛总决赛在沪收官

    7月24日,第五届BPAA应用算法模型实践典范大赛总决赛在上海普陀区成功举办,线上线下观看量超500万人次。作为世界人工智能大会(WAIC)的重要品牌赛事,本届大赛聚焦AI垂直应用算法模型创新,来自"AI+可持续发展"赛道的"大型城市复杂环境低碳高可靠智能配电技术"项目团队获全场大奖。普陀区科委透露,2025年上半年该区软件信息服务业营收预计达445亿元,同比增长50.2%。大赛全面升级为六大垂直赛道,吸引20强团队展示算法在城市治理、医疗等场景的创新应用。普陀区将持续完善AI算法产业化体系,构建全生命周期产业扶持体系,打造更具竞争力的AI产业高地。

  • iQOO 15堆料激进!产品经理:领先行业不止一代

    iQOO产品经理戈蓝V发文表示,我们的下一代旗舰跳过了14,直接命名iQOO 15,这不是简单的数字跨过一代,而是因为iQOO 15在大家最在意的电竞性能、屏幕显示、独显芯片上领先行业不止一代,新一代iQOO旗舰,只为超越你的期待。 iQOO产品经理罗佳慧称,她见到了iQOO 15真机,这次产品称得上是未来几年内最好的,把未来体验搬到了现在,期待住了。

  • 跳过14!iQOO 15提前预热:顶级2K屏性能旗舰

    iQOO官方确认,下一代旗舰命名为iQOO 15,跳过14”。 iQOO宣布全网招募iQOO 15首批体验官,8月1日11:00在2025 ChinaJoy iQOO展馆,来参加iQOO王者荣耀5v5惊喜开馆活动,冠军队伍将每人免费获得一台iQOO 15。 博主数码闲聊站爆料,iQOO 15采用2K直屏,搭载高通骁龙8 Elite 2旗舰平台,后置5000万像素大底主摄,还有潜望长焦、百瓦闪充和大容量电池,是iQOO史上最强标准版。 值得注意的是,iQO

  • iQOO Z10 Turbo+官宣8月7日发布

    今日,iQOO手机正式宣布,全新性能旗舰iQOO Z10Turbo+将于8月7日19:00全球首发,并同步开启全渠道销售。即日起,用户可通过各大电商平台及线下门店预约新机,首销期间可享价值2214元的专属礼包,包含一年延保、三年电池保障服务及一年后盖换新等权益。 作为行业首款搭载8000mAh超薄蓝海电池的性能机型,iQOO Z10Turbo+凭借“续航怪兽”属性引发关注。官方实测数据显示,该机可�