搜索引擎基本功能:爬取和索引 并依相关性和重要性排序

2012-11-12 16:26 稿源:movelion.com  0条评论

搜索引擎有两个主要功能:爬取和索引,并依据相关性和重要性将结果答案排序。

试想一下,万维网网络仿佛停留在一个大城市的地铁系统里面

每到一站,是它自己的独特的文件(通常是一个网页,但有时是PDF,JPG或其他文件)。搜索引擎需要一种方式来“爬行”整个城市以找到所有的沿途停靠点,所以他们使用的最佳路径是——链接。

1、抓取和索引。抓取和索引的数十亿文档,网页,文件,新闻,视频和媒体的万维网。

2、提供答案。提供用户查询,最经常的是通过相关的网页的列表,通过检索和排名。

通过链接,搜索引擎的自动机器人,被称为“爬虫”或“蜘蛛”可以达到数十亿相互链接的文件。一旦引擎找到这些网页上,他们就会将这些信息以快照的方式存储在海量的硬盘驱动器上,以供用户在需要的时候进行搜索查询,这些服务器支持搜索引擎能完成这么巨大的搜索任务,几十亿的网页,可以在几分之一秒的访问,搜索引擎已经建造了世界各地的数据中心。这些巨大的仓储设施容纳数千台机器处理大量的信息。毕竟,当一个人在任何主要的搜索引擎进行搜索时,他们需要的结果瞬间,甚至是1或2秒的延时可能都会导致不满,所以搜索引擎努力提供尽可能快的答案。

搜索引擎是答案的机器。当一个人通过搜索引擎查询所需要的信息时,搜索引擎会在自己的数据库中,索引查找数十亿的文件,并同时做好两件事:第一,返回只有那些结果相关或有用的搜索者的查询;第二,排名这些结果,以提供最有用的结果。所以说,搜索引擎是答案的提供者,“相关性”和“重要性”缺一不可,SEO就是为了影响这两个因素。

一个搜索引擎,相关性意味着更多的过程不仅是简单地找到一个页面。在早期的网络,搜索引擎不有考虑到这个简单的因素,其搜索结果的质量可想而知。因此,在进化的过程中,聪明的工程师将搜索引擎设计出更好的方法来发现有价值的结果,搜索者会更容易接受并满意。今天,SEO对相关性的影响,是大多数提供网站优化和关键词排名技巧的人所最关注的方面。

搜索引擎如何确定重要性?

目前,主要的搜索引擎通常理解的重要性,必须是较受欢迎的网站,网页或文件,更有价值的信息包含其中。在实践中,这种假设已经被证明相当成功,作为搜索引擎继续使用的度量,是作息质量的提高,并提升用户的满意度。

人气和相关性不能手动确定。相反,搜索引擎越来越智能,集合数学方程、算法、排序等各种技术于一身,去伪存真,然后依重要性将最有价值的信息排名在最前面。

这些算法通常又包括数百个小的算法,在搜索营销领域中,我们经常提到网页的“排名因素”,只是针对主要的算法,很多微小的算法改进或进化,我们常常容易忽略,而他们却最终深深地影响了搜索引擎算法的整个发展。

文章来源:http://www.movelion.com/archives/06102417.html 转载请注明,谢谢。

有好的文章希望站长之家帮助分享推广,猛戳这里我要投稿

相关文章

相关热点

查看更多