站长之家

站长资讯通告:
您的位置: 首页 » 业界 » 评论 » 正文

丰富网页摘要 让你的网站与众不同

[ ] 来源: SEM一家之言 评论: 2 分享至:

百度权重查询 站长交易 友情链接交换 网站建设,网站设计,企业建站就找313

在6月15的《谷歌中文网站管理员博客》中,出现了一篇介绍“丰富网页摘要”的文章。

看到这篇博客,我就知道3年前对google的预测,现在终于变成现实了。不过没想到在众多网站还没普及这些新技术的情况下,google这么快就开始应用了。

关于“丰富网页摘要”的详细介绍,大家可以点上面的链接去了解。“丰富网页摘要”,用一句话说明一下就是:你给你的网站的某些内容,用特定的格式标注一下,就可以让你的网页在google的搜索结果中,显示更多的结构化的信息。比如那个博客上的截图:

丰富网页摘要

丰富网页摘要

当用户搜索“drooling dog”,用户能在搜索结果页直接看到网页上的产品有多少人评论以及价格范围。

这些信息是在原网页中本来就有的:http://www.yelp.com/biz/drooling-dog-bar-b-q-colfax

如果你的网站也能这样呈现搜索结果给用户,有什么好处自然是不用说的。接下来要讲的是google为什么会采用“丰富网页摘要”。下面给大家呈现一下以前我的分析过程。这样你也能预测搜索引擎以后会做些什么了。

我们如果站在搜索引擎的角度去看,就发现作为一个通用搜索引擎,其实是非常不容易的。搜索引擎面对的是上百亿的网页,先不说分词、索引、以及抓取和排序等等的技术。先来看搜索引擎如何判断网页上有什么内容,就发现是件很复杂的事情。

互联网上可以说什么样的网站都有,体现在网页的代码里,什么样的HTML写法都有的。 在具体的网页设计上,有些网站用模版做网站,可能仅仅只有一个区域内的内容是有效的;而有些不用模版,网页上从头到尾都是有价值的内容;每个网站的代码都是如此不相同而且混乱,但是搜索引擎还要通过这些HTML代码来判断你的重点内容。搜素引擎要从这么多繁杂的网页里提炼有价值的内容给用户,那个过程非常的痛苦。

我曾经和前yahoo中国的工程师一起做过一些事情,发现这样的互联网现状太考验一个公司的技术水平了。到如今,像google这样的公司,在处理网页噪音的时候都还遇到很多困难的。 所以,如果有一种统一的格式和标准,让大家来遵守,大家把网站里的内容都用这个标准把信息结构化的话,那对搜索引擎来说是一件非常幸福的事情。

现在博客搜索里,google已经开始应用一些现成的标准了。如:

在google的博客搜索里搜索“SEM一家之言”,出现这样的搜索结果:

google博客搜索

google博客搜索

大家看这个搜索结果,已经把博客发布的时间和作者给列出来了的。但是可以看到,这两个页面的排版和页面代码都是不一样的。那搜索引擎是怎么准确的知道这两个信息的呢? 特别是第二个结果,google列出的那个时间的格式和我博客上的格式是不一样的。

原因倒非常简单。因为这两个博客都提供了RSS供稿,在RSS文件里,都用一个标准的格式写明了时间和作者这些信息的。

RRS文件

RRS文件

google通过读取这个标准化的RSS文件准确的抓取到了这些信息。

(责任编辑:Loading

分享至:
Tags:SEO 谷歌 网页摘要
最新图文资讯
1 2 3 4 5 6
理智评论文明上网,拒绝恶意谩骂 用户名:
网友评论
站长之家专栏推荐
商讯
最新视频
论坛推荐帖子
评测
关于站长之家 - 联系我们 - 广告服务 - 友情链接 - 网站地图 - 版权声明 - 人才招聘 - 帮助