百度工程师:用生态项目解决原创内容的排名问题

2012-10-30 17:16 稿源:站长之家  0条评论

站长之家(chinaz.com)10月30日整理:日前,由百度站长平台和MADcon联合举办的百度站长平台高端SEO俱乐部沙龙活动圆满落幕。百度网页搜索团队就站长们普遍反映的SEO问题一一进行了解答。

编辑摘录了本次沙龙交流的一些热门问答,内容如下:

一.页面收录问题

1、404页面问题:

Q:当我们由于变更产生404之后,百度会间隔多长时间识别出来?并且需要识别几次才会将其删除?对有些尚未做好的专题页面,可能会临时设置为404页面,之后很快将页面恢复,但这些专题页面中有一部分很快就能够恢复,还有一部分就需要很长时间才可被收录,因此有重大新闻时,会紧张重大专题被及时收录的情况。

lee(百度网页搜索团队工程师):不会有固定的时间,会根据网页的和所在频道的更新频率,去确定删除的时间,未做好或者非作为死链的页面,尽量不要用404的返回码,希望尽可能用503的返回码,这样spider能够比较好的去识别。

2、时效性问题

Q:目前百度收录上的时效性对百度和站长来说是双赢,但对每年定期举行的重大事件(例金钟节),在固定时间能否将这种事件的权重或算法进行优化?

lee:这方面如果目前没有做到的话,搜索团队会尽可能的去完善这方面的体验,也会去通过一些工具的形式、协议等简单的方式,提高这种体验,去实现页面的及时更新。

Q:对一些新闻,编辑可能后期需要对新闻的标题进行修改,但百度网页收录的更新很慢,较长时间无法将页面进行更新。

lee:像网页换title 理论上应该是要及时去更新,但目前做的还不太到位。

3、301跳转问题的解决情况

lee:百度站长平台会尽快上线关于301跳转的工具,并会推出网站改版工具。

4、图片、flash较多,文字内容较少的的页面的收录问题:

Q:目前很多页面可能会没有很多的文字,比较多图片和flash,对没有很多文字的页面,搜索引擎能很好的将这个页面中的资源识别出来吗?

lee:目前在推一个工具,将spider抓取日志展示出,去看下是否符合站长的抓取意愿,且对某些js较多的网站,假设目前收录不好,可先尽量减少js的使用。

5、对一个网站数量较多的同一类型的页面收录量达到一定值之后,收录量就会增加的很缓慢

Q:比如:人人日志,上千万的数据,用了一年多的时间目前收录了几百万,且大部分内容都是很高质量的,但收录量到一个值之后,就没有增加,这个是什么原因?

lee:人人之前有一些页面比较封闭,这两年才开始开放,但是spider根据之前的日志分析,对人人网的改动反应偏慢,所以推出了sitemap,希望大家通过sitemap将大家想进行索引的数据进行主动推送。

Q:姓名类的产品,通过sitemap提交之后,上千万的数据还是收录了700w+,会不会被认为这些页面是相似的页面。

lee:互联网资源很多,相似的产品很多,由于资源有限,会尽可能优先选取有价值的页面去抓取。一次提交的页面量很大,搜索引擎需要一定的时间去收录,搜索引擎可能会每天设置一定的压力上线去抓取,避免对站长产生太大的压力,可以尝试使用百度站长平台的抓取压力调节工具调试自己网站的抓取压力,增加压力,我们这边可以适当提高自己的压力加快抓取。

二、排名和权重问题

Q:nofllow  是否会浪费权重

lee:不会

Q:404页面不去处理的时候,会对网站权重产生影响吗?

lee:搜索中出现的无结果页面,是对用户最大的伤害,这种可能就会被认为该网站内容管理不好。

三、站长平台工具-死链工具使用问题

Q:404页面是不是必须要提交,才可以很好的被删除。目录下很多垃圾的标签,做了404设置,但是不清楚被收录的有多少,能不能把垃圾标签页面都导出来。

lee:检测死链-spider一条条去访问,确定是否是死链。建议大家主动去提交死链,站长了解自身网站的情况,可以比较好的进行提交,这个工具是为了弥补系统的问题。目前我们也在探讨能不能推出比较简单的工具,帮助站长解决这种问题。

有好的文章希望站长之家帮助分享推广,猛戳这里我要投稿

相关文章

相关热点

查看更多