首页 > 经验 > 关键词 > 网站SEO最新资讯 > 正文

网站的SEO以及它和站长工具的之间秘密

2015-09-06 10:49 · 稿源:小胡子哥博客
文章目录

博客迁移没有注意 URL 地址的变化,导致百度和 google 这两只爬虫引擎短时间内找不到路。近段时间研究了下国内最大搜索引擎百度和国际最大搜索引擎google的站长工具,说下感受。

最近墙的比较厉害,google 不一定能访问进去(我平时用的 GreenVPN ,还挺不错的,速度快,支持的国家也多)。

站长工具的作用是为了辅助开发者,针对自己的网站做出更加合理的网页布局和代码优化,以便让 spider 更好地理解网页,从而将最准确的信息送达到用户的荧屏上。它对搜索引擎和开发者是双赢的。

Web 发展极快,由于客户端厂商纷纭加之开发者没把重点放在 web 标准上,直到 2014 年的 10 月底才有了 统一的标准 。用户输入关键词,搜索引擎要在 0.1s 内将网络上的资源汇聚起来,这个过程中计算的开销、数据整合的开销是极大的,如果我们开发的网页不能让 spider 准确理解,最后的结果就是,写的东西很难出现在用户面前。

搜索引擎对网页的理解

摸索两个站长工具,感触最深的是结构化数据(Structured Data),结构化数据不是把文章段落分清楚、标题写清楚,实际上你文章段落分的再清晰,爬虫机器也不知道你在表达什么,所以数据结构化是给爬虫看而不是给人看的。HTML 标签的数量很有限,有限的几个标签没办法表达网页上每一个元素的含义,比如一个小的图标、一个广告位、一个蒙层等,于是网页上出现了很多 class 名、id 名来标记一个元素。这些内容的统一让爬虫理解的略微透彻了一些,比如:

.banner: 一张banner广告位
.sidebar: 侧边导航栏
.nav: 主导航
.icon: 页面小图标
.post: 一篇文章
.post-title: 文章标题

然而搜索引擎聚合的网页太多,当这些五花八门的 class 出来之后,它又开始迷茫了,难以较好的聚合分类。所以出现一个叫做 Schema 的东西,它用来表示一个结构化数据结构,可以看下面一个 schema 示例:

<div itemscope itemtype="http://schema.org/Person">   
  <span itemprop="name">李靖</span>   
  <img src="http://barretlee.com/avatar.png" itemprop="image" />    
  <span itemprop="jobTitle">攻城师</span>   
  <div itemprop="address" itemscope itemtype="http://schema.org/PostalAddress">     
    <span itemprop="streetAddress">文一西路969号</span>     
    <span itemprop="addressLocality">浙江杭州</span>
    <span itemprop="postalCode">310000</span>   
  </div>   
  <span itemprop="telephone">(0571) 123-4567</span>   
  <a href="mailto:barret.china@gmail.com" itemprop="email">barret.china@gmail.com</a>
  李靖的主页:  <a href="http://barretlee.com" itemprop="url">barretlee.com</a>    
</div>

在一个需要表达的块上加上 itemscope 属性和一个 itemtype 属性,itemtype 是有固定值的,具体可以参阅 schema.org 的说明。然后在块内添加详细的说明,使用itemprop 标注。整个操作十分简单,略微麻烦的是需要对照 schema 的官方网站填写规定的 itemprop 字段。

结构化数据,通常也可以称之为元数据,这些数据附着在网页文本信息内,厘清了页面上每个部件的功能、属性和意义。当机器进入网页的时候,能够像人一样,一眼瞄出要表达的内容。关于 schema ,以前翻译过一篇文章 SEO:让搜索引擎对你的网站更有亲和力 。

SEO和站长工具的之间秘密

除非搜索引擎能够猜到你要搜索的具体的 URL 地址,一般地,它都会从自己的数据索引库中扒拉数据。对于权重高、更新频率高、原创内容多的网站,搜索引擎会十分勤快的爬最新内容。那么,如何让搜索引擎知道网站上有多少网页便成了一件重要的事情。

我们经常会听到一个叫做”网站地图”的东西。有些网站会在自己的站点中添加一个页面,这个页面包括了整站的重要入口,那么这个页面就是该页面的网站地图。这些地图是给人看的,如果只想给爬虫引擎看,可以将所有的链接按照一定的格式放到sitemap.xml 文件中,然后把这个文件放到网站的根目录下,如http://www.barretlee.com/sitemap.xml 。

而最重要的还是 robots.txt 这个文件,它是所有引擎约定俗成的一个文件,比如我的网站中用到的 http://www.barretlee.com/robots.txt ,其内容为:

Sitemap: http://www.barretlee.com/sitemap.xml
User-agent: *
Allow: /

它告诉搜索引擎,网站地址的位置、允许蜘蛛爬取的内容等,它是一个协议。最近,貌似还多了一个 humans.txt ,也是一个比较有意思的文件,可以在这里了解它: http://www.humanstxt.org.cn/ ,它可以描述一些站点和团队的故事。

SEO上,站长工具主要分为两个方面,一个是对网页的抓取,一个是对网页的分析。

网页的抓取在百度站长工具中体现的比较多,而网页的分析,诸如数据标注、结构化数据等,百度做的还比较搓,目前还在内测阶段,需要发送邮件才能申请权限。看到百度站长工具页面上的几个数据标注示意图,揣测应该比 google 弱一百倍,所以我还是重点说说 google 的吧。

网页的抓取

这块上,两个站长工具都是强调让开发者把网站地图显式的暴露给搜索引擎,提供了各种分析网站地图准确性合理性的工具,搜索引擎如果发现你的网站上一个地址时有时无,就会觉得你不可信有点飘渺。所以一旦网页因为改造或迁移导致页面链接丢失,可以在站长工具中填写这些死链。

不要贪婪的让搜索引擎不停的爬取你的网站,如果它多次过来发现内容是一样的,它也会很伤心的离开。而如果它发现每次过来爬你的内容都能找到很有意思的、从来没发现过的东西,它会对你越来越感兴趣,甚至日久天长它会给你定型、定位,然后权重会越来越高。在站长工具上都是可以设置的。

网页的分析

google 的数据化标记做的实在是太赞了!输入网址,它会打开你的网页,设置你要标记的类型,比如文章。选中页面上的元素然后标记。比如选中文章的标题,选中之后有一个菜单,在菜单上选择 title,选中作者名字,然后菜单上选择 author,一个页面标记完了之后,他会分析整站的所有页面,如果结构相似,也会自动标记其他页面。

整个标记完成之后,google 就知道你整个网站的信息架构了,下次要做的就是对这些信息内容做匹配和分类。所以我们可以看到,个人博客在 google 中的搜索是极其靠前的,因为页面的信息结构简单,即便你不去标记,它爬取多次之后也能自己理解。

对比百度和 google ,两者如同屌丝和高富帅。不过高富帅总是要越墙才能看到,所以我平时使用的依然是百度分析。百度分析和百度站长工具还是不一样的。百度对网页流量的分析和搜索词汇的分析还是挺精准,也很有参考价值。

小结

本文对 SEO 相关的东西做了一个简要的概述,同时也概括了搜索引擎做的一些工作,知识量有限,难以面面俱到,如有错误还请斧正。

  • 相关推荐
  • 大家在看
  • 分析师认为苹果应该收购DuckDuckGo搜索引擎 以向谷歌施压

    伯恩斯坦公司(Bernstein)分析师Toni Sacconaghi在分享的一份研究报告中表示,苹果应该收购一家搜索引擎公司,向谷歌施加压力。

  • 利用网页抓取数据赚钱的3个思路

    在大数据时代,如何有效获取数据已成为驱动业务决策的关键技能。分析市场趋势,监视竞争对手等都需要进行数据采集。而网页抓取则是数据采集的主要方法之一。在本文中,Christopher Zita将和大家展示 3 种利用网络抓取赚钱的方法,全程只需几个小时就能学会,所用代码不到 50 行。

  • 谷歌前广告主管正在打造一款无广告的搜索引擎

    据外媒报道,Sridhar Ramaswamy于 2013 年成为谷歌广告和商务高级副总裁。他领导着这个价值 1150 亿美元的分支机构达五年之久,该机构负责通过AdSense在搜索、YouTube和网站上出现的广告。但因受够了谷歌的暴利和客户与广告商之间的利益冲突,Ramaswamy选择离开谷歌并创建了自己的搜索引擎。

  • 网页排序哪5个特征,百度颇为喜欢?

    常常用于表达一个人对于另外一个人的情有独钟,而在搜索引擎的领域里,很多SEO人员,常常试图去找寻一个“唯一的真理”那就是搜索排序中,到底哪个排序特征对于网页来讲,是最为重要的一个因素,而“我只喜欢你”,对于SEO而言,能不能真的把SEO做好。

  • “地摊经济”如何做搜索需求分析?

    如果你是一名SEO人员,经常我们需要做的第一件事就是做关键词挖掘与分析,特别是当我们试图去做热点新闻事件排名的时候。

  • 报告:黑客正滥用谷歌分析工具,偷偷窃取银行卡数据

    研究人员周一报告称,黑客正在滥用谷歌分析(Google Analytics),以便偷偷地从受感染的电子商务网站窃取信用卡数据。

  • 李斌谈特斯拉频繁降价:可以理解,但不赞同

    6 月 21 日,蔚来汽车创始人李斌做客Rebuild 2020。被问及特斯拉频繁降价,为何蔚来价格相对稳定时,李斌表示,价格稳定是对用户负责。从企业战略层面讲,特斯拉做法可以理解,但从消费者角度来说,值得商榷。

  • 这个网站靠帮人们分析怎么在网上赚钱,月入近3万

    不少想要搞副业的人,曾经花费大量时间和精力尝试在线赚钱,但最后才发现自己白折腾了。eBiz Facts 是一个小团队,该平台花费大量时间研究和审查各种在线赚钱方法是否靠谱,然后给用户一些建议,让他们避免被骗,以及浪费时间、精力和金钱在一些容易“踩坑”在线业务,并做出更明智的决策。

  • 摆摊吧——站长们!

    ​“地摊经济”一夜成名,第一时间,淘宝、京东、腾讯、苏宁、美团等互联网巨头集体示好,从货品源头到供应链再到支付端,几乎 360 度无死角式的支持。据百度搜索大数据显示,近 7 天“摆摊技巧”相关内容搜索热度同比暴涨665%,达到 10 年来最高值。此外,“地摊上最吸引女人的是啥东西”、“首富从地摊开始”、“高手教你摆地摊诀窍”等也成为相关热搜内容。

  • 私域直播工具有机会嘛?

    直播卖货正兴,绝大数个人和企业的想法是亲自下场做直播卖货。有的做淘宝、有的做抖音、还有的在快手。看起来,唯独微信孤零零。

  • Stibo Systems最新版企业级主数据管理解决方案发布

    2020年6月2日,Stibo Systems 10.0版企业级主数据管理解决方案正式发布,这不仅是Stibo Systems一直在努力为企业客户提供持续的、值得信赖的、一流的企业主数据管理解决方案的旅程中一座重要的里程碑,而且是企业成功实现业务流程透明目标的至关重要的一步。Stibo Systems 10.0新版企业级主数据管理解决方案对已有STEP技术平台、产品主数据管理(PMDM)、产品数据联合(PDS)、客户主数据管理(CMDM)和产品生命周期管理(PLM)解?

  • 为什么AIOps工具最终可以为云计算注入新的活力

    [TechWeb]AIOps工具在IT领域具有广阔的应用前景,但是云技术是AIOps有望提供最大收益的领域之一。在这一点上,云计算在IT行业中已经是成熟的领域,甚至有人说这很无聊。云中的创新已经放慢了脚步,很难想象我们在云中构建或管理应用程序方面将采取许多革命性的步骤。话虽这么说,如果我不得不选择一个准备在不久的将来在云中进行重大变革的概念,那么我会把钱花在AIOps和AIOps工具上。尽管AIOps的影响绝不仅限于云,但AIOps是目前

  • 短视频制作必备工具

    想要做好短视频,工具尤为关键,选择对的工具,可以让短视频制作效率提高N倍。下面来分享几款短视频制作必备的工具。无论是短视频运营、还是短视频制作都需要用上。第一款:剪映推荐理由:小白、大神都能用软件介绍:剪映是一款强大的视频剪辑、后期处理的手机app,之所以推荐它,是因为无论你是小白、还是大神,都能从中找到很多用起来很顺手,很方便的功能。特别是自带滤镜、特效、支持抖音素材获取等,用起来很方便,在效率上很

  • Python 和 Go 成为年度最受欢迎的黑客工具榜首

    网络安全公司 Imperva Cloud WAF 近期分享了其在 2019 年一年内针对网络安全事件的观察。对数据进行聚类分析后,他们得到了如下结论:

  • 什么录屏软件好用?PC录屏工具分享

    什么录屏软件好用?对于很多需要电脑录屏的小伙伴来说,能够找到一个好用的录屏软件很重要。现在网上录屏的方法有很多,不同的录屏方法使用感之间有些差异。如果你也有电脑录屏的需求,那下面分享的方法你需要知道!分享一:专业电脑录屏软件如果需要录制一些高质量的视频,建议使用“嗨格式录屏大师”。是一款适用于Windows和MAC操作系统的录屏软件。软件能够音画同步录制电脑桌面操作、在线课程、摄像头录制等屏幕活动。支持全屏

  • SEO优化,4个独辟蹊径的策略!

    有的时候SEO工作就是一个数字游戏,每天看着数据的增长,不断的调整相关性的策略,但我们非常清楚,有的时候SEO优化会面临各种调整,特别是同行业之间的竞争。

  • 使用免费Billfish素材管理工具,轻松管理大量素材

    现在的各种公众号和微博等等,常常动不动就向你扔个XX G的素材包(比如我的5000G资源)。经过一段时间的疯狂收集之后,那混乱的、堆积如山的各种“珍藏版”素材就会充斥着你的电脑。一开始你可能建立几个文件夹,然后是几层的文件夹,再然后是一层套一层的“十八层地狱式”文件夹,各种素材密集恐惧症、整理强迫症接踵而来!最后想要快速查找需要的图片素材的时候,发现非常繁琐和头疼。今天这款免费整理设计素材的神器-Billfish素材

  • 使用免费Billfish素材管理工具,轻松管理大量素材

    现在的各种公众号和微博等等,常常动不动就向你扔个XX G的素材包(比如我的5000G资源)。经过一段时间的疯狂收集之后,那混乱的、堆积如山的各种“珍藏版”素材就会充斥着你的电脑。一开始你可能建立几个文件夹,然后是几层的文件夹,再然后是一层套一层的“十八层地狱式”文件夹,各种素材密集恐惧症、整理强迫症接踵而来!最后想要快速查找需要的图片素材的时候,发现非常繁琐和头疼。今天这款免费整理设计素材的神器-Billfish素材

  • 19款实用「数据可视化工具」

    大数据时代,数据分析已经成为一种常态。调查数据显示,53%的企业员工都需要经常查看分析数据。由于数据数量多且杂,人们在做数据分析时需要借助可视化工具将数据更直观地展示出来以帮助理解。为此,站长之家本周为大家整理了一些好用的可视化工具,帮助大家提高效率。

  • 官抖直播,真能成为销售增长新引擎?

    当携程CEO梁建章、网易丁磊、格力董明珠纷纷走进直播间,并频传销量捷报;当寺库、妃鱼、唯品会为代表的电商平台选择扎根在抖音并开启高频直播,以寻求新流量渠道的获客和变现机会;

  • 参与评论
文明上网理性发言,请遵守新闻评论服务协议