首页 > 经验 > 关键词  > 网站SEO最新资讯  > 正文

网站的SEO以及它和站长工具的之间秘密

2015-09-06 10:48 · 稿源:小胡子哥博客
文章目录

博客迁移没有注意 URL 地址的变化,导致百度和 google 这两只爬虫引擎短时间内找不到路。近段时间研究了下国内最大搜索引擎百度和国际最大搜索引擎google的站长工具,说下感受。

最近墙的比较厉害,google 不一定能访问进去(我平时用的GreenVPN,还挺不错的,速度快,支持的国家也多)。

站长工具的作用是为了辅助开发者,针对自己的网站做出更加合理的网页布局和代码优化,以便让 spider 更好地理解网页,从而将最准确的信息送达到用户的荧屏上。它对搜索引擎和开发者是双赢的。

Web 发展极快,由于客户端厂商纷纭加之开发者没把重点放在 web 标准上,直到 2014 年的 10 月底才有了统一的标准。用户输入关键词,搜索引擎要在 0.1s 内将网络上的资源汇聚起来,这个过程中计算的开销、数据整合的开销是极大的,如果我们开发的网页不能让 spider 准确理解,最后的结果就是,写的东西很难出现在用户面前。

搜索引擎对网页的理解

摸索两个站长工具,感触最深的是结构化数据(Structured Data),结构化数据不是把文章段落分清楚、标题写清楚,实际上你文章段落分的再清晰,爬虫机器也不知道你在表达什么,所以数据结构化是给爬虫看而不是给人看的。HTML 标签的数量很有限,有限的几个标签没办法表达网页上每一个元素的含义,比如一个小的图标、一个广告位、一个蒙层等,于是网页上出现了很多 class 名、id 名来标记一个元素。这些内容的统一让爬虫理解的略微透彻了一些,比如:

.banner: 一张banner广告位
.sidebar: 侧边导航栏
.nav: 主导航
.icon: 页面小图标
.post: 一篇文章
.post-title: 文章标题

然而搜索引擎聚合的网页太多,当这些五花八门的 class 出来之后,它又开始迷茫了,难以较好的聚合分类。所以出现一个叫做 Schema 的东西,它用来表示一个结构化数据结构,可以看下面一个 schema 示例:

<div itemscope itemtype="https://schema.org/Person">   
  <span itemprop="name">李靖</span>   
  <img src="https://barretlee.com/avatar.png" itemprop="image" />    
  <span itemprop="jobTitle">攻城师</span>   
  <div itemprop="address" itemscope itemtype="https://schema.org/PostalAddress">     
    <span itemprop="streetAddress">文一西路969号</span>     
    <span itemprop="addressLocality">浙江杭州</span>
    <span itemprop="postalCode">310000</span>   
  </div>   
  <span itemprop="telephone">(0571) 123-4567</span>   
  <a href="mailto:barret.china@gmail.com" itemprop="email">barret.china@gmail.com</a>
  李靖的主页:  <a href="https://barretlee.com" itemprop="url">barretlee.com</a>    
</div>

在一个需要表达的块上加上itemscope属性和一个itemtype属性,itemtype 是有固定值的,具体可以参阅schema.org的说明。然后在块内添加详细的说明,使用itemprop标注。整个操作十分简单,略微麻烦的是需要对照 schema 的官方网站填写规定的itemprop字段。

结构化数据,通常也可以称之为元数据,这些数据附着在网页文本信息内,厘清了页面上每个部件的功能、属性和意义。当机器进入网页的时候,能够像人一样,一眼瞄出要表达的内容。关于 schema ,以前翻译过一篇文章SEO:让搜索引擎对你的网站更有亲和力

SEO和站长工具的之间秘密

除非搜索引擎能够猜到你要搜索的具体的 URL 地址,一般地,它都会从自己的数据索引库中扒拉数据。对于权重高、更新频率高、原创内容多的网站,搜索引擎会十分勤快的爬最新内容。那么,如何让搜索引擎知道网站上有多少网页便成了一件重要的事情。

我们经常会听到一个叫做”网站地图”的东西。有些网站会在自己的站点中添加一个页面,这个页面包括了整站的重要入口,那么这个页面就是该页面的网站地图。这些地图是给人看的,如果只想给爬虫引擎看,可以将所有的链接按照一定的格式放到sitemap.xml文件中,然后把这个文件放到网站的根目录下,如https://www.barretlee.com/sitemap.xml

而最重要的还是robots.txt这个文件,它是所有引擎约定俗成的一个文件,比如我的网站中用到的https://www.barretlee.com/robots.txt,其内容为:

Sitemap: https://www.barretlee.com/sitemap.xml
User-agent: *
Allow: /

它告诉搜索引擎,网站地址的位置、允许蜘蛛爬取的内容等,它是一个协议。最近,貌似还多了一个humans.txt,也是一个比较有意思的文件,可以在这里了解它:https://www.humanstxt.org.cn/,它可以描述一些站点和团队的故事。

SEO上,站长工具主要分为两个方面,一个是对网页的抓取,一个是对网页的分析

网页的抓取在百度站长工具中体现的比较多,而网页的分析,诸如数据标注、结构化数据等,百度做的还比较搓,目前还在内测阶段,需要发送邮件才能申请权限。看到百度站长工具页面上的几个数据标注示意图,揣测应该比 google 弱一百倍,所以我还是重点说说 google 的吧。

网页的抓取

这块上,两个站长工具都是强调让开发者把网站地图显式的暴露给搜索引擎,提供了各种分析网站地图准确性合理性的工具,搜索引擎如果发现你的网站上一个地址时有时无,就会觉得你不可信有点飘渺。所以一旦网页因为改造或迁移导致页面链接丢失,可以在站长工具中填写这些死链。

不要贪婪的让搜索引擎不停的爬取你的网站,如果它多次过来发现内容是一样的,它也会很伤心的离开。而如果它发现每次过来爬你的内容都能找到很有意思的、从来没发现过的东西,它会对你越来越感兴趣,甚至日久天长它会给你定型、定位,然后权重会越来越高。在站长工具上都是可以设置的。

网页的分析

google 的数据化标记做的实在是太赞了!输入网址,它会打开你的网页,设置你要标记的类型,比如文章。选中页面上的元素然后标记。比如选中文章的标题,选中之后有一个菜单,在菜单上选择 title,选中作者名字,然后菜单上选择 author,一个页面标记完了之后,他会分析整站的所有页面,如果结构相似,也会自动标记其他页面。

整个标记完成之后,google 就知道你整个网站的信息架构了,下次要做的就是对这些信息内容做匹配和分类。所以我们可以看到,个人博客在 google 中的搜索是极其靠前的,因为页面的信息结构简单,即便你不去标记,它爬取多次之后也能自己理解。

对比百度和 google ,两者如同屌丝和高富帅。不过高富帅总是要越墙才能看到,所以我平时使用的依然是百度分析。百度分析和百度站长工具还是不一样的。百度对网页流量的分析和搜索词汇的分析还是挺精准,也很有参考价值。

小结

本文对 SEO 相关的东西做了一个简要的概述,同时也概括了搜索引擎做的一些工作,知识量有限,难以面面俱到,如有错误还请斧正。

  • 相关推荐
  • 大家在看
  • Adobe将提供PS和IA文档的网页预览功能

    Adobe在昨日发布博文称,将提供Photoshop和 Illustrator 的网页预览功能,用户可以通过Chrome、Edge浏览器,打开并查看查看相关 Adobe 云文档,并添加或回复评论,以及进行基本编辑,不在需要下载或启动应用程序。

  • Twitter网页版将允许用户 “软屏蔽”粉丝

    据外媒The Verge报道,Twitter网页版正在推出一项新功能,让用户可以在不阻止粉丝的情况下删除他们,这一行动也被称为 “软屏蔽”。要“软屏蔽”一个粉丝,用户需进入个人资料的粉丝列表页面·,点击粉丝名字旁边的三点菜单,然后点击“删除粉丝”选项。 用户删除的粉丝将不会被通知这一变化。“软屏蔽”与屏蔽不同,因为它允许粉丝仍然看到用户的推文和发送私信,但用户发布的内容不会再自动出现在粉丝的消息流中。当用户删除一个

  • 微软发布可在浏览器直接使用的网页版 VS Code 开发环境

    据ZDNet报道,微软于10月20日推出了其网页版Visual Studio Code(VS Code)工具的预览版。网页版VSCode使开发者能够直接在浏览器中使用更轻量级的VSCode,而不必在他们的本地电脑上安装。

  • 省去填写网页表格时间:Microsoft Autofill功能已拓展至Chrome

    消费者对于密码的管理不再满足于单纯的创建和存储密码,而微软最新推出的 Autofill(自动填充)服务皆在为桌面和移动端用户提供更贴心的服务。该服务是 Authenticator 应用和服务的延伸,当你需要在文本框(不限于密码框)中输入数据的时候能帮你自动填充。密码管理器是许多安全专家强烈建议人们使用的东西,因为人类在创建和记住强大的密码方面确实非常糟糕。然而在日常使用过程中,除了密码之外我们可能还需要填写身份证号码、信

  • 公众号可被搜索引擎抓取,微信或将更加“互联互通”

    微信公众号的内容只能在微信中看,这可以说早在多年前就已经成为用户的共识。不过最近有消息显示,微信公众号的内容可以被谷歌和必应等搜索引擎搜索到。

  • 网页端Google Photos上线Memories功能:帮用户更好管理相册

    Google Photos 应用中的 Memories 功能在上线之初,仅限于手机 APP 端。不过现在该功能终于在 Google Photos 网页端上线。Memories 功能利用机器学习,智能地根据照片中人物、场景、主题、特定时间范围对其分组,方便用户组织照片。虽然 Memories 功能已经上线几个月时间了,但是该功能仅限于移动端 Google Photos。这是一个相当奇怪的情况,因为移动应用和网络浏览器版本在功能上几乎是一样的。不管是什么原因,Google 终于要改变

  • 谷歌:微软 Bing 搜索引擎上最热门的搜索词是「Google」

    据彭博社报道,该律师描述说,「Google」是迄今为止在必应上搜索最多的词。 谷歌正在用这个角度来证明其客户选择使用谷歌搜索而不是竞争对手,而不是因为它是其设备上的默认选项。

  • 主打隐私保护的Brave浏览器宣布将默认使用自家的搜索引擎

    今年 6 月,Brave 推出主打隐私体验的搜索服务 Brave Search;现在该公司宣布旗下的 Brave 浏览器将默认使用自家的搜索引擎。目前在美国、加拿大和英国等特定市场的用户将默认使用该搜索引擎来替代 Google。其他国家的用户也将很快看到这一变化。与主要的搜索引擎不同,Brave的搜索引擎不包括用户跟踪,使其成为该公司用户更有吸引力的选择。美国、英国和加拿大的用户现在将默认使用 Brave Search 而不是 Google Search。此外,德?

  • 微信已使其内容可在谷歌、必应等搜索引擎上进行内容搜索

    腾讯微信已使其内容可在谷歌、微软必应等搜索引擎上进行内容搜索。最近几天,微信的内容已经向其自己的搜狗搜索引擎以外的外部搜索引擎开放,其中包括其受欢迎的公众号页面上的文章和视频,这一功能类似于新闻门户网站。

  • 微信突然向国外搜索引擎开放!腾讯火速回应:系统出现漏洞 已修复

    前不久,工信部等部门纷纷要求国内各平台进一步开放,接触外链屏蔽等机制,令用户使用更加方便,比如微信中直接打开淘宝等等。随着时间的推进,目前腾讯、阿里巴巴、字节跳动等各平台直接的屏蔽已经逐渐解除。今天下午,有报道称腾讯已经开始在搜索引擎放开搜索限制,其中指出微信公众号等内容已经能在谷歌、必应等国外搜索引擎直接查找,并打开浏览,但是国内的百度依然不能实现,令人疑惑。此事一时间也在网络上引发大量关注,其

这篇文章对你有价值吗?

  • 热门标签

热文

  • 3 天
  • 7天