首页 > 优化 > 关键词 > SEO最新资讯 > 正文

SEO如何研究排名规律

2020-11-04 09:04 · 稿源:流量贩子SEO公众号

声明:本文来自于微信公众号 流量贩子SEO(ID:kaopuseo1),作者:GoGo闯,授权站长之家转载发布。

01

搜索引擎基本概念:爬取、索引、召回、粗排、精排、重排

爬取 & 索引

搜索引擎爬取全网海量页面 → 进行基本的质量评分 → 过滤出小部分质量较佳的网页 → 创建倒排索引(能够通过关键词查询文档)

召回

用户发起搜索请求 → 搜索引擎先对关键词进行纠错处理 → 拆成多个词项 → 去索引中查找能够命中这些词项的文档,可能就是这个数

粗排

但是文档的实在数量太多了,一股脑的都推给用户显然很二逼,用户不可能都看完,只会看其中极小的一部分,另外也没法保证质量。

所以要从海量召回的文档中,删除其中内容高度重复的文档,并筛选与搜索词最相关的760个文档,展现给用户。

这个环节属于海选,需要大量计算,为了不让用户等待过长,一般用快捷优先且相对简单的处理方式,比如BM25、TF-IDF、LDA,具体还有啥咱也不知道。

SEO,关键词,网站,数据

精排

之后就是对760篇文档排序的过程,最终的目的是让排序结果最大概率符合用户预期的结果,这样用户才更有可能点进去了解详情,从而提升搜索的业务价值。

这部分比海选要复杂的多,涉及一大堆数据挖掘、机器学习、用户行为分析、用户意图识别等算法,大概包括:

  • 通过用户搜索词和前N次搜索词,结合历史日志中其他搜索该词的用户浏览行为,来揣测用户可能的搜索意图

  • 文档的更新时间

  • 文档的历史点击率

  • 文档浏览后终结搜索的比例

  • 用户的网络维度特征(IP、网络类型、地域....)

  • 与搜索词文本匹配度最高的TopN条文档

  • 与搜索词潜在意图覆盖率最高的TopN条文档

  • ....太多了咱也不知道

上述过程,对应着搜索引擎中,爬取、索引、召回、粗排、精排的几个阶段,属于搜索引擎系统入门级的常识。

重排

现在精排后面,还有重排,根据用户的搜索场景(网络、设备、近期点击行为等)和媒体热点,实时调整排序,比如:

  • 你用wifi跟手机网络,搜索结果可能有所不同

  • 今天上午点击的某个结果,下午再次搜索时排名就上去了

  • 上午媒体爆料一个叫GoGo闯神秘人和迪丽热巴约会了,然后下午GoGo闯的搜索结果,就跟上午完全不同了

02

如何研究排名(一家之言)

研究收录 vs 研究排名

在16年以前,本渣觉得研究「排名」是最难的,后来搞了一堆单页站群、泛站群、资讯站群和少数几个单站,大概前后10万域名出头,发现「搞定收录」其实比「搞定排名」麻烦的多,甚至应付广告主没事总tm扣量、跑路不结算、域名被停止解析....,我觉得都比研究排名麻烦。

因为在16年以前,本渣接触的都是大站,日UV百万级的,所以收录的问题不大,一般就是某个目录收录率低,但不存在完全不收录,或收录极其缓慢的问题。

毕竟,大站参与760名排序的概率很大的,But一堆海量小站,参与召回的机会都没有。

研究大站 vs 研究小站

所以,本渣觉得,大站与小站,研究排名,是两种路线:

大站研究的是,做的词怎样上首页。

小站研究的是,做哪些词能上首页。

研究的方法有两种:正推 和 逆推

03

正推

正推就是假设一堆条件,挨个去测试,能否达到自己预期的结果。比如快排的开发,大部分都是正推的,需要大量测试

逆推就是通过分析已有的结果,找出其中共同的规律需要大量观察

仅研究百度SEO排名规律上,正推的门槛极高。

比如,很久以前,本渣抓了1000个词(同一个词根)的搜索结果,把每个词的760个结果对应的网页全弄下来,最后我记得就不到40万篇,接近50%的搜索结果都是重复的。

然后我把这批网页导入到xunsearch(一个开源的搜索引擎,并不是说这个好,而是本渣当时只会这个,还不知道有elasticsearch这个东西)并建立倒排索引。

同时我还把默认词库整理了下,让这部分行业词分词更准确。

我的想法是:

第一步:在xunsearch和baidu,同时搜索一个词,通过调整xunsearch搜索参数,调整出跟百度很接近的结果,比如top10文档大部分一样,只是顺序略有差别。

第二步:我就修改自己网页的内容,推到xunsearch更新下索引,再次xunsearch搜索下,如果top10能出来,线上网页就按本次修改的上线。如果没出来,就修改其他地方,直到能在Top10出现。

理想丰满,现实骨感。

反正第一步始终没出来,毕竟商业搜索引擎,和开源搜索引擎,很多地方是不同的。

但是这只能代表百度,因为其他搜索入口,如研究微信搜一搜、知乎、小红书的排名规律就容易的多,首先这些平台不存在收录的问题,内容不违规即是收录,二是影响排序的因子比百度少很多。

anyway,正推我是放弃了

04

逆推

下面说说当时做的逆推的思路,相对来讲,逆推比正推省事很多。

长尾关键词 

long long time ago,在做站群的时候,当时开发的还不是泛解析程序,能承载无限个关键词的。是库里有多少词,这个程序就生成多少对应数量的页面,或二级域名。

这意味着,如果库里面塞了一堆根本不可能排在首页的关键词,这是浪费系统资源的,毕竟新域名收录有限,自然希望收录的页面,都是大概率能上排名的页面。

一个流量词呢,在搜索结果表现,有4种特征:

  • Top10结果爱站权重很高(平均权重>7)

  • Top10结果爱站权重很低(平均权重<2)

  • 搜索结果数很低(搜索结果数<1000)

  • 有高有低(平均权重2-4)

第一种可能这个词竞争度很大,或者本身是比较敏感的词,比如医疗养生类的,所以百度特意分流给了一些信任度高的大站

第二种可能这个词是违禁的,但百度有没来得发现,也可能这个词还没被很多人发现。这个可以根据搜索结果的标题,是否完全命中关键词来判断,能命中是前者,不能命中是后者

第三种是这个词是违禁的,且已经被百度发现删除

第四种是正常的词,比如不算热门的小说、漫画名啥的

已排名优先的清洗关键词措施,是找出第1种和第3种词,然后删除掉。

所以当时找词,比如从爱站导出来的竞品网站关键词,会先按如上方法洗词,洗完之后在上线。同等域名数量的情况下,能多出25%的流量。

以上是研究长尾词能够大概率上首页的问题,下面来聊聊核心词的排名。

独立核心词排名

以前有一种刷词方法,比如核心词是「SEO」,会去同时刷创造出来的新词,比如「SEO流量贩子」,同时title也改成这个词。

经过 “恰如其分的刷量比例 & 时间拉长”,「SEO」与「SEO流量贩子」会产生关联,「SEO流量贩子」是「SEO」搜索意图中的一种

这样「SEO流量贩子」排名到首页后,在加大「SEO」的点击,这样核心词「SEO」上首页的概率,比直接硬点概率要大一些。

所以之前,SEO这个词,在百度指数的下拉,或百度搜索框的下来,总有一些烂七八糟的词

判断网页与核心词的真实相关性(排除点击加权)

当然,这个不是绝对,同时也跟百度认为网页本身与核心词有多大相关性有关。

比如很多刷快排的站,网页做的乱七八糟,可以说不符合SEO友好性,存在排名很大程度是点击加权,而非相关性,这样快排有点波动就容易被干。

识别这种情况,可以在搜索词后加个无关紧要的符号,比如「华为工资 。」

搜索引擎对用户的Query,会先纠错在分词召回,纠错过程就包含去除烂七八糟的符号,之后再排序。

but,「华为工资 。」这个词的排序没有点击加权因素在里面,因为没人点击这个词,同时这个符号对核心词“华为工资”相关性排序的影响很低,因为每篇文档都有一大堆句号。

所以你看「华为工资 。」与「华为工资」的排序,几乎一样的。但对比「seo 。」与「seo」的搜索结果,就非常奇妙了。

或者,也可以把主词拆开来搜索,比如「华为工资 华为 工资」,或者输入两次「华为工资 华为工资」

海量核心词排名

但如果有很多核心词怎么办?

比如某类词根,如:

  • 关于XXX的作文

  • {城市}公司

  • {古诗名称}

  • ....

long long time ago,本渣的做法是:

1)把这批词,全部扔到百度搜索框,依次提取下拉框的词

2)计算每个后缀的出现频次

3)选择频次最高&标题完全命中关键词搜索结果少的词缀,作为网页title的补充

举个例子,比如{城市}公司,标题只写「{XX}公司」,有些浪费,因为这个词后面有人搜:

  • {XX}公司大全

  • {XX}公司名录

  • {XX}公司黄页

  • {XX}公司排行

  • {XX}公司排名

  • {XX}公司代办

  • ......

但是又不能所有后缀都加上,所以疑问是:添加哪个后缀,能大概率让「{XX}公司」和「{XX}公司{后缀}」都有排名?

全国300多个县级市,60%+城市,其下拉框都会出现“排名”,其实“名录”、“黄页”的出现频次也不少,跟“排名”差不多,但是这两个词缀做的人太多了,也就是搜索结果标题完全命中的数量比较多,所以最后用了“排名”,即title为:“北京公司排名”

结果是,二三线城市差不多都上去了。

一线城市没上去是因为,搜索需求太丰富,比如:代办、摇号、转让...

  • 相关推荐
  • 大家在看
  • 网站排名,有效的SEO标签有哪些,如何用?

    ​在很长一段时间,对于SEO工作,我们都是围绕提高企业网站排名而展开的,这是毋庸置疑的事情,但这项工作的重任往往来源于网站的内容与链接,通常情况下,对于站内优化的细节,很少进行有效的关注,特别是一些做快排的同学,它认为只要提交给系统就万事大吉,实际上并不是这样,一个网站内部是否达到搜索引擎友好,对于后期的排名,仍然至关重要。

  • 跟全网客一起来看一看如何做到搜索引擎霸屏

    实际上现在在搜索引擎当中,已经对于各类广告的投放做的比较精准了,由于大数据时代存在不再需要把各类信息投放给每一个消费者,而是有的放矢的进行投放。举个简单的例子来说,如果是篮球用品的话,投放给18岁到58岁之间的男性朋友,销量情况肯定会更好一些。于是在这种情况下,我们就要讨论一下搜索引擎霸屏究竟是怎么实现的,以及这类服务商都是如何操作的。一个懂得精准营销的平台很重要。但我们在做营销推广的过程当中,首先是要选择好?

  • 微软为Xbox推出Bing应用 让搜索引擎在游戏机上也更好用

    微软宣布为Xbox游戏机推出一款新的Bing应用,目的是让该公司的搜索引擎在其游戏硬件系列上更容易访问。在基本功能方面,它就是你所期望的Bing应用程序,例如提供网页和图像搜索,区别在于是用游戏机访问的而不是使用手机或PC。

  • 谷歌宣布其搜索引擎的另一项新功能:“哼歌识曲”

    据外媒CNET报道,谷歌周四公布了其搜索引擎的一些新功能。其中一个新技巧可以让人们哼唱录音,试图找出一首一直想不起歌名的歌曲。这家科技巨头还将让人们通过实时更新看到一个公园、餐厅或其他企业的繁忙程度。谷歌搜索上的一项新的增强现实功能可以让人们选购汽车,并进行虚拟游览。谷歌在周四的一次预录的在线活动中宣布了这些消息。

  • 谷歌提及微软默认搜索引擎Bing以回应反垄断诉讼

    据外媒报道,尽管美国司法部可能在一个可疑的时间期限上加快了对谷歌的反垄断诉讼,但谷歌的最新辩护可以说也同样值得怀疑。在特朗普精心挑选而出的WilliamBarr的领导下,美司法部已正式对谷歌提起反垄断诉讼。当地时间10月20日,作为被告的谷歌通过其公共政策博客进行了反驳。

  • 美司法部提反垄断诉讼:谷歌与苹果搜索引擎协议成核心

    据外媒报道,据报道,谷歌与苹果的协议是最近美国司法部对科技巨头苹果提起的诉讼的核心内容,该协议旨在维持谷歌作为iOS设备默认搜索引擎的地位。当地时间周二,美国司法部对谷歌提起反垄断诉讼,指控该公司在互联网搜索行业滥用权力。其跟苹果及其他公司的协议被列为司法部此次争论的一部分。

  • 企业网站排名回升后,快速下跌是什么原因?

    国庆假期期间,很多SEO人员,都是喜笑开颜的,理由非常简单:大量的网站关键词排名都开始回升,特别是之前一些“作弊”的网站,很多站的权重大幅度的提升。

  • Google每年向苹果支付80-120亿美元以成为默认的iOS搜索引擎

    据《纽约时报》报道,作为美国政府正在调查的最大的反垄断案件之一,司法部正瞄准苹果和谷歌之间的一项利润丰厚的交易。上周二,司法部对谷歌提起反垄断诉讼,声称这家总部位于山景城的公司在搜索和广告市场上使用反竞争和排他性做法,以维持非法垄断。

  • 谷歌每年向苹果支付80-120亿美元 以成为iOS默认搜索引擎

    美国司法部正在针对苹果公司和谷歌公司之间的一项交易提起诉讼,这是美国政府最大的反垄断案件之一。据称,谷歌在搜索和广告市场使用反竞争和排他性做法,以维持非法垄断的地位。

  • SEO排名,如何提高网站信任度?

    ​在现实生活中我们知道在人与人之间建立信任是社交活动十分重要的事情,这一点对于搜索引擎而言,也不例外,一个受信任的网站,往往会得到更多的流量倾斜。

  • SEO快速排名,值得注意的8个细节!

    在做SEO的过程中,我们永远都是在与时间赛跑,谁能够在较短的时间快速排名,谁就有可能在市场中抢占先机,甚至是曝光自己的品牌。

  • SEO网站优化,值得关注的5个知识点!

    如果你刚刚进入SEO这个领域,我们仍然有很多内容并不是十分的清楚,大部分的时间,我们都是在专注于研究百度推广方案,但这里面可能会涉及诸多的SEO要点,需要我们思考。

  • 我建了一个小众软件评论网站,靠SEO实现6位数收入

    再小众的市场,如果做到极致,也能让你获得可观的收入。比如SelectSoftware Reviews (下文简称为SSR)是一个人力资源软件评论网站(网址:www.selectsoftwarereviews.com),致力于帮助人力资源和招聘团队通过免费的在线指南找到并购买最佳的软件。

  • SEO岗位招聘

    岗位名称:SEO薪资范围:20k-40k岗位职责1、负责公司网站的SEO优化,网站关键词排名优化,负责提升网站的流量。2、能够根据公司战略发展要求,制定优化策略,对网站进行持续分析和改进,提高排名流量的转化率。3、负责网站关键词和页面架构设计,对SEO效果负责。4、负责数据监控和分析,定期跟踪、分析、总结SEO效果及研究竞品SEO策略,并提出有效调整方案。5、负责网站推广、网站内链、外链建设工作,能够快速为网站获取优质高权?

    SEO
  • 逆冬:实战型SEO必备6大技能+SEO误区讲解!

    许多新手质疑、不会代码能不能去做SEO,根据我几年的经验可以给大家讲一下,我的很多徒弟都不会代码的、SEO也做得不错~~~SEO和代码是两回事、对一名普通的SEO来讲、会一些简单的html+常用的CMS系统操作即可、毕竟要满足日常的工作需求。像python、php一般无需掌握、平时极少用到。换句话说、像python、php没有几年的经验是很难成为大神、小白写出来的软件又有多大作用?

  • 法庭下令:苹果永远不能禁止虚幻引擎

    苹果与Epic之间关于《堡垒之夜》的争端还在继续,这款备受欢迎的游戏迄今未在App Store恢复上架。一开始,苹果甚至要出手一同封杀Epic出品的虚幻引擎,关停其开发者账户,这将波及到大量基于此开

  • 白杨SEO:5000+字拆解如何从0-1利用知乎排名被动精准引流和变现【实战案例】

    在讲知乎排名原理,我先说一下,关于知乎排名,我们主要分知乎站内排名与知乎站外排名,这个一定要搞清。站内是指用户在知乎里搜索关键词或者一个问题的排名。而站外是指,通过百度、搜狗、微信等搜索关键词时你的知乎内容的排名。

  • SEO思维:赚钱的本质是打造格局

    有人拼命一天挣100块觉得自己牛逼了,去每个省的商会群看一下那些老板,你惊叹:卧艹!卧艹!卧艹!有人拼命一天挣1000块觉得自己牛逼了,去夜总会逛一下,小姐姐们的小费随手都是以千打底,自己消费不起。

  • SEO进阶,你应该克服的5大困难有哪些?

    SEO进阶是一个成长的过程,无论在什么类型的SEO机构,每天你都会面临着不同的压力,特别是刚进入这个领域的工作人员。

  • SEO头条:值得深思的几个问题

    对于有经验的SEO人员,每天都在关注SEO头条,研究行业“今日热点”新闻,是每个从业人员的必须课,它在SEO项目中,提供宝贵的优化意见,并在实战中,让你脱颖而出。

  • 参与评论
文明上网理性发言,请遵守新闻评论服务协议
  • 热门标签

热文

  • 3 天
  • 7天