首页 > 优化 > 关键词  > robots最新资讯  > 正文

了解robots文件,主动告诉搜索引擎该抓取什么内容

2015-08-07 10:53 · 稿源:众优网

导读:首先我们要了解什么是robots文件,比如,在安徽人才库的首页网址后面加入“/robots.txt”,即可打开该网站的robots文件,如图所示,文件里显示的内容是要告诉搜索引擎哪些网页希望被抓取,哪些不希望被抓取。因为网站中有一些无关紧要的网页,如“给我留言”或“联系方式”等网页,他们并不参与SEO排名,只是为了给用户看,此时可以利用robots文件把他们屏蔽,即告诉搜索引擎不要抓取该页面。

蜘蛛抓取网页的精力是有限的,即它每次来抓取网站,不会把网站所有文章、所有页面一次性全部抓取,尤其是当网站的内容越来越多时,它每次只能抓取一部分。那么怎样让他在有限的时间和精力下每次抓取更多希望被抓去的内容,从而提高效率呢?

这个时候我们就应该利用robots文件。小型网站没有该文件无所谓,但对于中大型网站来说,robots文件尤为重要,因为这些网站数据库非常庞大,蜘蛛来时,要像对待好朋友一样给它看最重要的东西,因为这个朋友精力有限,每次来都不能把所有的东西看一遍,所以就需要robots文件屏蔽一些无关紧要的东西。由于种种原因,某些文件不想被搜索引擎抓取,如处于隐私保护的内容,也可以用robots文件把搜索引擎屏蔽。

当然,有些人会问,如果robots文件没用好或出错了,会影响整个网站的收录,那为什么还有这个文件呢?这句话中的“出错了”是指将不该屏蔽的网址屏蔽了,导致蜘蛛不能抓取这些页面,这样搜索引擎就不会收录他们,那何谈排名呢?所以robots问价的格式一定要正确。下面我们一起来了解robots文件的用法:

1.“user-agent:*disallow:/”表示“禁止所有搜索引擎访问网站的任何部分”,这相当于该网站在搜索引擎里没有记录,也就谈不上排名。

2.“user-agent:*disallow:”表示“允许所有的robots访问”,即允许蜘蛛任意抓取并收录该网站。这里需要注意,前两条语法之间只相差一个“/”。

3.“user-agent:badbot disallow:/”表示“禁止某个搜索引擎的访问”。

4.“user-agent:baiduspider disallow:user-agent:*disallow:/”表示“允许某个搜索引擎的访问”。这里面的“baiduspider”是百度蜘蛛的名称,这条语法即是允许百度抓取该网站,而不允许其他搜索引擎抓取。

说了这么多,我们来举个例子,某个网站以前是做人才招聘的,现在要做汽车行业的,所以网站的内容要全部更换。删除有关职场资讯的文章,这样就会出现大量404页面、很多死链接,而这些链接以前已经被百度收录,但网站更换后蜘蛛再过来发现这些页面都不存在了,这就会留下很不好的印象。此时可以利用robots文件把死链接全部屏蔽,不让百度访问这些已不存在的页面即可。

最后我们来看看使用robots文件应该注意什么?首先,在不确定文件格式怎么写之前,可以先新建一个文本文档,注意robots文件名必须是robots.txt,其后缀是txt并且是小写的,不可以随便更改,否则搜索引擎识别不了。然后打开该文件,可以直接复制粘贴别人的格式,

Robots文件格式是一条命令一行,下一条命令必须换行。还有,“disallow: ”后面必须有一个空格,这是规范写法。

文章有万马奔腾原创https://www.400815.com,转载请注明。

举报

  • 相关推荐
  • AI之下,搜索获得“无限内容池”

    搜索引擎诞生20余年,其核心一直考验对于海量信息检索、分析、匹配以及呈现的能力。它一头是搜索技术,一头是内容池。 不夸张的说,如果搜索的能力是“巧妇”,可检索分析匹配的内容则是“米”,甚至在后搜索时代,搜索能力之间的差距在减小,用户有了更多的选择,但内容的数量和质量却参差不齐,用户搜索的体验大打折扣。 为了满足给用户更好的搜索体验,百�

  • 极光GPTBots成功完成“生成式人工智能服务登记”

    极光旗下AI开发平台GPTBots.ai近日在广东省网信部门完成生成式人工智能服务登记,成为合规经营的AI服务提供商。该平台严格遵循国家《互联网信息服务深度合成管理规定》和《生成式人工智能服务管理暂行办法》等法规要求,标志着其在技术创新、服务模式和数据安全等方面获得关键合规认可。此次登记体现了极光对法律法规的严格遵守和对安全责任的高度重视,为区域AI生态发展注入新活力。未来,极光将继续优化技术与服务,保障用户权益,推动生成式AI技术的健康规范发展。

  • 直击企业痛点 全球制造链+科技巨头聚焦GPTBots.ai

    在2025深圳国际人工智能展上,极光旗下企业级AI Agent平台GPTBots成为焦点。该平台展示了在制造业智能化升级中的解决方案,包括构建企业知识搜索引擎、自动化办公流程及跨境商务沟通等应用场景。展会期间,平台吸引了苹果等科技巨头及多国企业代表关注,探讨了AI在供应链管理、项目监控等领域的落地实践。GPTBots凭借模块化架构和安全部署能力,已服务金融、制造等十余个行业客户,助力企业实现降本增效和智能化转型。

  • 极光GPTBots实力入选《2025政务行业信创生态图谱》,赋能智慧政务新未来

    在北京召开的"2025中国信息技术应用创新峰会"上,极光GPTBots凭借在政务智能问答、办公提效、数据分析等场景的卓越表现,入选《2025政务行业信创生态图谱》。该图谱系统梳理了政务信创生态现状与趋势,为构建自主可控、安全可靠的政务创新生态提供指引。极光GPTBots深度融合国产大模型技术,在政策智能解答、办公自动化、文档处理等政务场景实现深度赋能。此次入选标志着其在推动政务数字化转型方面的贡献获得权威认可,未来将持续投入核心技术研发,深化政务场景应用探索,助力数字政府建设。

  • 预测大模型的工业生存法则,华为博士告诉你什么才是B端最需要的大模型!

    华为开发者大会2025期间,AI专家李良基与华为团队围绕预测大模型展开深度对话。华为提出"数据原子级表征体系"理念,旨在通过统一数据编码解决跨场景迁移难题。预测大模型已在钢铁行业成功应用,温度预测准确率远超传统方案。专家指出,AGI发展的核心在于构建知识迁移能力,未来将聚焦To B场景落地,通过统一架构实现跨领域泛化应用。华为云首创Triplet Transformer

  • OPPO首款内置风扇手机!OPPO K13 Turbo Pro全配置揭晓

    快科技6月14日消息,博主数码闲聊站今天曝光了OPPO K13 Turbo Pro的基础配置信息,这是OPPO的第一款内置风扇手机。具体来看,该机将搭载一块6.8英寸的1.5K直屏,拥有2800*1280p分辨率、144Hz超高刷新率,配备短焦屏幕指纹识别。前摄是1600万像素,后摄是5000万像素 200万像素的双摄组合,影像并不是主打方向。机身采用塑料中框方案,自带RGB灯,支持IPX8。最关键的是性能规格,OPPO K13 Turbo Pro搭载第四代骁龙8s处理器,并且配备有16GB 512GB的大内存组合,是一台主打性能体验的机型。而且该机采用了内置主动风扇散热系统,在后置主摄下

  • REDMI Turbo 4 Pro粉金新配色发布 售价1899元起

    今日,REDMI官方正式为Turbo4Pro机型推出全新粉金色版本,售价维持1899元起不变。 作为REDMI今年4月24日发布的性能旗舰,Turbo4Pro上市即成爆款,不到一个月时间便创下累计销量突破100万台的佳绩。此次新增的粉金配色,在保持原有硬核配置的同时,通过色彩创新进一步拓宽用户群体。 屏幕方面,该机配备6.83英寸1.5K LTPS直屏,采用M9发光材料,支持120Hz高刷新率、480Hz触控采样率�

  • 米家空调Pro系列推送OTA:压缩机升级全工况6Hz变频算法

    小米官方发文宣布,米家空调Pro系列OTA今日起陆续推送,升级了全新的压缩机控制算法,覆盖新风和上出风系列产品。 这次OTA主要就是全面优化了双缸压缩机控制算法,升级为全工况6Hz变频算法”。

  • 数智驱动 全球增长:RixEngine(睿力引擎)邀您共聚2025 ChinaJoy BTOB馆

    RixEngine将在2025 ChinaJoy(展位W3-B502)展示旗下三大智能广告产品:RixSaaS一站式程序化广告平台,10分钟即可部署自有广告系统;RixDesk智能营销平台,日均处理500亿+请求,覆盖1.3亿DAU;RixDev流量变现方案,连接全球头部DSP资源提升填充率。现场提供专家1v1咨询、专属解决方案及互动好礼。该全链路智能广告引擎通过大数据和深度学习技术,为广告主、开发者和平台运营商提供从系统搭建到流量变现的全方位服务。

  • 分析师称MacBook Pro将升级OLED屏:Mini LED退场

    Omdia分析师Linda Lin在一份研究报告中重申,首批搭载OLED屏幕的MacBook将于2026年问世。 尽管她未特别提及MacBook Pro,但业界普遍认为,OLED屏将率先在高端MacBook Pro上首发,随后才会应用到价格更低的MacBook Air系列上。 当前MacBook Pro使用的是Mini LED屏,这块屏升级了液晶层背光,把背光中的LED灯小型化,本质上仍然是LCD屏幕,每个LED灯珠尺寸约在50-200um之间,让背光层拥有更多的背�