首页 > 优化 > 关键词  > 正文

搜索引擎如何判断核心内容的思考

2008-01-28 19:58 · 稿源:Seotest

搜索引擎蜘蛛把页面代码送回搜索引擎服务器后,SE是如何判断页面中最核心的内容呢?

先说下Kyw认为的搜索引擎运作过程的前几个步骤:

1. 蜘蛛下载A页面,送回服务器;

2. 服务器寻找A页面的核心内容位置,然后去除HTML代码;

3. 寻找网页核心内容;……

我不确定GOOGLE、百度、YAHOO!是否真的有“判断核心内容”这个步骤,但我相信一定有类似的运算机制,因为如果没这个步骤,搜索引擎将耗费大量资源做重复运算。当然KYW不是搜索引擎工程师,下面只是对搜索引擎的一些思考。

SE面对一整页HTML代码,如何判断核心内容在哪里呢?
第一步:拿该页面和同域名、同目录、同文件名格式的页面做对比,去除相似的部分。经过这个步骤,头部的导航条、底部的版权信息、固定位置的广告就被去掉了。我估计搜索引擎在每增加一个新网站的时候,会建立一个对比模板来提高工作效率。如果网站经常改版,在改版刚开始的期间,搜索引擎还没反应过来,就可能造成新收录网页的排名不理想。

第二步:去掉有大量链接的部分。经过这步,“相关文章”“推荐文章”等都被去掉了,剩下一些包含文字内容的代码。

第三步:在剩余的代码中判断哪段标签(可能是DIV、TABLE、P或其它标签)中的文字内容最多,因为一般核心内容的文字量会比较多。

每个页面经过上面3个步骤,应该就能顺利的判断出核心内容所在的位置。经过这样的思考,我们也许可以这样总结:

1. 同目录下的页面,最好模板一样。

2. 核心内容文字量不能太少,特别是企业站和B2C网站,只放价格和包含大量说明文字的图片是很不好的。

3. HTML代码中如果错误很多,可能会影响排名,因为搜索引擎可能在判断核心内容的时候出差错。

4. 期待你的补充 ^_^

Kyw把SEO的主要工作理解成帮助搜索引擎更高效的理解网站及页面的内容,所以建议大家有事没事琢磨琢磨搜索引擎,问题想透的越多,SEO的手法也就更加随机应变了。当然也没必要钻牛角尖,有想不通的问题就到我这留言吧。

原文:https://www.seotest.cn/blog/se-panduan-hexin.html

举报

  • 相关推荐
  • 国内MCP服务器搜索引擎有哪些?MCP服务网站推荐

    在人工智能技术飞速发展的今天,AI模型与外部工具和服务的交互能力正逐渐成为推动技术进步的关键因素。今天,我们聚焦于一个新兴的、极具潜力的平台——AIbase(https://mcp.aibase.cn/),它为全球的AI开发者和研究人员提供了一个前所未有的MCP(Model Context Protocol,模型上下文协议)服务器集合平台,助力AI技术的进一步发展。 MCP协议是一种开放标准协议,旨在允许AI模型与外部

  • AI日报:火山引擎发布豆包3.0;通义开源Qwen3非思考模型;谷歌偷偷升级Imagen 4

    【AI日报】栏目聚焦人工智能领域最新动态:1)火山引擎发布豆包系列AI模型升级,包括图像编辑3.0、同声传译2.0等;2)通义千问开源Qwen3-30B模型,支持多语言处理;3)OpenAI推出ChatGPT Study学习助手;4)中国发布HYPIR图像复原大模型;5)谷歌NotebookLM新增视频概览功能;6)谷歌Imagen4图像生成模型升级,性能媲美GPT-4o;7)昆仑万维开源多模态模型Skywork UniPic;8)理想汽车发布首搭VLA大模型的i8纯电SUV;9)谷歌在英国推出AI搜索模式;10)OWL团队开源多智能体协作工具;11)2025年用户增速最快APP榜单显示DeepSeek等AIGC应用表现突出。

  • 国内MCP服务器搜索引擎有哪些?MCP导航站平台推荐

    在人工智能技术蓬勃发展的今天,AI模型与外部工具和服务的交互能力正成为推动技术进步的关键。AIbase(<https://mcp.aibase.cn/>)作为一个专注于MCP(Model Context Protocol,模型上下文协议)服务器的集合平台,为全球的AI开发者和研究人员提供了一个前所未有的资源库,助力AI技术的进一步发展。 AIbase平台的核心在于其对MCP协议的深度整合。MCP协议是一种开放标准协议,允许AI模�

  • 新风空调好不好难判断?家电院把首张健康认证颁给了海尔

    中国发布首张"可清洗智能健康新风空调认证",海尔麦浪安睡新风空调成为首个获证产品。该认证聚焦用户最关心的三大痛点:1)采用双循环净氧技术解决制冷与新风兼顾难题;2)配备可水洗HEPA滤网,经认证具备12年耐用性,降低长期使用成本;3)运用AI仿生静音科技,运行声压低至12分贝。认证标准涵盖噪音、净化效率、滤网耐用性等硬指标,使"健康""智能"等概念从模糊宣传变为可验证的客观标识。这标志着新风空调行业向标准化、规范化迈出关键一步,消费者选购时只需认准该认证标识即可直观判断产品性能。

  • 豆包App视觉推理升级 支持图片思考

    豆包App近期升级视觉推理能力,支持在思维链中运用图像思考。用户上传图片提问时,豆包能主动分析图片内容,智能放大局部细节确保不遗漏关键信息。对于复杂图片,还能智能裁剪并调用搜图功能提供更准确结果。升级后的豆包可智能调用多种工具辅助分析图片,无论是日常识物、商品查询,还是工作学习中分析图表、专业图片,都能给出更精准实用的答案。据悉,豆包是国内首个实现这一能力的产品,用户可免费体验。

  • 微算法科技(NASDAQ:MLGO)采用分布式哈希表优化区块链索引结构,提高区块链检索效率

    微算科技(NASDAQ:MLGO)采用分布式哈希表(DHT)技术优化区块链索引结构,解决区块链数据存储和检索效率低下的问题。该技术通过哈希函数将数据分散存储在多个节点上,实现快速定位和检索,显著提升查询响应速度。系统具有去中心化、可扩展性强、容错性高等优点,适用于金融、供应链、物联网等多个领域。该创新不仅优化了区块链索引结构,还通过数据去冗余存储策略降低存储成本,同时增强数据安全性和可靠性,为区块链技术在各行业的广泛应用提供了高效解决方案。

  • 冷建全的“冷”思考:AI狂潮下,金仓数据库为何把“融合”刻进基因?

    7月15日,中国电科旗下金仓数据库以"融合进化 智领未来"为主题发布全新战略,提出未来数据库应"以融合为体,以AI为用"。金仓数据库高级副总裁冷建全指出,国产数据库在AI时代的突围路径是构建"五个一体化"融合能力体系,而非简单追逐热点。金仓数据库通过多语法体系兼容、多集群架构支持、多模型数据存储、多应用场景处理、开发运维一体化五大能力,显著降低国产化替代总成本。在AI应用方面,金仓重点布局向量计算和智能运维,其向量引擎已支持多种数据类型,并应用于公共安全、电力巡检等领域。同时推出的"K宝"AI助手可提供智能运维支持,故障预警准确率达98%以上。金仓强调"融合是根本,AI是赋能",通过夯实数据库内核能力,为各行业数字化转型提供稳定高效的数据基础设施支撑。

  • 诺贝尔奖得主站台 “萃龄肽”:黛安蒂核心成分背后的科学密码

    护肤品牌黛安蒂联合诺贝尔生理学奖得主兰迪·谢克曼推出"细胞精准递送"抗衰技术,基于囊泡运输理论研发核心成分"溯龄肽"。该技术突破传统抗衰模式,通过七种多肽协同作用,精准调控细胞囊泡运输系统,提升胶原蛋白合成57%,抗氧化酶活性提升179%,实现低浓度(500μg/ml)多重功效。实验证实该技术能促进弹性蛋白合成29%,提升维生素C透皮率40-60%。兰迪教授指出衰老本质是细胞运输效率衰退,该技术通过优化细胞自主吸收能力,重新定义50+人群抗衰标准,标志着从"补充"到"调控"的抗衰范式革新。

  • 仙乐健康在WAIC开启AI配方引擎战略合作

    2025年7月28日,仙乐健康与记忆张量在2025世界人工智能大会签署战略合作协议。仙乐健康将基于记忆张量的MemOS操作系统构建专用工业大模型基础设施,推动健康产业从标准化制造向个性化服务转型。合作内容包括打造三大核心系统:智能知识中枢PharmaQA、配方生成引擎FormuGenius和需求洞察系统NutriTrend,并共建联合实验室推动个性化营养创新。此次合作标志着营养健康产业与AI技术的深度融合,将提升研发效率,优化全球供应链能力,巩固仙乐健康在全球营养健康食品CDMO领域的领先地位。

  • 撞头“卡卡西”的本田核心工程师发中文感谢:原来还是健身大佬

    本月初,本田汽车的一位工程师因发型过于犀利,形似《火影》里的旗木卡卡西而在网上走红。 嗅觉还算是灵敏的本田总算是让该工程师出来营业”了,原来这名工程师名字为大馆正太郎。 虽然顶着一头犀利的杀马特发型,但是个不折不扣的大佬,手握250 项专利,而且还是健身达人,可卧推170公斤5次。 在本田发布的视频里,大馆正太郎用中文向中国网友问好,并表达了自