首页 > 动态 > 关键词  > 百度搜索引擎优化指南最新资讯  > 正文

百度:正在设计一套较完善的原创识别算法

2012-08-10 17:46 · 稿源:站长之家

站长之家(chinaz.com)2012年8月10日整理:百度网页搜索产品市场部对外界而言,这个团队就是个传说,在百度内部,这个团队也同样带着极其浓郁的神秘色彩,也因神秘,外界对他们充满了好奇和猜测,甚至还有一些误解。2012年8月10日,百度站长社区迎来第一期站长门诊开放日,网页搜索产品市场部专家Lee现身为站长们答疑揭秘。

Lee在回复中提及了关于快照更新问题、原创识别问题、超链问题等站长们心存疑问许久的问题,并透露称百度正在设计一套较完善的原创识别算法,不久之后将会邀请站长朋友提供一些建议及抄袭的实例用做算法调整之用。此外,还表示近期都会通过站长平台和站长们做专门的交流或说明。

下文为百度站长社区开放日问答整理:

问题1.一个网站内有部分页面的title等设置一样,那么会不会影响到这些页面的相关关键词排名,还是从中选择一个权重高的合适的页面出来参与排名竞争?

Lee:这种问题请参考《百度搜索引擎优化指南》,其中已经有非常明确的说明,多个网页title一样,意味着这部分网页搜索引擎判断其中心内容非常困难,也就不容易准确的给其一个合理的权值。

问题2.百度对于网站分隔符、网站结构是否有自己的标准?目前医疗网站内容同质化严重,请问百度是如何来判定?

Lee:网站的结构在保证用户体验的前提下,适当的做一些对spider的优化会有助于收录,我们推荐扁平的树型结构。《百度搜索引擎优化指南》中有详细的说明。

关于同质内容,先透露一下,我们正在设计一套较完善的原创识别算法,不久之后也会邀请站长朋友给我们一些建议及抄袭的实例用做算法调整之用。

问题3.网站一个网页多大合适,有的页面大小过200k,我一般都注意在110k以内,这个有数字标准吗?

Lee:网页大小建议以用户能接受的程度为准 对百度来讲,我们能接受的网页大小肯定已经超出普通网页平均大小的数十倍,完全不用担心。

问题4.百度对于一篇原创文章的判断到底是怎样的标准?比如一篇原创文章可能最先是一个新站或权重较低的站发布的。

Lee:近期我们会就原创识别问题和大家做专门的交流,为了保证算法的寿命周期,我们不会公布算法的细节,但大家的意见和碰到的具体问题,都考虑到算法中。

问题5.现在点击器泛滥,导致很多内容很不好的网站排名很好,认真做内容的网站反而不能排在前面 希望这个百度能重视。

Lee:如果大家遇到此类问题,请到https://tousu.baidu.com/webmaster/suggest反馈,我们有专门的同学轮流分析并安排到合适的项目中去解决,我也是其中之一。

问题6.百度对于链接买卖、站群和克隆站的打击策略是怎样的?

Lee:超链应该是用户真心实意对网站的投票,买卖链接有违超链的本意,我们反对链接买卖。 很快我们将就此类问题做一个专门的说明,同时也会说明我们对买卖链接的处理原则。

问题7.如果站长们不投诉,被误伤的网站会一直被惩罚吗?有没有恢复的期限,是半年,还是一年?或者更长?

Lee:我们的策略都会定期的review/改进,不同的策略有不同的周期,天级到月级不等,我们会持续的改进策略,以减少误伤。

问题8.针对一些大站 比如B2B 分类信息站 其大部分每天更新的都是产品详细页 因为客户都比较懒,发布的信息都非常简单。

Lee:搜索引擎对网页价值的判断,不是从字数出发的,而是从其资源质量出发的 只要是对用户有价值的内容,不论长短,我们都会给一个合理的评价 如果这个网站上提供的内容或者服务非常有价值,无可替代,那对搜索引擎来讲,就是一个高质量的网站

问题9.现在凭借发布时间来判断两篇相同文章哪篇是原创还无法实现,这一点百度说明过,但是现在的情况是很多新 站,权重低的网站站长自己辛辛苦苦一点点码字写出来的原创文章,被高权重网站转载,虽然注明了出处,但是对于百度来说,如果仅仅因为转载网站权重高就判断 为原创文章,那就意味着低权重网站被误判为抄袭或转载,这样显然很不公平,请问对于判断文章原创问题,百度搜索团队是否有解决方案,或者直接回答我们“百 度是否能判断出哪篇文章才是原创的”。

Lee:刚刚已经说过了,我们正在计划在原创方面做一些改进。原创识别是一个很有技术含量的话题,不是简单的几种规则就能做好的,互联网很复杂,人心更复杂,不过我们有信心逐步的去解决这个问题,其中也需要站长朋友多提供相关的问题和建议。

问题10.百度什么时候能发放,外链查询工具,还有网站权重对百度是否有用的工具。

Lee:外链查询工具请密切关注站长平台,也许会有惊喜。

问题11.自从大K站之后,许多的网站快照一直停留不动,不知道这是什么原因。是算法在调整,还是我们应该在网站自身找原因。

Lee:关于快照的更新时间,尤其是首页的更新时间,我一直建议不要参考,这个时间跟网站的价值没有任何的关系,近期我们也会出一个专门的说明。

问题12.很想知道,在百度眼里什么样的站是高质量的站,每一个站都是从没用户到有用户,一点点积累起来的。

Lee:关于这个问题,请大家换位思考一下,作用一个搜索引擎,所追求的最终目标是为用户提供最有价值的信息, 我们希望大家有一个最低限度的判断,那就是将自己作为一个普通的用户,通过搜索引擎搜索到自己的网站时,自己相不相信自己网站上的信息,自己觉不觉得这是 互联网上最好的信息。

我们通过反馈渠道收集到声称自己网站是原创、高质量网站的反馈,其中80%多都是无效的,甚至大量声称老中医3-5天治愈绝症的网站,通篇内容读不通,声称自己是高质量的网站。

如果互联网非常纯洁,那我们也不会花费大量人力去识别网站的质量,也就不会有误伤。 但互联网越来越不保险,我们的策略也越来越复杂,只要对技术有一定了解的人,都应该知道误伤是无法避免的,我们也尽最大的努力将误伤降到最低限度。

我不知道你的网站是不是真的非常高质量,如果确认,可以通过上面几帖提到的反馈途径反馈给我们来追查一下。

问题13.虽然百度的官方不承认有降权蜘蛛的说法,但是例如:123.125.*段的蜘蛛出现,网站在排名、收录上快照、都会存在异常,是否可以理解为这段IP的蜘蛛虽然不是降权蜘蛛,但可以认为是自身网站出现了问题,百度对于网站的考察和警示呢?是百度对网站所提出的警告呢?

Lee:Baiduspider只有一种,不存在什么降权蜘蛛。 不过你所提到的对网站的警示,我们会在站长平台中考虑。

举报

  • 相关推荐
  • 我国首个政务大模型安全国家标准发布 百度深度参与制定

    日前,我国首个针对政务大模型的安全国家标准《政务大模型应用安全规范》(下称《规范》)正式发布。百度作为核心参编单位,凭借其在人工智能安全及政务服务领域的深厚积累,深度参与了该标准的制定工作,为政务大模型的安全选用、部署运行、护栏建设和合规落地提供了专业支持。《规范》由国家工业信息安全发展研究中心牵头,联合百度等国内领先企业共同制定�

  • AI排名监控工具实战指南:如何用GEO排名查询提升品牌AI搜索可见度

    随着ChatGPT等AI搜索引擎普及,传统SEO正经历深刻变革。文章指出,超60%用户开始使用AI搜索,而AI直接给出答案而非展示链接,导致品牌面临可见度危机。为此提出GEO(生成引擎优化)概念,强调需通过专业工具监测AI排名,并推荐AIBase平台的多平台覆盖、真实场景模拟和竞品分析功能。最后给出四步优化流程:建立监测基准、分析排名差异、针对性内容优化、持续迭代,帮助品牌在AI时代建立竞争优势。

  • 百度网盘海外版开放手机号注册,AI功能全新升级

    9月22日,百度网盘海外版全面开放海外手机号注册,并针对海外华人、留学生等用户升级AI功能。iOS用户可在当地App Store直接下载,安卓版即将上线Google Play。海外版针对学习、工作、娱乐场景优化,如AI笔记可一键生成英文视频摘要,AI相机支持拍照解题、实时翻译,AI听记可智能总结线上会议,并全面兼容Teams、Zoom等应用。此外还提供数十种AIGC创意视频玩法,深受海外用户欢迎。

  • 2025长春航空展:百度百科与航空科幻IP“南天门计划”达成独家中文百科合作

    9月19日,百度百科与中航环球在2025长春航空展上达成独家合作,重点围绕航空科幻IP“南天门计划”开展内容创作与科普共建。双方将联合打造权威词条、沉浸式视频等多元内容,并推出“筑梦航天+航展见证”科普专题,系统梳理航展亮点。百度百科2025年发力富媒体化建设,优化用户编辑体验,已累计超千万级媒体资源,提升航空知识传播效果。

  • 六项第一!百度文库再获国家工信安全中心认证,持续领跑智能PPT行业

    国家工信安全中心发布《大模型赋能智慧办公评测报告》,对8款主流AI生成PPT产品进行综合评估。百度文库在生成质量、排版美化等六项指标中全部位列第一,持续领跑智能PPT行业。报告显示当前产品已基本满足日常需求,但专业度和时效性仍有提升空间。百度文库依托海量专业文档资源,在产业研究、教育培训等场景表现突出,月活用户超9700万,智能PPT功能月访问量全球第一。

  • GEO排名查询工具推荐:搞定GEO搜索优化,让品牌AI可见度更清晰

    随着AI平台成为用户获取信息的重要入口,品牌在AI推荐中的曝光度直接影响用户触达。文章提出GEO(生成引擎优化)概念,强调其相比传统SEO更关注AI平台的推荐权重。AIBase推出的GEO排名查询工具可帮助品牌方检测在主流AI平台(如豆包、DeepSeek等)的曝光情况,通过选择平台、输入测试问题及品牌关键词,快速获取推荐率、曝光次数等关键指标。该工具适用于品牌营销、SEO优化及研究机构,为提升AI场景品牌可见度提供数据支持。

  • GEO排名查询工具完全指南:AI搜索时代的排名优化实战

    随着ChatGPT等AI搜索引擎崛起,传统SEO正经历革命性变革。GEO应运而生,成为内容创作者必备新技能。AI搜索直接生成答案而非链接列表,这意味着:内容需被AI引用才能获得曝光;排名机制重构,更看重内容权威性和相关性;需同时优化多个AI平台表现。专业GEO工具能批量监控多平台表现,追踪内容在AI中的引用情况,通过历史数据分析排名趋势,帮助制定有效优化策略。

  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

  • 百度智能云Qianfan-VL系列模型开源!全尺寸领域增强效果优异,全自研芯片计算

    百度智能云千帆正式推出全新视觉理解模型Qianfan-VL并全面开源。该系列模型包含3B、8B和70B三个版本,面向企业级多模态应用场景,具备出色的基础通用能力,并针对OCR、教育等高频需求进行专项强化。模型基于昆仑芯P800芯片实现高效计算,支持5000卡并行,在通用和垂直任务评测中达到SOTA水平。Qianfan-VL具备多尺寸模型、思维链推理和OCR增强三大特点,可广泛应用于文档识别、数学解题、图表分析等场景,为企业提供高精度视觉理解解决方案。

  • AI排名查询工具如何助力GEO优化?生成引擎优化中的关键词竞争力分析

    在AI搜索时代,传统SEO正被生成引擎优化(GEO)重塑。内容能否被AI“理解”并引用成为流量关键,而GEO策略需依赖专门的AI排名查询工具。文章指出,AI助手直接生成摘要而非链接列表,评估维度与SEO完全不同,需关注语义相关性、权威性和结构化程度。AIBase平台的GEO排名查询工具能模拟主流AI提问,检测内容曝光频率与上下文位置,支持竞品对比和中文场景优化。优化建议包�

今日大家都在搜的词: