首页 > 业界 > 关键词  > 谷歌搜索最新资讯  > 正文

谷歌搜索2021 Webspam报告:过滤垃圾网站数量是2020年的六倍

2022-04-22 10:00 · 稿源: cnbeta

由周四发布的“网络垃圾”(Webspam)报告可知,谷歌搜索在 2021 年过滤的垃圾网站数量、竟是 2020 年的六倍。据悉,作为 Alphabet 旗下子公司,Google 有一套名为 SpamBrian 的人工智能垃圾过滤系统,并且可在超过 99% 情况下实现“不受垃圾所困扰”(spam-free)的搜索体验。

1.png

(来自:Google Search Central Blog)

此前,SpamBrain 已被这家搜索巨头用于防止用户点击那些可能被注入了恶意软件的有害网站、或旨在诱骗人们泄露个人信息 / 汇款的诈骗站点。

Google 表示,鉴于垃圾信息散播者在持续不断地找到绕过过滤机制的方法,基于人工智能的筛查系统也是相当必要的。

需要指出的是,搜索是 Google 的重要收入来源之一。而高质量和安全的网站搜索结果,也对该公司来说至关重要。

经过多年摸索,垃圾网站制作方早已精通搜索引擎优化(SEO)技术,来人为地提升其搜索排名。

作为应对,Google 也迫切需要排除掉那些利用欺诈算法的垃圾网站。

截至目前,Google 已借助 SpamBrain 将垃圾站点砍掉 70%,其中包括被黑客入侵并植入有害代码的感染站点。若被其得逞,受害者将被窃取登录凭据等机密信息。

其它类型的垃圾站点,还涉及将恶意软件注入受害者的计算机、或诱导重定向至恶意站点。庆幸的是,Google 声称 SpamBrain 能够将这类害群之马排除在搜索结果之外。

2.png

Google 政策沟通经理 Ned Adriance 在一封电子邮件中提到:

欺诈者经常拙劣地模仿其它网站,常见套路是填充替换关键词、假借品牌徽标、并附上想要引诱受害者拨打的电话号码。

而 Google 的 SpamBrain 算法方案,能够基本上确保此类欺诈型站点出现在相关搜索结果页面中,且过滤了 75% 的乱码垃圾站点。

这些垃圾站点往往在一堆无意义的文本中填充大量关键词,以试图提升其搜索排名。有时甚至会砸钱挂上垃圾链接,来诱骗搜索引擎的爬虫和抬升 PageRank 品质评分。

对于用户来说,时间总是相当宝贵的。而 Google 的各种解决方案,就希望为用户带来更好的内容检索体验。

【背景资料】

Google 于 2018 年推出的 SpamBrain 系统,且与近 20 年前刚开始治理恶意网站时相比,去年搜索过滤的垃圾站点数量已暴增 200 倍。

即便如此,这场“道高一尺魔高一丈”的垃圾信息攻防战,显然不会轻易完结。

举报

  • 相关推荐
  • 大家在看
  • 谷歌2024I/O大会: AI 搜索“AI Overviews”发布

    在今日举行的谷歌2024年I/O开发者大会上,谷歌公司正式推出了其全新搜索体验——“AIOverviews”,这标志着谷歌搜索引擎问世25年来的又一次重大更新。该体验将于本周首先在美国地区上线,随后将逐步推广至全球更多国家和地区。作为谷歌搜索引擎25年来的最大更新之一,“AIOverviews”无疑将引领搜索领域进入一个新的纪元。

  • 2024年国内免费在线AI创作小说网站推荐

    随着人工智能技术的飞速发展,AI创作小说网站如雨后春笋般涌现,为广大文学爱好者提供了一个全新的创作平台。这些平台利用先进的AI算法,帮助作者激发灵感,生成创意,甚至完成整部小说的创作。在2024年,国内涌现出许多优秀的免费在线AI创作小说网站,本文将为您推荐几个值得一试的平台。1. 笔神AI创作笔神AI创作是一个集创意激发、故事生成、角色构建于一体的综合

  • 换个角度,静享通透 森海塞尔HD 620S亮相2024 CanJam上海展

    上海——2024年6月8日——森海塞尔在2024CanJam上海展宣布旗下高保真耳机系列产品的全新成员——HD620S正式上市。HD620S采用封闭式设计,专为追求聆听体验不受干扰的音频爱好者设计,同时具有自然、通透和细腻的声音表现,重新定义了封闭式耳机的聆听体验,堪称一款里程碑式的创新产品。总部位于瑞士的索诺瓦集团是全球领先的创新听力保健解决方案供应商,在全球范围内拥有17,000名员工。

  • 2024过半,AI卷到哪儿了?

    AI创业者陈冉,发现行业里有一些“怪现象”。很多客户向他反馈,自己很困惑。*应受访者要求,李友峰为化名。

  • 2024数据标注公司20强排行榜(附榜单)

    德本咨询发布“2024数据标注公司排行”。数据标注行业作为人工智能领域的重要组成部分,其需求正在不断增长。云测数据认为,当前大模型算法技术的突破对人工智能行业化落地产生革新,对应处理数据类型更加丰富,云测数据发布的面向垂直行业的大模型数据解决方案,可以帮助垂直行业企业可以更好的落地大模型相关算法应用,成就AI企业数据核心壁垒;海天瑞声认为,当大模型向多模态能力维度拓展时,高质量多模态训练数据集的持续学习训练的重要性将更加凸显,为了满足这一需求,海天瑞声将继续加强在多模态数据集方面的研发和生产能力,提供更加丰富、高质量的多模态训练数据集。

  • 月狐数据发布:2024生成式AI使用趋势报告

    生成式AI技术及产品发展概况人工智能技术奇点降临,搜索成为大模型技术落地的“首站”●过去几十年,人工智能长期鲜有突破性的发展,直至2022年AI大模型技术奇点的出现,使得AI能力发生了颠覆性的变化,人工智能受到了前所未有的关注,用户对大模型技术的兴趣度不断提升。如今AI大模型已进入了企业全面竞争和应用规模化推广的关键时期,各大互联网巨头抢先布局AI产品与生成式AI天然契合的搜索成为了大模型技术最先落地的应用场景●如海外搜索巨头谷歌和微软必应就在今年年初推出基于大模型的AI对话产品,与自身搜索生态融合;国内百度率先通过大模型,对搜索进行重构生成式AI产品普及情况用户渴望拥抱AI但无处可及,需市场推出更多「接地气」的生成式AI产品●用户普遍对于基于大模型技术的AI产品表现出较高的使用兴趣度,但实际生活中有使用AI产品的用户比例仍相对较低,难找到入口、入门流程繁琐、学习成本高是主要的阻碍,反映用户迫切需要企业推出更多使用门槛低、便捷易用的AI产品用户对生成式AI的使用场景需求用户眼中的生成式AI产品:不止是提升效率的工具,更是BUFF叠满的「全能搭子」●见证了AI大模型技术的“神奇魔力”,用户对生成式AI产品的功能和使用场景需求也有了较大的升级,更多用户把生成式AI产品定位为生活管家助手和能聊天交互的亲密伙伴;此外,随着移动互联网的应用场景不断丰富化,用户对于能在泛生活、泛娱乐场景上提供帮助的AI产品表现出了较高的需求度,其中大多数用户最希望AI产品能在日常生活中充当他们的“最强大脑”,能根据用户的问题快速、精准地提供所需的答案和信息用户对生成式AI的使用场景需求用户期望在高频刚需的应用中使用生成式AI功能,AI×搜索存在最广泛的需求综合来看,用户对于搜索应用软件接入生成式AI功能的需求度最高,其次是生活服务、输入法等应用,高频刚需的平台是用户使用生成式AI功能的最重要、最直接的入口;此外,用户对办公商务、教育学习、自媒体等应用接入生成式AI功能的需求度也较高,涉及专业问题解决能力的平台也与生成式AI具备较高的契合度用户对生成式AI的使用场景需求无处不在、全场景覆盖、高度拟人、强创造力等「多边能力」是驱动用户使用生成式AI产品的重要因素调研发现,超85%用户希望能在日常使用较多的应用以及通过多终端设备调用生成式AI功能,80%的用户希望AI产品能够解决生活专业领域问题,75%的用户希望AI产品具备较高的内容创造力,包括生成多种形态、强实时性、创新性、贴合用户个性的内容能力等,70%的用户希望AI产品具备高度拟人化特征,包括支持多形态、多语种对话、提供情感陪伴等互联网巨头生成式AI产品/能力对比各大互联网企业积极搭建AI产品和能力矩阵,百度系AI「使用便捷度」「场景满足度」「拟人化程度」「内容创造力」各项能力相对突出典型企业案例分析百度借移动生态大模型技术落地的完备实力在生成式AI赛道中跑出,引领用户「获取-交互-生产」全场景体验变革典型企业案例分析百度AI产品构建「一站式」「搜创一体」「随身智能」的AI产品矩阵百度系AI产品历经多次迭代,逐渐成为从日常生活到专业领域的全能助手,在生活场景上是能够满足“聊天”“亲子”等娱乐家庭场景需要、提供实时陪伴的亲密伙伴,以更加简短的体验链路为用户提供AI能力;在办公场景上提供“AI办公”“AI兼职赚钱”的一系列能力;在创作场景上,用户可实现绘本、漫画、祝福语等高频刚需的AI生成能力,百度系的AI产品应用矩阵逐渐在场景上实现有效落地典型企业案例分析百度以AI能力赋能搜索,在搜索领域形成智能创作领先优势,为AI搜索概念渗透提供加速度综合国内互联网搜索行业市场占有率在5%以上的主要参与者,我们将各家搜索厂商提供的产品功能进行横向对比,发现百度搜索在智能化方向上形成领跑优势,结合百度搜索的国内市场占有率优势,未来AI能力优势×市占优势或将产生共振,推动AI搜索开启高速增长期典型企业案例分析百度搜索XAI,搜创一体、数字分身大幅度降低AI使用门槛,覆盖用户创作学习场景,极大提升AI技术的传播速度典型企业案例分析百度文库:打通办公学习、家庭教育、兼职赚钱三大场景上的全链路环节,成为一站式AI内容获取与创作平台百度文库正在基于文库本身海量的垂直知识优势,向内容创作全价值链的上下游抢占用户心智,以专业内容获取、跨模态内容生成、自由创作三大优势能力,逐步形成内容创作的“一站式”AI平台典型企业案例分析文心一言APP:从简单问答工具升级为随身全能助手,全面覆盖用户生活和工作场景,兼顾“有用”“有趣”完整体验文心一言APP当前已向智能贴身助手方向持续迭代升级,主打兼具“有求必应”和“专业精深”的助手能力,从用户最为贴近的生活、工作场景出发构建AI能力;当前,文心一言APP月活超过千万,聚集了一批年轻、高线的活跃用户典型企业案例分析百度输入法:AI大模型重构产品体验,打造全场景AI创作助手「超会写」,由“输入工具”转型为“AI创作工具”百度输入法借助文心大模型完成重构,推出的「超会写]功能可以辅助用户在全场景、全平台进行内容创作,拓宽了输入法的能力边界,帮助用户提升沟通、创作的质量和效率,真正实现了“人机共创”。任何未经授权使用本报告的相关商业行为都将违反《中华人民共和国著作权法》和其他法律法规的规定。

  • 七匹狼属于什么档次的品牌?2024-2025春夏新品发布,再掀视觉与时尚盛宴

    2024年4月13日,中国男装领导品牌七匹狼于上海东方绿舟盛大举办“七匹狼航母大秀暨2024-2025春夏新品发布会”。七匹狼品牌大使魏哲鸣、新生代演员娜然、王子奇以及时尚大咖gogoboi宇博齐聚一堂,共同见证了一场精彩纷呈的发布会。该系列以航海科技为灵感,融合了功能性与时尚性,为消费者提供了更多高品质、高性能的穿着选择,传递出品牌对于未来市场的信心和期待。

  • SPARK2024腾讯游戏发布会举办 游戏科技项目”数字中轴·小宇宙“7月上线

    5月28日,SPARK2024腾讯游戏发布会在线上举行。在“游戏科技应用”篇章,腾讯游戏分享了“数字中轴·小宇宙”“数字藏经洞”“全动飞行模拟机视景系统”“全变源追踪猎人星座计划”四个项目的最新进展,展现了生发于游戏的游戏科技,在“数字文保”、“民用航空”、“前沿探索”等多个社会生产生活领域的应用价值和最新成果。腾讯游戏将立足更广泛的需求,打造更丰富、更创新的虚拟世界和游戏体验,并在此基础上,持续推动游戏科技的应用拓宽,打造更具想象力的“超级数字场景”。

  • 《歌手2024》演出结束后 那英:我下班了

    在《歌手2024》舞台上,那英登台演唱《挣脱》,表演结束那英下台直呼:我下班啦,我下班啦。这期节目是《歌手2024》的第二场直播竞演,此前在第一期直播中,那英凭借自己的经典曲目《默》拿到第三名的成绩。《歌手2024》采用现场直播的方式进行竞演,为比赛增加了难度与不确定性,对所有参赛歌手无疑是一个巨大的挑战,这也是该档节目备受关注的原因之一。

  • Partnerplace:合作伙伴管理工具,提升合作效率。

    Partnerplace是一款专为合作伙伴关系管理设计的在线工具,它通过自动化繁琐的任务,如佣金处理,帮助企业高效管理和发展合作伙伴网络。该工具支持定制化合作伙伴计划,实现品牌专业体验,并通过集中化平台提高工作效率。Partnerplace的价值观包括弹性、参与度和连接性,旨在为用户提供一个完全定制化的、参与性强的、连接销售团队和CRM系统的合作伙伴管理系统。

  • Depth Anything V2:先进的单目深度估计模型

    Depth Anything V2 是一个经过改进的单目深度估计模型,它通过使用合成图像和大量未标记的真实图像进行训练,提供了比前一版本更精细、更鲁棒的深度预测。该模型在效率和准确性方面都有显著提升,速度比基于Stable Diffusion的最新模型快10倍以上。

  • OTTO SEO by Search Atlas:革命性的AI SEO工具,简化SEO工作流程。

    OTTO SEO是Search Atlas推出的一款AI驱动的SEO工具,旨在通过自动化技术优化网站,提高SEO效率。它通过添加OTTO像素到网站,能够自动执行网页优化,包括技术修复、内容优化、反向链接建设和内容创作。OTTO SEO的主要优点在于节省时间、提高效率,并帮助营销团队或代理公司实现SEO策略的自动化和优化。

  • AI drafts by Help Scout:提升客服团队效率,实现个性化客户服务。

    Help Scout提供的AI客服平台,通过人工智能技术,帮助客服团队提升工作效率,减少重复性工作,让团队成员能够专注于更复杂和个性化的客户对话。平台特点包括无需编程即可使用、快速回复、提升客户满意度,以及通过AI生成回复草稿等。

  • OpenVLA:开源视觉-语言-动作模型,推动机器人操作技术发展。

    OpenVLA是一个具有7亿参数的开源视觉-语言-动作(VLA)模型,通过在Open X-Embodiment数据集上的970k机器人剧集进行预训练。该模型在通用机器人操作策略上设定了新的行业标准,支持开箱即用控制多个机器人,并且可以通过参数高效的微调快速适应新的机器人设置。OpenVLA的检查点和PyTorch训练流程完全开源,模型可以从HuggingFace下载并进行微调。

  • VideoLLaMA 2:视频理解领域的先进空间-时间建模与音频理解模型。

    VideoLLaMA 2 是一个针对视频理解任务优化的大规模语言模型,它通过先进的空间-时间建模和音频理解能力,提升了对视频内容的解析和理解。该模型在多选视频问答和视频字幕生成等任务上展现了卓越的性能。

  • HumanPlus:人类动作模仿与自主技能学习系统

    HumanPlus是一个研究项目,旨在通过模仿人类动作来训练人形机器人,从而实现自主技能学习。该项目通过模拟强化学习训练低级策略,并将这些策略应用到真实世界中,实现实时跟踪人类身体和手部动作。通过影子模仿技术,操作员可以远程操作机器人收集全身数据,用于学习不同任务。此外,通过行为克隆技术,机器人能够模仿人类技能,完成各种任务。

  • Jace:AI助手,助力高效营销与管理。

    Jace是一款商业领域的AI助手,专注于提升营销效率,无需专业技能即可轻松启动和管理营销活动。其主要优点包括创建针对性的营销活动、实时监控性能和随时优化。

  • ARC-AGI:人工智能通用推理测试集

    ARC-AGI是一个旨在测试人工智能系统是否具备类似人类一般流体智力的抽象和推理能力的数据集。它由400个训练任务和400个评估任务组成,每个任务都以JSON格式存储,包括输入输出对。该数据集可以作为人工智能基准测试、程序合成基准测试或心理测量智力测试。

  • PROTEUS:实时表情生成人类模型

    PROTEUS是Apparate Labs推出的一款下一代基础模型,用于实时表情生成人类。它采用先进的transformer架构的潜在扩散模型,创新的潜在空间设计实现了实时效率,并能通过进一步的架构和算法改进,达到每秒100帧以上视频流。PROTEUS旨在提供一种通过语音控制的视觉体现,为人工对话实体提供直观的接口,并且与多种大型语言模型兼容,可定制用于多种不同应用。

  • Warp:AI和协作工具重新定义的终端

    Warp是一款使用Rust语言编写的终端应用程序,它通过集成AI和协作工具,提供了现代化的编辑、命令生成、可复用工作流和知识共享等功能,旨在提升开发者的生产力。Warp的AI功能可以建议正确的命令或解答编程问题,同时保持请求的私密性和安全性。Warp Drive允许用户组织难以记忆的命令,提高个人和团队的效率。此外,Warp还提供了自定义主题和以隐私为设计原则的安全性。

  • TalkWithGemini:一键部署您的私人Gemini应用

    TalkWithGemini 是一款支持一键免费部署的跨平台应用,用户可以通过这个应用与 Gemini 模型进行交互,支持图片识别、语音对话等多模态交互方式,提高工作效率。

  • PowerInfer-2:专为智能手机设计的高效大型语言模型推理框架

    PowerInfer-2是一个为智能手机特别优化的推理框架,支持高达47B参数的MoE模型,实现了每秒11.68个token的推理速度,比其他框架快22倍。它通过异构计算和I/O-Compute流水线技术,显著减少了内存使用,并提高了推理速度。该框架适用于需要在移动设备上部署大型模型的场景,以增强数据隐私和性能。

  • emo-visual-data:表情包视觉标注数据集

    emo-visual-data 是一个公开的表情包视觉标注数据集,它通过使用 glm-4v 和 step-free-api 项目完成的视觉标注,收集了5329个表情包。这个数据集可以用于训练和测试多模态大模型,对于理解图像内容和文本描述之间的关系具有重要意义。

  • E3Gen:高效、表现力强、可编辑的数字头像生成

    E3Gen是一种新型的数字头像生成方法,能够实时生成高保真度的头像,具有详细的衣物褶皱,并支持多种视角和全身姿势的全面控制,以及属性转移和局部编辑。它通过将3D高斯编码到结构化的2D UV空间中,解决了3D高斯与当前生成流程不兼容的问题,并探索了在涉及多个主体的训练中3D高斯的表现力动画。

  • Surface:使用AI提升表单转化率

    Surface是一个基于AI技术的在线表单构建工具,专为营销和需求生成团队、CRO专家以及领英生成团队设计。它提供了一个无代码表单构建器,能够创建与品牌匹配的多步表单,提升转化率并收集部分响应数据。通过AI技术,Surface可以提高潜在客户的筛选过程,确保用户专注于最有希望的潜在客户。此外,它还提供了强大的入站工作流程自动化,以及2000多个集成选项,帮助用户有效地捕获、培养和转化潜在客户。

  • MotionClone:训练无关的运动克隆,实现可控视频生成

    MotionClone是一个训练无关的框架,允许从参考视频进行运动克隆,以控制文本到视频的生成。它利用时间注意力机制在视频反转中表示参考视频中的运动,并引入了主时间注意力引导来减轻注意力权重中噪声或非常微妙运动的影响。此外,为了协助生成模型合成合理的空间关系并增强其提示跟随能力,提出了一种利用参考视频中的前景粗略位置和原始分类器自由引导特征的位置感知语义引导机制。

  • Leonardo Phoenix:创新的AI基础模型,提供卓越的提示遵循能力。

    Leonardo Phoenix是Leonardo AI平台推出的一款基础模型,它在提示遵循、图像生成清晰度和AI研究方面取得了突破性进展。该模型通过架构创新,提供了更高质量的图像生成,特别是在人像、横幅、海报和标志的文本生成方面表现出色。此外,它还增强了创造性控制,允许用户通过提示增强和AI提示编辑来轻松获取和快速修改生成内容。尽管目前一些功能如图像引导、元素和照片写实尚未集成,但预计将在不久的将来加入。

  • Uizard Autodesigner 2.0:AI驱动的UI设计生成器,快速实现设计和原型制作。

    Autodesigner 2.0是Uizard公司推出的最新版AI UI设计生成器,它结合了ChatGPT的对话流和Uizard的生成设计能力以及拖放编辑器,使用户能够仅通过文本提示实时设计和迭代。该产品通过AI技术简化了UI设计流程,提高了设计效率,尤其适合产品经理、设计师、市场营销人员、初创公司创始人和开发者等不同背景的用户。

  • KREA AI Enhancer:视频和图像增强工具,提升画质清晰度。

    KREA AI - Enhancer 是一款在线视频和图像增强工具,利用AI技术提升视频和图像的清晰度和质量。它通过实时处理,帮助用户改善视觉内容,适用于需要高质量视觉素材的专业人士和爱好者。产品背景信息显示,KREA AI - Enhancer 通过AI算法优化,能够在短时间内提供高质量的输出,是内容创作者和编辑者的理想选择。

今日大家都在搜的词:

热文

  • 3 天
  • 7天