首页 > 业界 > 关键词  > AI内容生成最新资讯  > 正文

互联网已经被 AI 污染的差不多了

2024-09-19 13:53 · 稿源: 硅星人Pro公众号

声明:本文来自于微信公众号 硅星人Pro,作者:周一笑,授权站长之家转载发布。

最近一张用AI批量做号的微信截图流传在各个群里,有人自爆用AI在小红书做了一个庞大的虚假账号矩阵,通过售卖账号进行变现。

图片

这并非个例,你有没有一种感觉,现在刷手机的时候越来越分不清真实和虚拟了?当你浏览社交媒体、搜索信息或阅读文章和观看视频时,你真的能分辨出哪些内容来自人类,哪些又是AI的产物?更令人不安的是,你如何确定你所看到的“事实”不是AI的幻觉?

AIGC是一场互联网革命,不幸的是,它的兴起也伴随着内容滥用。大量低质量、AI生成的关键词堆砌的内容倾泻到网络上,充斥在搜索引擎的结果当中,互联网上很大一部分内容已沦为垃圾信息。

小红书上的“细糠”可能是AI生成的,音乐平台则充斥着AI生成的歌曲,Spotify上的AI翻唱乐队,把流行歌曲的翻唱添加到正常歌单当中,与真实艺术家演唱的歌曲一起播放,获得了数百万的播放量并获得版税。最近,美国北卡罗来纳州一名男子被捕,他用AI制作了数十万首歌曲,并通过AI机器人刷播放量,获利超过 1000 万美元。

连你在亚马逊上买的电子书可能也是AI写的。一本使用ChatGPT撰写的关于野生蘑菇烹饪的电子书,甚至建议读者用舌头去尝一尝的方式来识别蘑菇种类。

最悲哀的是,这些垃圾书实际上也赚不了多少钱,赚钱的是教学生制作垃圾电子书的教程,这完全是一场骗局和垃圾的闭环,而受害者是热爱阅读和写作的读者与作者。

图片

亚马逊上出现了大量AI生成的垃圾书籍

1

内容农场从未如此容易

“内容农场”是指为了牟取广告费等商业利益或出于控制舆论、带风向等特殊目的,快速生产大量网络文章来吸引流量。让用户在寻找有用信息时不得不耗费更多时间和精力。为了吸引眼球,一些账号甚至故意发布虚假信息或夸大事实,诱导用户点击。

发布“西安突发爆炸”虚假新闻的账号所属机构,最高峰一天能生成 4000 至 7000 篇假新闻,每天收入在 1 万元以上,而公司实际控制人王某某经营着 5 家这样的机构,运营账号达 842 个。

以前的内容农场借助廉价劳动力,批量产出文章,比如此前的山东“新媒体村”以及北马其顿共和国的假新闻影响美国大选等案例。现在,内容农场也正式从手工作坊进入了AI时代。

AI工具使得内容生成成本大大降低,单次浏览的收入即可覆盖成本。根据IT技术博主阮一峰的计算,使用某国产AI模型生成一篇文章仅需0. 00138 元,而单次浏览的广告收入约为0. 00145 元,这种模式使得内容农场比以往更容易盈利。

“内容农场从来没有这么容易过,我先买一个热搜数据库,然后花费 100 多元,就能生成 10 万篇文章,最后加入广告,做好SEO,网站上线,等着用户点进来就行了。不难想象,资讯类网站未来大概都是这个模式。真人生产内容,成本太高,无法与AI内容抗衡,注定只能是小众网站。”

除了内容农场,一些平台也在利用AI进行SEO,把自己打造成为“内容农场”。

豆包此前为了在搜索引擎里权重更高,将用户和AI的聊天页面生成静态网页,然后被搜索引擎抓取,给自己引流。开发者社区稀土掘金也同样通过AI批量生成大量内容被谷歌抓取,这些内容缺乏实质价值,引发用户广泛批评。

图片

虽然目前豆包和稀土掘金都已经移除相关内容,但中文云计算网站和开发者社区仍然是内容农场的重灾区。

AI搜索引擎Perplexity通过对搜索结果添加脚注,链接到互联网的实时信息源来确保结果的准确性,PerplexityCEO也对外声称“引用来源是我们的通行证”。

但根据AI内容检测平台 GPTZero 在今年 6 月进行的一项研究,Perplexity用户平均搜索三个关键词,就会遇到AI生成的内容。像“日本京都的文化节”、“人工智能对医疗行业的影响”、“泰国曼谷必尝街头美食”以及“值得关注的年轻网球选手”等搜索,返回的结果中包含了引用AI生成材料的答案。

这项研究揭示了Perplexity这样的AI搜索产品在提供优质来源方面的一个缺陷,也反映出互联网正日益充斥着AI生成的内容。

图片
关键词“日本京都的文化节庆”,唯一引用来源是一篇完全由AI生成的文章

Perplexity还推出了Pages的功能,使用者可以把搜索与生成的内容制作成公开页面,而且搜寻引擎也能收录。后续也传出一些神奇用法,例如假装询问AI关于自家产品的内容,然后利用Perplexity Page帮自己的产品做一个页面,最后被搜索引擎收录,达到引流的目的。根据aHrefs的数据,Perplexity每月有 240 万访客来自谷歌。

360AI搜索也曾经透露,在晚上会借助算力资源使用AI生成答案,每天产生数百万的网页供应给搜索引擎。

1

从“内容社区”到“内容坟场”

内容社区也是AI入侵的“重灾区”,Quora曾经是社区氛围良好的问答社区,有评论形容其为“更有条理的Yahoo Answers,更古典的Reddit,更主观的维基百科”。而如今的Quora却成为了一个信息垃圾场,充斥着无意义的AI生成的内容,以及一大堆答非所问的内容。

一开始一些用户使用ChatGPT生成答案,然后秒成Quora的“专家”,后来Quora直接在页面上集成了ChatGPT生成的答案,而这些错误的答案又传播到了谷歌的搜索结果中。

图片
图片
“鸡蛋可以被融化,常见的方法是用炉子或微波炉加热”

一位 2013 年就开始使用Quora的用户评论道:“最终,Quora将充斥着机器的提问、机器的回答,别无其他。”

开发者也在借助AI SEO获取流量,Eightify.app和Glarity.app是两个Youtube 视频总结插件,通过AI技术批量生成图文并茂的文章,在短时间内获得了巨大的流量增长。Eightify.app自 2022 年 8 月开始运营,其月访问量从几十万迅速攀升,于 2023 年 1 月达到峰值 600 多万。紧随其后的Glarity.app也在 2023 年 2 月采用类似策略,月访问量从 1 月份的 10 万激增至 3 月份的 1200 多万。

SEO行业从业者哥飞告诉硅星人,搜索引擎也好,内容平台也好,他们不是要干掉AI生成的内容,而是要干掉低质量内容。这些AI生成内容能通过谷歌算法审核,表明其质量达到了一定水准,但由于流量增长过快,Eightify.app和Glarity.app引起了全球SEO从业者的关注。“如果不干掉,那么就可以认为谷歌默许这样做,大家就会跟风这样做。”

谷歌最终采取了人工干预措施。要求这两家网站停止批量生成内容的行为,并删除此前生成的相关内容。最新数据显示,干预措施生效后,Eightify.app的月访问量已降至 60 万,而Glarity.app更是锐减至 20 多万。

SEO污染这样的事情其实一直存在,以前没有AI,也有各种小偷爬虫、伪原创工具,只不过随着AI的发展,这场“猫鼠游戏”似乎对于平台来说越来越难了。

一个有趣的例子是IsaacJinyu在知乎的一次AI卧底实验,他通过知乎问答数据反向生成AI数据,然后微调Qwen2-7B,去除文字中的AI味。这个实验从 7 月 5 日开始,到 8 月 3 日整整一个月,没有任何人发现账号AI的身份。

图片
图片

1

学术圈也被AI攻陷

日益增多的AI生成内容其影响远不止于屏幕,这种潜移默化的侵入正悄然影响学术领域。

进年初,西安交大一篇论文因为使用AI生成的配图而被撤稿,相关图片中,大鼠长出了诡异的器官,细胞信号传导图像电路板。

图片

在另一篇论文的一张配图中,小腿和手臂的骨骼数量出现了明显的错误。

图片

这只是AI渗透学术领域的冰山一角,在谷歌学术上搜索“截至我上次知识更新”(as of my last knowledge update)或“我没有访问实时数据的权限”(I don't have access to real time data),会出现大量借助AI生成的论文。

图片

学者们在压力之下需在期刊上发表论文,选择了使用AI,而学生在AI的帮助下完成作业和论文已经成为一种常态,“人工代写”论文变成了“人工智能”代写。

1

AI训练的恶性循环

AI模型的准确性在很大程度上取决于其训练数据的质量。“垃圾进,垃圾出”这一短语起源于计算机科学的早期。尤其对于数据分析和AI而言,这一原则强调了一个基本观念:输出质量与输入质量紧密相关。

AI生成的内容激增,但这些内容并非凭空而来,而是基于大量人类创造数据的训练。但在这个过程中存在一个潜在的缺陷,随着这些AI生成的内容重新流入互联网,最终又成为训练未来AI模型的一部分数据。正如用牛喂养牛导致了疯牛病一样,用大量由AI创建的数据来训练AI同样具有破坏性。这是一个自我消耗的过程,导致输出质量越来越低。

图片

谷歌在Google I/O2024 大会上演示了AI简要概括某人未读的邮件,随后演示了生成新邮件以供回复的功能。不难推断,收件人将利用AI来阅读这些邮件,并生成新的AI回复,让其他人也用AI阅读。这类功能普及之后,每个人的收件箱是否会充斥着没有人真正会去阅读或撰写的邮件?

AI能制作的又何止是邮件?AI为无人阅读的AI帖子撰写无人阅读的AI评论,生成无人聆听的包含AI歌曲的歌单,还能为无人访问的网站创作无人观赏的AI图像。

图片
AI生成的《Nothing, Forever》在一个无人观看的Twitch直播间 24 小时不间断地播放着。

AI出现之前互联网就充满垃圾,只是有了AI之后,生产垃圾的效率更高了,制造的垃圾产量庞大,而我们在处理这些垃圾的能力上显然是不够的。或许在不久的将来,互联网上的合成图像将比真实图像更多,合成网站将超过真实网站,AI生成的文本也将多于真实文本:由机器产生的无尽内容,堵塞了一切,浪费每个人的时间。

图片
AI图片污染互联网图片库

神话中的衔尾蛇(Ouroboros)吞食自己的尾巴,象征着无节制增长与自我消耗的陷阱,其圆形形态也象征着无限和生命的循环。在现在的故事中,这条蛇代表着AI的世界,而它的尾巴则是源源不断的AI生成的内容。这个循环就在我们眼前发生着,也许在这条蛇还没有完全长大前,我们还有机会救互联网一把。

举报

  • 相关推荐
  • 大家在看
  • Ausha Intelligence:AI助力播客内容优化与搜索可见性提升

    Ausha Intelligence是Ausha推出的一款AI工具,旨在帮助播客制作者快速生成优化的内容,显著提高在播客应用中的可见性。它通过一键操作,可以生成全面的标题、吸引人的描述、结构化的章节、相关的标签、社交媒体帖子和新闻稿,从而增强播客的可发现性,并确保一致且有效的营销策略。Ausha Intelligence通过集成到平台中,提供了清晰、用户友好、流畅的体验。它不仅实用,还经过了播客营销策略的训练,能够推广节目、简化营销工作流程,并提高节目的可见性。Ausha Intelligence保证了无与伦比的内容质量。

  • ChatPPT:一键开启AI,免费解析PPT,与PPT畅所欲言。

    ChatPPT是一个利用人工智能技术,帮助用户一键分析PPT并生成对话总结的工具。它通过AI技术简化了PPT内容的理解和交流,使得用户能够更高效地处理演示文稿。该产品的主要优点是能够快速提取PPT中的关键信息,并通过对话形式呈现,使得内容更加通俗易懂。ChatPPT适合需要频繁处理PPT文件的商务人士和教育工作者,它能够显著提高工作效率和学习效率。

  • AI句子生成器:利用AI技术生成高质量句子的在线工具

    AI句子生成器是一个基于人工智能技术的在线工具,它能够根据用户提供的主题和类型生成连贯且上下文相关的句子。这项技术对于作家、学生和任何希望提高写作技能的人都非常有价值。它通过复杂的自然语言处理技术和机器学习模型,确保每个生成的句子都是定制化的,以满足用户的需求。AI句子生成器的主要优点包括简化写作过程、节省时间、激发创造力,并帮助用户生成多样化的句子结构和语调,提高整体写作风格。

  • AI Name Generators:AI驱动的名字生成工具,快速生成各种创意名称。

    AI Name Generators是一款利用人工智能技术自动生成各种类型名称的工具。用户只需输入一些基本信息或选择特定类别,如船名、日本名、游戏名等,系统将根据输入的标准生成一系列独特且富有创意的名字。该工具特别适合需要命名的场合,比如游戏开发者、作家和企业主,因为它节省时间并提供灵感,帮助他们找到最合适的名字。

  • HeadshotAI:AI驱动的头像生成器,在家即可制作专业级头像。

    HeadshotAI是一个利用人工智能技术生成逼真头像的平台,它使用先进的算法分析上传的照片,生成具有专业摄影效果的头像。这项技术的重要性在于,它让个人能够以更低的成本和更便捷的方式,获得高质量的头像,从而提升个人品牌和职业形象。HeadshotAI的主要优点包括无与伦比的真实感、轻松定制、快速生成、价格亲民以及无缝集成。

  • IconGen.io:AI驱动的图标生成器,快速创建精美图标。

    IconGen.io是一个由AI驱动的图标生成器,用户可以通过它快速创建适用于商业、演示文稿等场合的精美图标。该工具利用人工智能技术,简化了图标设计流程,使得即使是没有设计背景的用户也能轻松创建出专业的图标。IconGen.io的主要优点包括快速生成、易于使用、设计多样化,适合需要提升品牌形象的用户。

  • gptme:终端中的个人AI助手,具备本地工具。

    gptme是一个运行在终端的个人AI助手,它装备了本地工具,可以编写代码、使用终端、浏览网页、视觉识别等。它是一个不受软件、互联网访问、超时或隐私问题限制的ChatGPT“代码解释器”的本地替代方案。

  • Reverb:开源的语音识别和说话人分割模型推理代码

    Reverb 是一个开源的语音识别和说话人分割模型推理代码,使用 WeNet 框架进行语音识别 (ASR) 和 Pyannote 框架进行说话人分割。它提供了详细的模型描述,并允许用户从 Hugging Face 下载模型。Reverb 旨在为开发者和研究人员提供高质量的语音识别和说话人分割工具,以支持各种语音处理任务。

  • Voice-Pro:AI语音转录、翻译和TTS的Gradio Web-UI

    Voice-Pro是一个集成的字幕、翻译和文本到语音(TTS)解决方案。它支持将视频添加多语言字幕和多语言音频,助力视频内容扩展到全球市场。该产品使用OpenAI Whisper和开源翻译器及TTS技术,提供一键安装和便携式使用。它还配备了Vocal Remover,使用UVR5和Meta的Demucs引擎,以提高语音识别的准确性。

  • firecrawl-openai-realtime:集成Firecrawl的OpenAI实时API控制台

    firecrawl-openai-realtime是一个集成了Firecrawl的OpenAI实时API控制台,旨在为开发者提供一个交互式的API参考和检查器。它包括两个实用库,openai/openai-realtime-api-beta作为参考客户端(适用于浏览器和Node.js),以及/src/lib/wavtools,后者允许在浏览器中简单管理音频。该产品是使用create-react-app创建的React项目,并通过Webpack打包。

  • DepthFlow:2.5D视差效果视频制作工具

    DepthFlow是一个高度可定制的视差着色器,用于动画化您的图像。它是一个免费且开源的ImmersityAI替代品,能够将图像转换成具有2.5D视差效果的视频。该工具拥有快速的渲染能力,支持多种后处理效果,如晕影、景深、镜头畸变等。它支持多种参数调整,能够创建灵活的运动效果,并且内置了多种预设动画。此外,它还支持视频编码导出,包括H264、HEVC、AV1等格式,并且提供了无需水印的用户体验。

  • Arc Search for Android:现代、支持人工智能的移动浏览器

    Arc Search 是一款现代、支持人工智能的移动浏览器,专注于让用户更快地找到答案,而不会受到互联网的干扰。它通过智能搜索技术,帮助用户过滤掉不必要的信息,直接定位到他们需要的答案,从而提高搜索效率。

  • Depth Pro:高精度单目深度估计模型

    Depth Pro是一个用于单目深度估计的研究项目,它能够快速生成高精度的深度图。该模型利用多尺度视觉变换器进行密集预测,并结合真实与合成数据集进行训练,以实现高准确度和细节捕捉。它在标准GPU上生成2.25百万像素深度图仅需0.3秒,具有速度快、精度高的特点,对于机器视觉和增强现实等领域具有重要意义。

  • o1:使用Groq或OpenAI或Ollama创建类推理链

    o1是一个实验性的项目,旨在通过使用大型语言模型(LLM)来创建推理链,帮助模型解决通常难以处理的逻辑问题。它支持Groq、OpenAI和Ollama后端,通过动态推理链让模型能够“思考”并解决问题。o1展示了仅通过提示就能显著提高现有模型的逻辑推理能力,而无需额外训练。

  • Minionverse:一个受启发的创意工作流

    Minionverse是一个基于AI的创意工作流,它通过使用不同的节点和模型来生成图像。这个工作流的灵感来自于一个在线的glif应用,并且提供了一个视频教程来指导用户如何使用。它包含了多种自定义节点,能够进行文本替换、条件加载、图像保存等操作,非常适合需要进行图像生成和编辑的用户。

  • Rev AI:世界最精确的AI语音转录服务

    Rev AI提供高精度的语音转录服务,支持58种以上语言,能够将视频和语音应用中的语音转换为文本。它通过使用世界上最多样化的声音集合进行训练,为视频和语音应用设定了准确性标准。Rev AI还提供实时流媒体转录、人类转录、语言识别、情感分析、主题提取、总结和翻译等服务。Rev AI的技术优势在于低词错误率、对性别和种族口音的最小偏见、支持更多语言以及提供最易读的转录文本。此外,它还符合世界顶级的安全标准,包括SOC II、HIPAA、GDPR和PCI合规性。

  • RobotFingerPrint:统一的多机械手抓取坐标空间

    RobotFingerPrint是一种用于多种机械手抓取合成的统一坐标空间的创新表示方法。它使用经度和纬度作为坐标,在三维空间中形成一个球体的二维表面,所有机械手共享此坐标空间。该技术通过将机械手的掌心表面映射到统一的坐标空间,并设计条件变分自编码器来预测给定输入对象的统一坐标,从而建立机械手与对象之间的对应关系,用于优化问题以解决抓取姿态和手指关节。该技术能显著提高多种机械手抓取合成的成功率和多样性。

  • Flex3D:从单张图片或文本提示生成高质量3D资产

    Flex3D是一个两阶段流程,能够从单张图片或文本提示生成高质量的3D资产。该技术代表了3D重建领域的最新进展,可以显著提高3D内容的生成效率和质量。Flex3D的开发得到了Meta的支持,并且团队成员在3D重建和计算机视觉领域有着深厚的背景。

  • Helpful DoggyBot:四足机器人室内移动操作系统

    Helpful DoggyBot是一个四足机器人室内移动操作系统,它通过前端夹持装置进行物体操作,使用在模拟环境中训练的低级控制器实现敏捷技能,如攀爬和全身倾斜。此外,它还结合了预训练的视觉-语言模型(VLMs)进行语义理解和命令生成。该系统在没有实际数据收集或训练的情况下,能在未见过的环境中零样本泛化完成任务,如按照用户的指令在攀爬过后的床边取回随机放置的玩具,成功率达到60%。

  • Paper Central:一站式搜索开源成果的平台

    Paper Central 是 Hugging Face 推出的一个全面、便捷的学术平台,它将arXiv、Hugging Face 论文页、模型、数据集、Space、GitHub 和会议论文集等多个来源的开源学术资源整合在一起,帮助研究人员和开发者快速获取并使用开源资源。

今日大家都在搜的词: