首页 > AI头条  > 正文

Reddit起诉Perplexity AI:指控“工业级非法抓取”数百万用户评论

2025-10-23 11:42 · 来源: AIbase基地

据美联社报道,社交媒体平台 Reddit 周三在纽约联邦法院起诉人工智能公司 Perplexity AI 及三家合作实体,指控其通过“工业规模的非法抓取”行为,未经许可复制数百万 Reddit 用户评论以牟取商业利益。

Reddit 在诉讼中称,被告包括总部位于旧金山的 Perplexity AI、立陶宛数据抓取公司 Oxylabs UAB、疑似“前俄罗斯僵尸网络”域名 AWMProxy,以及总部位于美国德州的搜索服务商 SerpApi。Reddit 指控这些公司存在不正当竞争、侵犯版权和不当得利等行为,称他们绕过防护机制,从谷歌搜索结果中抓取 Reddit 内容,并通过代理工具掩盖身份。

reddit,官方logo截图

Reddit 首席法律官 Ben Lee 表示,这些公司“像潜在的银行劫匪”,闯入“装甲卡车”窃取数据,Reddit 之所以成为主要目标,是因为其拥有“全球最大、最活跃的人类对话集合”。他称 Perplexity 选择购买被盗数据,而非通过合法途径获取授权。

Perplexity 回应称尚未收到诉讼,但表示“将积极捍卫公众公平获取知识的权利”,并称公司始终负责任地使用 AI。SerpApi 与 Oxylabs 均否认指控,称将积极应诉,后者强调“公共数据不应被垄断或高价出售”。AWMProxy 尚未回应。

此次诉讼是 Reddit 继6月起诉 Anthropic 后的第二起同类案件。Reddit 此前已与 Google、OpenAI 等公司达成授权协议,允许后者付费使用 Reddit 内容进行 AI 模型训练。业内认为,此案或将成为生成式 AI 数据合规的关键转折点,未来 AI 公司在训练数据来源与版权授权方面将面临更严格审查。

  • 相关推荐
  • GEO如何改变ChatGPT搜索和Perplexity的游戏规则

    本文对比ChatGPT与Perplexity两大AI搜索平台:ChatGPT作为全能型助手,整合搜索与多任务处理,但存在信息时效性不足;Perplexity专注垂直搜索,强调引用透明与权威来源。针对AI搜索优化(GEO),提出差异化策略:面向ChatGPT需构建结构化知识库、强化品牌实体识别;面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具,通过曝光率等指标量化内容在AI生态中的可见度,并给出可落地的优化行动方案。

  • 对话逗逗AI:猛涨千万用户背后,不抢屏幕时间,不做超级app,也不止于游戏了

    ​当你在游戏里卡关半小时,烦躁地想切出去搜攻略;或者在开放世界里孤独“跑图”,无聊到只能听歌的时候,如果这屏幕上突然冒出一个“小可爱”,一边帮你找路,一边陪你吐槽,感觉会如何? 这就是逗逗AI正在做的事。它不是一个需要你切换点开的APP,而是一个以虚拟形象或悬浮球形式,能看到你的游戏界面,听到你的声音,和你随时互动的AI玩伴。 我们来看一个顶

  • 前B站副总裁打造“非共识”AI陪伴,国内拿下千万用户后加速出海

    在今年东京电玩展的现场,我们第一次见到了 AI 陪伴创企心影随形的创始人刘斌新。 面前的刘斌新,像此前媒体同行描述的一样随和、健谈,他曾先后出任过百度副总监、360助理总裁、B 站副总裁,2023年,他选择了自己创业,从熟悉的游戏场景切入做一款 AI 陪伴产品,「逗逗游戏伙伴」由此诞生。 从整个 AI 陪伴品类来看,「逗逗游戏伙伴」是一个很“特别”的存在。不同�

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • 小米推出REDMI显示器A27Q Type-C版2026:899元支持一线通

    小米商城最新上架了一款REDMI显示器A27Q Type-C版2026”,售价899元。 27英寸IPS面板,分辨率25601440(2K),16:9显示比例,静态对比度1300:1,典型亮度300nits,响应时间6ms,支持120Hz高刷新率与178广视角。

  • Qwen登顶AI赚钱大赛只是开始?“弃GPT投Qwen”已在硅谷蔓延开来

    近期AI炒币大赛Alpha Arena引发关注,六款主流大模型用1万美元本金在币圈实战。戏剧性的是,被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重,而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶,DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen,投资人Chamath也承认将业务转向中国模型。市场用真金白银投票:预测平台押注Qwen胜率高达36%,远超OpenAI的3%。这场竞赛虽存随机性,但中国开源阵营已展现强劲势头。

  • 只有0.9B的PaddleOCR-VL,却是现在最强的OCR模型。

    ​这几天,OCR这个词,绝对是整个AI圈最火的词。因为DeepSeek-OCR,甚至让OCR这个赛道文艺复兴,又给直接带火了。 整个Hugging Face的趋势版里,前4有3个OCR,甚至Qwen3-VL-8B也能干OCR的活,说一句全员OCR真的不过分。 然后在我上一篇讲DeepSeek-OCR文章的评论区里,有很多朋友都在把DeepSeek-OCR跟PaddleOCR-VL做对比,也有很多人都在问,能不能再解读一下百度那个OCR模型(也就是PaddleOCR-VL

  • 从方法论到实践:阅文IP工业化,《诡秘之主》再进击

    隐隐若现的神秘古宅,塔罗牌、马车、蒸汽机、钟楼、墓园依次闪过,浓郁的维多利亚风情扑面而来;猩红血月穿透浓雾,低音铜管缓缓奏响,心跳节拍不自觉加快,氛围瞬间拉满;魔药、神祗、邪神各股势力粉墨登场,求生本能、思乡之情和“愚者”的使命感在内心暗暗角力…… “开篇就是高能名场面”、“恭迎愚者”、“太还原了,这就是我梦中的世界”——作为“诡秘IP�

  • 400万月活,2500万用户,1.3亿美元:LiblibAI拿到今年国内AI应用最大一笔钱

    AI应用公司LiblibAI近期完成1.3亿美元B轮融资。从目前公开数据来看,这是国内AI应用公司今年最大的一笔融资。 据官方透露,本轮融资由红杉中国、CMC资本及一战略投资方联合领投,老股东顺为资本、源码资本、明势创投、渶策资本均超额增持,远识资本继续担任本轮融资的独家财务顾问。 Liblib是ChatGPT出现后AI应用井喷般创业潮里十分典型的一家公司,它由在大厂打过硬仗的

  • 如何提升品牌在AI回答中的提及率?GEO优化3招,让ChatGPT主动提及你的品牌

    本文探讨AI搜索时代品牌面临的"隐身危机",指出AI搜索用户年增538.7%,但品牌在AI回答中提及率不足20%。提出三大核心策略:1)构建权威背书矩阵,通过知乎等高权重平台获取自然提及;2)优化AI友好内容,采用对话式标题和结构化数据;3)建立数据监测闭环,通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现,避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

今日大家都在搜的词: