--- title: "Perplexity 被指控抓取那些明确禁止 AI 抓取的网站" description: "AI 初创公司 Perplexity 被 Cloudflare 指控从明确禁止此类行为的网站抓取内容。Cloudflare 的研究表明,Perplexity 通过更改其机器人的用户代理和网络标识符来规避这些限制。尽管 Perplexity 的发言人否认了这些指控,但 Cloudflare 确认在多个域名上发现了这种活动。这一事件紧随 Perplexity 之前因未经授权抓取和抄袭而受到的指控。Cl" type: "news" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/251491710.md" published_at: "2025-08-04T15:47:05.000Z" --- # Perplexity 被指控抓取那些明确禁止 AI 抓取的网站 > AI 初创公司 Perplexity 被 Cloudflare 指控从明确禁止此类行为的网站抓取内容。Cloudflare 的研究表明,Perplexity 通过更改其机器人的用户代理和网络标识符来规避这些限制。尽管 Perplexity 的发言人否认了这些指控,但 Cloudflare 确认在多个域名上发现了这种活动。这一事件紧随 Perplexity 之前因未经授权抓取和抄袭而受到的指控。Cloudflare 随后采取措施阻止 Perplexity 的机器人,并推出了一个市场,供网站所有者向 AI 抓取者收费 根据互联网基础设施提供商 Cloudflare 的说法,人工智能初创公司 Perplexity 正在爬取和抓取那些明确表示不希望被抓取的网站内容。 周一,Cloudflare 发布研究称,它观察到这家人工智能初创公司忽视了阻止措施,并隐藏了其爬取和抓取活动。这家网络基础设施巨头指责 Perplexity 在试图抓取网页时 “试图规避网站的偏好”,Cloudflare 的研究人员写道。 像 Perplexity 提供的人工智能产品依赖于从互联网获取大量数据,而人工智能初创公司长期以来在未经许可的情况下多次从互联网抓取文本、图像和视频,以使其产品正常运作。近年来,网站试图通过使用网络标准 Robots.txt 文件进行反击,该文件告诉搜索引擎和人工智能公司哪些页面可以被索引,哪些不可以,但这些努力迄今为止效果不一。 根据 Cloudflare 的说法,Perplexity 似乎故意通过更改其机器人 “用户代理” 来规避这些阻止措施,这意味着一个信号,用于根据设备和版本类型识别网站访问者;以及更改其自主系统网络(ASN),本质上是一个识别互联网大型网络的号码。 “这种活动在数万个域名和每天数百万个请求中被观察到。我们能够使用机器学习和网络信号的组合来指纹识别这个爬虫,” Cloudflare 的帖子中写道。 Perplexity 发言人 Jesse Dwyer 将 Cloudflare 的博客帖子驳斥为 “销售宣传”,并在给 TechCrunch 的电子邮件中补充说,帖子中的截图 “显示没有访问任何内容”。在后续电子邮件中,Dwyer 声称 Cloudflare 博客中提到的机器人 “甚至不是我们的”。 Cloudflare 表示,它首次注意到这种行为是在其客户投诉 Perplexity 爬取和抓取他们的网站后,即使他们在 Robots 文件中添加了规则,专门阻止 Perplexity 已知的机器人。Cloudflare 表示,随后进行了测试以检查并确认 Perplexity 正在规避这些阻止措施。 Techcrunch 活动 旧金山 |2025 年 10 月 27 日至 29 日 根据 Cloudflare 的说法,“我们观察到 Perplexity 不仅使用其声明的用户代理,还使用一种通用浏览器,旨在在其声明的爬虫被阻止时伪装成 macOS 上的 Google Chrome。” 该公司还表示,它已将 Perplexity 的机器人从其验证列表中删除,并添加了新的技术来阻止它们。 Cloudflare 最近公开表态反对人工智能爬虫。上个月,Cloudflare 宣布推出一个市场,允许网站所有者和出版商向访问其网站的人工智能抓取者收费。Cloudflare 的首席执行官 Matthew Prince 当时发出警告,称人工智能正在破坏互联网的商业模式,特别是出版商。去年,Cloudflare 还推出了一种免费的工具,以防止机器人抓取网站以训练人工智能。 这并不是 Perplexity 第一次被指控未经授权抓取。 去年,新闻媒体如 Wired 指控 Perplexity 抄袭他们的内容。几周后,Perplexity 的首席执行官 Aravind Srinivas 在 Disrupt 2024 大会上接受 TechCrunch 的 Devin Coldewey 采访时,被问及公司对抄袭的定义时无法立即回答。 ### Related Stocks - [NET.US - CloudFlare](https://longbridge.com/zh-CN/quote/NET.US.md) ## Related News & Research | Title | Description | URL | |-------|-------------|-----| | OVHcloud Acquires Seald to Boost Data Security | OVHcloud has acquired Seald, a French company specializing in end-to-end encryption technologies, to enhance its data se | [Link](https://longbridge.com/zh-CN/news/273676715.md) | | Cloudflare (NET) stock analysis 2021 \| High growth SaaS stock (Q2 earnings) | Cloudflare (NET) reported Q2 2021 earnings, surpassing both its own forecasts and analyst expectations. The company is e | [Link](https://longbridge.com/zh-CN/news/272915991.md) | | Tempus AI EVP Erik Phelps Sells Shares | Erik Phelps, EVP and Chief Admin. Officer of Tempus AI, sold 9,464 shares of Class A Common Stock on February 19, 2026, | [Link](https://longbridge.com/zh-CN/news/276495655.md) | | Annette Franqui Purchases 1,540 Shares of OFG Bancorp (NYSE:OFG) Stock | OFG Bancorp Director Annette Franqui purchased 1,540 shares of the company's stock at $42.06 per share, totaling $64,772 | [Link](https://longbridge.com/zh-CN/news/276494822.md) | | CoreWeave Chief Strategy Officer Brian M. Venturo Disposes of Common Shares | Brian M. Venturo, Chief Strategy Officer of CoreWeave, Inc., has disposed of Class A common shares of the company. The f | [Link](https://longbridge.com/zh-CN/news/276496386.md) | --- > **免责声明**:本文内容仅供参考,不构成任何投资建议。