Graphite最新报告：当前互联网超50%的内容是由AI生成的

IT之家 10 月 15 日消息，SEO 公司 Graphite 的报告分析了 2020 年 1 月至 2025 年 5 月间发布的 65000 篇英文文章。报告使用名为 Surfer 的 AI 检测工具，凡是内容中有不少于 50% 由大语言模型生成的文章，都被认定为 AI 文章。

分析结果显示，AI 文章在 ChatGPT 发布后迅速激增，从 2022 年末的约 10%，到 2024 年超过 40%，随后增速趋于平缓。

当前，AI 文章的增长已近似接近稳定期。2024 年 11 月 AI 文章达到峰值后，新发布的 AI 与人类创作内容基本各占一半。截至今年 5 月，新的 AI 文章占比为 52%，相比上个月，人类创作文章曾短暂占多数。

人类创作内容的比例可能还被低估。研究人员使用的 Common Crawl 数据集包含数千亿网页。Axios 指出，由于 AI 公司利用这些数据训练大语言模型，许多付费网站已阻止 Common Crawl 索引页面，因此几乎可以确定由人类创作的文章未被 Graphite 统计在内。

IT之家从报道中获悉，AI 检测工具的判断“并非百分百可靠”。Graphite 测试 Surfer 时分析了一组 AI 文章和一组人类文章，结果显示，Surfer 将人类文章误判为 AI 的比例为 4.2%，而将 AI 文章误判为人类的比例仅 0.6%。

至于 AI 文章为何出现“平台期”，目前尚无定论。外媒 Axios 引用 Graphite 的另一份报告认为，AI 内容工厂发现低质量内容在搜索引擎和聊天机器人中不再被重视，报告显示谷歌搜索中 86% 的文章由人类创作，仅 14% 由 AI 创作。

与此同时，越来越多作者在创作过程中借助 AI 工具，使 AI 与人类创作的界限愈发模糊。

UCLA 计算机科学教授、亚马逊云服务副总裁 Stefano Soatto 对 Axios 表示：“目前，这更像是一种共生关系，而不是简单的二分对立。”