IT之家 10 月 15 日消息,SEO 公司 Graphite 的报告分析了 2020 年 1 月至 2025 年 5 月间发布的 65000 篇英文文章。报告使用名为 Surfer 的 AI 检测工具,凡是内容中有不少于 50% 由大语言模型生成的文章,都被认定为 AI 文章。
分析结果显示,AI 文章在 ChatGPT 发布后迅速激增,从 2022 年末的约 10%,到 2024 年超过 40%,随后增速趋于平缓。
当前,AI 文章的增长已近似接近稳定期。2024 年 11 月 AI 文章达到峰值后,新发布的 AI 与人类创作内容基本各占一半。截至今年 5 月,新的 AI 文章占比为 52%,相比上个月,人类创作文章曾短暂占多数。
人类创作内容的比例可能还被低估。研究人员使用的 Common Crawl 数据集包含数千亿网页。Axios 指出,由于 AI 公司利用这些数据训练大语言模型,许多付费网站已阻止 Common Crawl 索引页面,因此几乎可以确定由人类创作的文章未被 Graphite 统计在内。
IT之家从报道中获悉,AI 检测工具的判断“并非百分百可靠”。Graphite 测试 Surfer 时分析了一组 AI 文章和一组人类文章,结果显示,Surfer 将人类文章误判为 AI 的比例为 4.2%,而将 AI 文章误判为人类的比例仅 0.6%。
至于 AI 文章为何出现“平台期”,目前尚无定论。外媒 Axios 引用 Graphite 的另一份报告认为,AI 内容工厂发现低质量内容在搜索引擎和聊天机器人中不再被重视,报告显示谷歌搜索中 86% 的文章由人类创作,仅 14% 由 AI 创作。
与此同时,越来越多作者在创作过程中借助 AI 工具,使 AI 与人类创作的界限愈发模糊。
UCLA 计算机科学教授、亚马逊云服务副总裁 Stefano Soatto 对 Axios 表示:“目前,这更像是一种共生关系,而不是简单的二分对立。”