如何检测 ChatGPT:检测工具和技巧

自 2022 年 11 月推出以来,没有一款应用程序能比 ChatGPT 对世界产生的影响更大。

它几乎以一己之力带来了人工智能革命,这场革命几乎席卷了地球上的每一个行业。

其中最重要的是内容创作和出版领域。

数千年来,人类一直在用笔或手指敲击键盘,手动将文字打印出来。

但随着 ChatGPT 的推出,这一切都彻底改变了。

只需几个简单的提示,人们就可以使用 ChatGPT 在几秒钟内制作出文章。

但是,随着全球用户超过 1 亿,人们开始提出这样的问题:在阅读在线内容时,如何检测 ChatGPT?

那么 ChatGPT 真的能被检测到吗?当然可以。

本文将讨论检测 ChatGPT 的最佳工具和技巧,以及如何利用它们为您带来好处。

什么是 ChatGPT?

它最初是由 OpenAI 公司于 2022 年推出的大型语言模型(LLM),用于协助我们完成各种任务。

LLM 通常被描述为聊天机器人,因为用户可以与 ChatGPT 随意交谈,以获得他们想要的输出。

GPT 是 Generative Pre-trained Transformer(预训练生成转换器)的缩写,该转换器经过微调,能以随意的对话语气提供信息和回复。

ChatGPT 目前的型号是 GPT4,于 2023 年 3 月发布。

ChatGPT 不断发展,已不仅仅是法律硕士。

如今,该系统可以识别图像,并使用文本转语音技术提供类似人类的音频。

它还集成到数千个不同的应用程序中,包括微软的 Teams 等应用程序套件和必应网络浏览器。

微软拥有 OpenAI 10% 的股份,并聘请了前创始人兼首席执行官山姆-奥特曼(Sam Altman)领导自己的人工智能工作组。

ChatGPT 真的能被检测到吗?

答案是肯定的,但也是否定的,我们将对此做出解释。

如果从字面上看,任何人工或人工智能检测工具都无法以 100% 的确定性检测到 ChatGPT。

即使你使用人工智能检测器分析某篇文章或段落,它也只能告诉你这篇文章或段落由人工智能创作的可能性。

它无法明确告诉你是 ChatGPT 制作的,还是其他 LLM(如 Claude AI 或 Google Bard)制作的。

我们可以从人工智能生成的文字中发现一些可预测的模式。

这些模式会出现在文本的句法和句子结构等方面。

其他测量方法包括文本的突发性(主要指句子长度的变化)和复杂性(即文本的复杂程度)。

谁需要 ChatGPT 检测器?

以任何方式处理已发布材料或内容的任何人都应使用 ChatGPT 检测工具。

这些工具对教师判定学术不诚实行为和编辑收到人工智能生成的抄袭作品特别有用。

但是,人工智能探测器可以为几乎所有在网上阅读文章或博客的人提供帮助。

ChatGPT 等法学硕士的部分问题在于,他们可能提供剽窃或与事实不符的成果。

这就是所谓的人工智能幻觉,除非你进行研究并核实事实,否则你可能会在不知情的情况下发布无可否认的虚假信息。

如何知道 ChatGPT 所写的内容?

虽然很难确定某些内容是否由 ChatGPT 撰写,但不需要人工智能检测工具也能识别出某些模式。

以下 8 件事可能会让你怀疑你正在阅读的内容是由 ChatGPT 制作的。

1.寻找模式和不一致之处

正如我们提到的,在人工智能生成的文本中会出现很多可识别的模式。

这不仅需要文本的语法或结构模式,还需要文本本身的预测能力。

人工智能无法跳出固有思维,它更愿意提供安全、一致、易读易懂的输出结果。

过于简单和可预测的语言是人工智能文本的特点。

2.检查人为错误的迹象

您可能没有意识到,大多数人工撰写的文本中都存在某种错误。

这是完全正常的,几个世纪以来一直如此。

人工撰稿人和人工编辑肯定会遗漏标点符号、语法或时态错误等问题。

但与人工智能文本相比,人类的文字更精炼、更自然。

像 ChatGPT 这样的人工智能工具并不是在撰写文本,而是根据它们训练过的所有数据生成文本。

这可能包括语法或用词方面的错误,我们听起来很别扭,但人工智能工具本身却无法辨别。

3.查找描述性语言的缺乏

这正是人工智能生成内容的困惑度得分。

大多数 LLM 的设计和编程都不会让用户感到困惑。因此,这些工具使用的语言更加简单易懂。

在选词方面也缺乏多样性,同样的单词或短语经常在同一文本中出现多次,你会意识到这一点。

4.关注背景

为什么需要关注上下文?因为人工智能工具往往不善于提供语境。

请记住,人工智能本质上是根据以前的数据集生成输出和响应。

对于 ChatGPT 来说,要持续了解每次对话的新语境并非易事。

ChatGPT 越来越聪明,既可以学习,也可以接受培训,以了解以前对话的上下文。

但说到对话的文本输出,ChatGPT 和其他人工智能工具在提供上下文方面仍然很欠缺,而人类写作者本来是很容易将上下文包含在内的。

5.过度使用过渡词

过渡词是连接句子和观点的绝佳工具。

这种结构对于人类写作者来说很自然,但对于人工智能工具来说,它们似乎会用过渡词来过度补偿。

这些 LLM 经过训练,可以提供相似的句子结构和长度。

为了解决这个问题,他们似乎还采用了一种过度活跃的算法,试图以一种不自然的方式将句子或概念串联起来。

如果你读起来觉得奇怪,那么人工智能很可能参与了该文本的制作。

6.看似正确却不合理的句子

如果你曾经看到过这样的句子,它们看起来是对的,但在试图理解它们时却稍有偏差,那么这很可能是人工智能写的。

这些工具在句子结构等方面训练有素,但在句子的主语方面往往会失误。

请务必记住,ChatGPT 和其他人工智能工具只是在重复它们从其他地方学到的数据,这可能会导致一些别扭的短语和句子。

7.缺乏独创性

当你阅读大多数人工智能文本时,你会发现其中没有任何原创性。

它缺少人类作家的细微差别和灵魂。谷歌的 EEAT 指南规定,人工智能生成的内容很难获得较高的排名,这是有原因的。

Google 正在从内容中寻找经验、专业知识、权威性和可信度的实例。

这些都是人工智能难以提供的,尤其是难以以原创和发人深省的方式提供。

甚至还有人工智能文本完全抄袭其他来源的例子。

人工智能工具非常有用,但与人类相比缺乏独创性。

8.事实错误

我们已经简要地谈到了人工智能的幻觉,不幸的是,这些幻觉仍然是使用人工智能写作工具的代价。

如果 ChatGPT 提供的输出结果与事实不符,用户可以自行检查其真实性和准确性。

ChatGPT 本身可以不眨眼地提供事实错误。

如果你发现文本中的某些内容明显不正确,那么很有可能是人工智能工具或人类作者的严重失误。

如何识别 ChatGPT 生成的错误信息?

不幸的是,在使用人工智能工具制作内容时,错误信息也会随之而来。

但是,如何从 ChatGPT 生成的文本中识别错误信息呢?

这很难,你必须做一些调查,但最终你还是能够识别出错误信息的迹象。

从文本中任何突兀的句子、重复的事实或短语开始。

这是你的第一条线索:ChatGPT 和其他法律硕士在产生幻觉时经常会出现标点符号或语法错误。

另一种识别错误信息的方法是人类常识测试:如果你读到的东西听起来有猫腻,就对其进行事实核查。

当 LLM 产生幻觉时,它会以同样随意的对话方式做出反应。

它不可能知道自己的输出与事实不符!

使用什么工具检测 ChatGPT?

如果你需要一个能检测 ChatGPT 写入的工具,那你就走运了。

人工智能检测器行业已呈现爆炸式增长,数十种不同的应用程序都声称能够识别人工智能生成的文本。

它们有用吗?程度不一。以下是我们选择的检测 ChatGPT 创建内容的最佳工具。

SEO.ai

除了拥有人工智能行业最酷的网址之一,SEO.AI 还为内容创作者提供了一长串免费和付费的人工智能工具。

该网站主要提供一个平台,帮助生成搜索引擎友好型内容,这些内容在 SERP 中排名靠前,并经过 Google EEAT 优化。

但是 SEO.ai 还提供免费的 AI 检测工具。该工具可以检测 ChatGPT 的最新 GPT-3.5 和 GPT-4 版本以及 Google Bard 等其他 LLM。

SEO.ai 声称,该检测器能以 98.4% 的准确率标记人工智能生成的内容。

泄密

Copyleaks 是一款著名的人工智能工具,可帮助识别剽窃或人工智能生成的内容。

康奈尔大学团队 2023 年 7 月的一份报告显示,Copyleaks 是市场上最准确的人工智能检测工具,准确率高达 99.1%。

该工具既有免费版,也有高级付费版,可提供大量附加功能,如检测多达 30 种不同语言和无限制扫描。

它甚至还附带了谷歌 Chrome 浏览器扩展,这样你就可以在 Chrome 浏览器窗口中打开的任何网站上使用 Copyleaks。

GPTZero

GPTZero顾名思义,这是一款人工智能工具,可用于检测内容是否由 ChatGPT 或其他 LLM 撰写。

它声称自己是人工智能检测领域的黄金标准,也是市场上最值得信赖的人工智能检测工具。

GPTZero 与美国教师联合会合作,确保全国数百万课堂的学术诚信。

这款应用程序还提供免费版和高级版。

免费版的扫描字数限制为 5,000 字,每月总字数限制为 10,000 字。

$10/月的价格可以让您每月获得多达 150,000 字的内容,$16/月的价格可以让您每月获得多达 300,000 字的内容。

GPTZero 还提供批量文件和文档扫描、剽窃扫描以及 API 和 Google Chrome 浏览器扩展。

这款应用程序声称,它在检测人类撰写的内容时具有 99% 的准确率,在识别人工智能生成的内容时具有 85% 的准确率。

GPT-2 输出检测器

GPT-2 输出检测器 是一款开源工具,可以检测人工智能撰写的文本与人类撰写的文本。

该工具是通过使用 RoBERTa 模型的微调版本和 1.5B 参数 GPT-2 模型创建的。

这款人工智能检测仪标榜的准确率为 99.8%,但由于不包括较新的 GPT-3.5 和 GPT-4 型号,其准确率可能会受到限制。

诗歌名言

PoemOfQuotes 可能不是最明显的人工智能检测工具,但它确实有效。

该网站被用作人工智能诗歌创作页面,已在超过 1,780 亿个参数上进行了训练。

人工智能检测工具由网站提供 人工智能探测器专业版 并可与 Microsoft Word 和 Google Docs 直接集成。

这款应用程序甚至还能为您提供报告,概述文本中哪些部分可能是由人工智能撰写的,哪些部分是由人类撰写的。

有一个高级付费版本,100 份报告每月 $13.99,无限报告每月 $24.99。

校正器

Corrector AI 检测工具 完全免费使用,但每次扫描字数限制为 800 字。

该网站声称,其人工智能检测器的准确度高达 100%,而且与其他检测器不同,它可以检测到包括 GPT-4 在内的 ChatGPT 每一次迭代所创建的内容。

Corrector 的人工智能检测工具可以识别由 ChatGPT、Google Bard、Jasper AI、SurferSEO 和 Quillbot 等人工智能工具创建的内容。

规模内容

规模内容 是一款全解决方案的人工智能内容工具,其选项之一是人工智能检测器。

据称,这款人工智能检测器的准确率高达 98.3%,最近还对其建模进行了升级,以与 GPT-4、谷歌巴德和克劳德人工智能相媲美。

Content at Scale 自诩拥有最简单的评分系统,可以提醒用户内容是由人类还是人工智能写作工具创建的。

每次扫描后,"规模内容 "还将提供逐句分析,标出似乎是人工智能生成的部分。

人工智能检测器的费用中还包括 Content at Scale 的人工智能生成写作工具,它不仅能帮助您生成高质量的内容,还能帮助您以更人性化的方式重写旧内容和人工智能生成的内容。

对于无限制的人工智能检测器扫描和多达 25,000 个无法检测的人工智能单词,Content at Scale 的收费仅为每月 $49。

罗伯塔 OpenAI 探测器 - 抱抱脸

Huggingface 是一个法裔美国人在线人工智能社区,允许开发人员合作和分享机器学习应用程序。

毫不奇怪,Hugginface 制作了许多人工智能工具,这些工具不仅在开发者社区,而且在主流内容行业都很受欢迎。

罗伯塔 OpenAI 探测器 作为 GPT-2 输出检测器的平台,本文前面已经介绍过。

罗伯塔,或称 roBERTa,是一个基于 2018 年谷歌 BERT 模型的人工智能模型。

Roberta 是在比 BERT 大得多的数据集上进行训练的,其程序架构也略有不同。

ChatGPT 检测器 - Huggingface

(我找到的网页是 https://huggingface.co/spaces/Hello-SimpleAI/chatgpt-detector-single 这似乎很奇怪,因为其中有拼写错误,而且有一半是中文。

GLTR

GLTR 或巨型语言模型测试室 是一种人工智能检测器,可提供文本的可视化叠加,用颜色标记哪些单词或短语是由人工智能创建的。

GLTR.io 使用 GPT-2 117M 平台作为分析和识别人工智能生成文本的基础。

GLTR 不是付费订阅,而是开放源代码,开发人员可在 GitHub 上访问。

免费演示版也可在其网站上使用,任何人都可以试用。

该工具的彩色编码方案非常适合识别不同的语言模式,其中一些显然是人工智能写作工具使用频率较高的语言模式。

它的一个缺点是,它是在现已过时的 GPT-2 模型上进行训练的,这意味着它可能无法有效地标记由较新的 GPT 版本生成的人工智能内容。

作家

作家人工智能检测工具 在其网站上免费使用,并接受过 GPT-4 和 ChatGPT 的全面培训。

目前,在 Writer 上扫描内容的限制为 1500 个字符,但对扫描内容的次数没有限制。

它是一款使用极为简单的工具,一旦扫描文本,就会立即提供检测分数。

Writer 还配有其他工具,包括人工智能内容生成工具和人工智能剽窃检查器。

这些其他产品允许将扩展功能直接集成到其他应用程序中,包括 Figma 和 Google Chrome 浏览器。

以下是 Writer 对该段进行 AI 检测的示例。

ChatGPT 有水印吗?

截至目前,ChatGPT 尚未在文本或图像上添加水印。自 ChatGPT 于 2022 年推出以来,这一直是一个有争议的话题。

在美国监管机构最近施加的压力下,白宫报告称 包括 OpenAI 和 Meta 已同意为其人工智能生成的内容添加水印。

人工智能水印究竟是什么?它是将数字指标嵌入文本本身的一种形式。

在大多数情况下,人眼无法检测到这些特征,但人工智能检测工具和扫描仪将能够识别出该序列是 ChatGPT 所独有的。

人们相信,这些水印可以让人们轻松识别出文本、视频或图像是由人工智能而非人类创建的。

谷歌对检测 ChatGPT 是否写入文本感兴趣吗?

这也是内容产业中另一场有趣的辩论。

众所周知,网站或博客盈利的关键在于通过关键词和搜索引擎优化在 SERP 上获得高排名。

谷歌的访问量占全球互联网访问量的 90% 以上,因此,如果有一套指南需要您遵循,那就是谷歌搜索引擎优化指南。

ChatGPT 发布后,谷歌修订了其指南,将 EEAT 原则纳入其中。

这代表经验、专业知识、权威性和可信度。

谷歌不会明确关注您是否使用人工智能制作内容.它特别提到,人工智能生成的内容只要不被视为垃圾信息,就不违反其指导原则。

人工智能生成内容的问题在于,它永远无法提供人类的视角或第一手经验。

根据谷歌的 EEAT 指南,这意味着严格由人工智能制作的内容通常排名不会很高。

这就需要你自己进去手动编辑内容,或者你可以使用一个工具,比如我们将在下一节讨论的工具。

如何使 ChatGPT 文本不易被察觉?

那么,如果人工智能制作的内容排名不高,我们怎样才能让人工智能检测器甚至谷歌本身都无法检测到您使用 ChatGPT 制作了内容呢?那就是让它无法被检测到。

Undetectable.AI 是领先的人工智能加扰工具,只需点击一下按钮,就能将人类或人工智能生成的内容人性化。

该工具可确保您的人性化内容不会被市场上最好的人工智能检测器标记为人工智能生成的内容。其中包括 ZeroGPT、Writer、Copyleaks 和 Sapling。

无论您是使用 ChatGPT 制作内容还是自己撰写内容,Undetectable.AI 都是使用人工智能扩大内容产出的内容创作者的必备工具。

Undetectable.AI的价格低至$9.99/月(最多10,000字),按年支付则仅需$5.00/月,以最低的成本让每一位作家安心写作。

结论

随着 ChatGPT 等人工智能工具的不断发展和完善,人们对检测其存在的方法的需求也会一直存在。

目前市场上有很多人工智能检测工具。有些是免费的,有些是开源的,有些则需要付费订阅。

但它们都在努力减少利用人工智能大量生产低质量内容的作者。

虽然它们会给作者带来困扰,尤其是当你的内容被谷歌标记为人工智能时,但还是有办法解决的。

首先,你可以采用传统的方法,自己撰写内容或手动编辑人工智能生成的文本。

另一种方法是使用类似 Undetectable.AI 为您完成这项任务。

只需点击一下按钮,该工具就能 使内容人性化 并保护您的内容不被识别为人工智能制作的。

检测不到的人工合成指数(TM)