STEM Forged vs GPTZero:哪个人工智能检测器更好?

2025 年,市场上将出现数百(甚至数千)种人工智能写作工具。 

ChatGPT, DeepSeek, Claude 自 2022 年以来,《蝙蝠侠》和许多其他作品一直超级受欢迎,而且它们每天都在变得更好。 

你只需输入几个字,他们就能在几秒钟内写出整个故事、文章甚至报告。

听起来很酷,对吧?但并不适合所有人。

在学校里,越来越多的学生上交的作业可能是人工智能写的。 

现在,教师们陷入了困境,因为他们不想猜测或不公正地指责任何人。但他们也不想忽视这个问题。 

他们需要帮助,而这正是 人工智能探测器 进来

就像人工智能写作工具在不断发展一样,人工智能探测器也在不断涌现。 

今天,我们来看看两个最大的人工智能检测器:STEM Forged 和 GPTZero。 

两者都旨在检测人工智能编写的内容。但哪一个效果更好呢?

在本文中,我们将介绍它们的准确性、易用性以及对不同类型的人工智能和人类写作的处理能力。

让我们深入了解一下!

导言

在深入比较之前,让我们先快速了解一下这两种工具。 

STEM 锻造

STEM 锻造 是一家以教育为重点的公司,总部位于爱达荷州博伊西。 

再也不用担心人工智能检测到你的短信了 Undetectable AI 可以帮助您:

  • 让人工智能辅助写作显现出来 像人一样
  • 旁路 只需点击一下,就能使用所有主要的人工智能检测工具。
  • 使用 人工智能 安全地自信地 在学校和工作中。
免费试用

2024 年初,他们发现越来越多的学生上交了由人工智能编写的作业,而教师却没有合适的工具来检查这些作业。

就在那时,他们推出了 STEM 锻造人工智能探测器。

它是一个更大系统的一部分--整个学习平台还包括人工智能课程创建器和人工智能导师。 

但人工智能检测器的建立是为了帮助教师发现人工智能编写的作业,并保持学术诚信。

它在 2024 年 4 月首次问世时,有三个重要特点:

  • 逐句检测 检查每一行是否有使用人工智能的迹象。
  • 信心分数 以显示机器人编写的可能性有多大。

反馈系统 让教师对检测器标记的内容发表评论。

这一工具有助于教师理解和应对棘手的情况。

GPTZero

GPTZero 由 Edward Tian 创作。 

2022 年末,在寒假期间,他从 普林斯顿大学、 他看到人工智能写作工具的传播速度是如此之快。 

他意识到这些信息如何被用来欺骗或传播虚假信息。 

因此,他决定创建 GPTZero,作为其毕业论文项目的一部分。这款工具主要关注两点:

  • "爆发力" - 句式的变化程度(人类通常会混淆句式)。
  • "困惑" - 对人工智能来说,文字有多么令人困惑(人类的文字常常让人工智能感到惊讶)。

真实世界测试:它们的性能如何? 

为了比较 GPTZero 和 STEM Forged 在实际场景中的表现,我们采用了一种测试方法,其灵感来自于 ZDNet 的 广泛参考的基准。

我们通过这两种工具运行了五个不同的文本块:

  • 三个人工智能生成的样本(ChatGPT-4),使用不同的提示(教育、营销和叙述)。
  • 两份人类撰写的文本,均出版于 2020 年之前,并确认为人类撰写。

每个样本都进行了单独测试。

对于 GPTZero,我们认为得分超过 70% 表示人工智能检测能力很强。

STEM Forged 采用 0-10 分制,7 分或 7 分以上被视为人工智能生成内容的强烈信号。

GPTZero 结果

GPTZero 通过分析文本的节奏和可预测性来进行检测--使用 "plexity "和 "burstiness "等概念来猜测可能是人类还是机器写的。 

在我们的测试中,它对结构更严谨、更正式的人工智能输出表现出色,但当语言变得更具创造性或对话性时,它就会有些磕磕绊绊。 

这是有道理的:当人工智能听起来像人工智能时,GPTZero 的表现最出色--但当音调开始变得更像人类时,它的信心就会下降。 

另一方面,它也能很好地识别人工撰写的样本,将误报率降到很低。

文本块得分 (%)检测到人工智能?
第 1 座 - 人工智能91%
第 2 单元 - 人工智能 82%
第 3 单元 - 人工智能 68%没有
第 4 区 - 人类 15%没有
第 5 区 - 人类 5%没有

摘要:GPTZero 正确识别了 3 篇人工智能生成的文本中的 2 篇,没有标记任何一篇人类撰写的文本,5 篇正确分类中总共识别了 4 篇。

STEM 锻造成果

STEM Forged 采用了一种不同的方法:它不是研究抽象的模式,而是根据每个句子听起来的 "人工智能 "程度,用 0-10 级评分,让教育工作者对文本有一个更实际、更细化的认识。 

在我们的测试中,这种方法保持得非常好。 

所有三个人工智能生成的区块都以较高的置信度被明确标记,而两个人工编写的文本都以较低的分数停留在安全区。 

这种逐句细分的方法似乎很有效果,尤其是在写作风格比较细腻的情况下。 

从结构到创意,它都能准确无误地处理每一个区块。

文本块STEM 分数(1-10)检测到人工智能?
第 1 座 - 人工智能9
第 2 单元 - 人工智能 8
第 3 单元 - 人工智能 8
第 4 区 - 人类 3没有
第 5 区 - 人类 2没有

摘要:STEM 伪造版正确识别了所有五个样本,标记了每个人工智能生成的区块,并通过了两个人工撰写的文本。

分析

GPTZero 但在叙事性较强的文章中,它的表现就不那么一致了--它错误地分类了一个语气更有创意的人工智能样本。 

不过,它的一个显著优点是避免了对人类内容的误报。

STEM 锻造同时,在人工智能和人类样本中都取得了一致的结果。 

它以高置信度(分数≥ 8)标记所有人工智能区块,并给人类文本打低分,因此在该样本中表现完美。

每种工具的优缺点

GPTZero

让我们来分析一下 GPTZero 哪些方面做得好,哪些方面做得不够。

零 GPT 的优点:

  • 即时标记新的 ChatGPT、Gemini 或 Claude 内容,精确度近乎完美。
  • 使用先进的检测方法,如 迷茫 (文本的随机性)和 爆裂感 (句式变化)。
  • 通过 Chrome 浏览器扩展和文件上传轻松实现集成。
  • 提供 10,000 字的免费层级,是轻度用户的理想选择。

GPT 零的缺点:

  • 有时称为经典人类写作(如历史文献) "人工智能生成" (误报).
  • 一旦稍作调整,就无法捕捉 AI 文本 (假否定句).
  • 与多语言内容和非母语英语措辞作斗争。
  • 高级计划价格昂贵,未使用的积分每月过期。

STEMForged

现在让我们来看看 STEM 锻造人工智能探测器

STEM 锻造人工智能探测器的优点

  • 置信度评分可减少对边缘文本的误报。
  • 允许无限制扫描,支持长篇和多语种提交,并考虑到了课堂工作流程。
  • 不保留数据--提交的数据不会被存储或重复使用,这符合机构的合规需求。
  • 句子级检测可突出显示人工智能生成的特定部分。
  • 易于使用的仪表板,可即时显示结果。
  • 定期更新模型,与时俱进。

STEM 锻造人工智能探测器的缺点

  • 对真实人类文字的误报率略高(高达 15%)。
  • 可能会将人工撰写的内容标记为人工智能生成的内容,尤其是对于英语非母语人士。

人工智能内容检测和审查的替代工具

在检测学术环境中的人工智能生成内容方面,STEM Forged 处于领先地位。 

它专为课堂而设计,具有方便教育工作者公平、清晰、大规模地批改作业的功能。

但是,出色的内容审核并不止步于检测。 

无论是处理边缘情况、检查原创性,还是完善色调和结构,添加像 Undetectable AI 这样的工具都能让你的工作流程更进一步。

两者结合使用,可形成强大的组合:STEM Forged 为检测过程带来了精确度和信任感,而 Undetectable AI 则提供了打磨、验证和强化内容的智能方法。

下面介绍几款 Undetectable AI 工具,它们与 STEM Forged 在更广泛的审查堆栈中相辅相成:

1 - 人工智能探测器

"(《世界人权宣言》) 无法检测的人工智能探测器 称为 #1 被《福布斯》评为最佳人工智能探测器。 

只需点击一下,它就能帮你查找文本是否由人工智能撰写,如 ChatGPT、Gemini、Claude、Llama 等。 

最近,"无法检测的人工智能探测器 "也在一篇文章中被重点介绍。 ZDNet 评论 是为数不多的能以 100% 的准确率持续标记人工智能生成内容的工具之一。

来源:David Gewirtz/ZDNETDavid Gewirtz/ZDNET

这就是为什么这个工具如此高效:

  • 它是免费的: 开始使用时,您无需支付任何费用。您可以免费获得同样强大的人工智能检测功能。
  • 显示多个检测器的检测结果: 该工具不只使用一种检测器,而是同时使用多种人工智能检测器检查文本。
  • 专家信赖: 它被世界各地的企业(《福布斯》、BuzzFeed、《今日美国》等)和专业人士广泛使用,因为它运行良好并能保护您的信息隐私。
  • 多种语言作品: 如果您的文本使用不同的语言,也不用担心!该工具可以检查多种语言的内容。 
  • 易于使用: 该工具设计简单,任何人都可以使用,即使你对技术知之甚少。
  • 高度精确: 它的准确性甚至得到了《福布斯》等顶级媒体的称赞。

Buzzfeed 也对这一工具进行了评论,指出

"不可检测的人工智能走在了让人工智能生成的内容更像人类的前沿,为其更广泛的应用和接受铺平了道路"。

2 - 人工智能剽窃检查器

"(《世界人权宣言》) 人工智能剽窃检查器 无论您是学生、教师还是商人,都能确保您的写作独一无二。 

该工具完全免费、快速、有效。 

具体操作如下

  1. 复制要验证的文本。
  2. 将其粘贴到工具中。
  3. 点击 "检查 AI 剽窃"。

3 - 人工智能图像检测器

"(《世界人权宣言》) 人工智能图像检测器 可帮助您立即识别图像是由人工智能生成还是由人工创建--无需登录、无需水印、无需附加条件。

它支持主要的图像格式,并使用经过训练的尖端模型来检测来自 Midjourney、DALL-E 和 Stable Diffusion 等工具的内容。

下面介绍如何使用它:

  • 上传图片或将图片拖放到工具中
  • 点击 "检测",分析图像中人工智能生成的模式
  • 查看置信度评分和检测说明
  • 在几秒钟内下载结果或尝试其他图像

最终结论哪个更好?

所以,在讨论了这么多之后,真正的问题是:哪一个更好?

这两款工具都非常可靠,可以完成它们应该完成的任务--检查你的写作,发现人工智能内容,并帮助保护你的作品。 

但是,STEMForged 却一马当先。 

当与 检测不到的人工智能这样,组合就变得更加强大。

这种组合涵盖了所有基础知识,使写作具有真实、安全和清晰的感觉。

让人工智能来完成繁重的工作,但要保持写作的本心。

因为归根结底,最重要的不仅仅是通过考试......而是掌握技能。 

Undetectable AI(TM)