STEM Forged와 GPTZero: 어떤 AI 탐지기가 더 낫나요?

2025년에는 수천 개는 아니더라도 수백 개의 AI 글쓰기 도구가 시장에 출시될 것입니다.

ChatGPT, 딥시크릿, 클로드 를 비롯한 많은 앱이 2022년 이후 큰 인기를 끌었으며, 매일 매일 더 좋아지고 있습니다.

몇 단어만 입력하면 몇 초 만에 전체 기사, 에세이, 심지어 보고서까지 작성할 수 있습니다.

멋지지 않나요? 하지만 모든 사람에게 해당되는 것은 아닙니다.

학교에서는 AI가 작성한 과제를 제출하는 학생들이 늘고 있습니다.

이제 교사들은 누군가를 부당하게 추측하거나 비난하고 싶지 않기 때문에 난감한 상황에 처해 있습니다. 하지만 문제를 무시하고 싶지도 않습니다.

이들에게는 도움이 필요합니다. AI 탐지기 들어오세요.

AI 글쓰기 도구가 성장하는 것과 마찬가지로 AI 탐지기 역시 등장하고 있습니다.

오늘은 가장 큰 두 가지 AI 탐지기를 살펴보고자 합니다: STEM Forged와 GPTZero입니다.

둘 다 AI가 작성한 콘텐츠를 감지하도록 설계되었습니다. 하지만 어느 쪽이 더 효과적일까요?

이 글에서는 얼마나 정확한지, 얼마나 사용하기 쉬운지, 다양한 종류의 AI와 인간의 글쓰기를 얼마나 잘 처리하는지 살펴봅니다.

자세히 알아봅시다!

소개

비교에 대해 자세히 알아보기 전에 두 도구가 무엇인지 간단히 살펴보겠습니다.

STEM 단조

STEM 단조 는 아이다호주 보이시에 본사를 둔 교육 중심 회사입니다.

다시는 AI가 내 문자를 감지할까 걱정하지 마세요. Undetectable AI 도움을 드릴 수 있습니다:

AI 지원 글쓰기 표시하기 사람처럼.
바이패스 클릭 한 번으로 모든 주요 AI 탐지 도구를 사용할 수 있습니다.
사용 AI 안전하게 그리고 자신 있게 학교와 직장에서

무료 체험

2024년 초, 그들은 점점 더 많은 학생들이 AI가 작성한 과제를 제출하고 있지만 교사들은 이를 확인할 수 있는 적절한 도구가 없다는 사실을 알게 되었습니다.

바로 그때 STEM 단조 AI 검출기.

AI 레슨 크리에이터와 AI 튜터도 포함된 전체 학습 플랫폼이라는 더 큰 시스템의 일부였습니다.

하지만 AI 탐지기는 교사가 AI가 작성한 과제를 발견하고 학업 정직성을 강력하게 유지할 수 있도록 돕기 위해 만들어졌습니다.

2024년 4월에 처음 출시되었을 때 세 가지 중요한 기능이 있었습니다:

문장 단위 감지 를 클릭하여 각 줄에 AI 사용 흔적이 있는지 확인합니다.

자신감 점수 를 사용하여 봇에 의해 작성되었을 가능성을 표시합니다.

피드백 시스템 를 통해 교사가 감지기가 표시한 내용에 대해 의견을 제시할 수 있습니다.

이 도구는 교사들이 이해하고 대응하는 데 도움이 되어 까다로운 상황을 더 쉽게 처리할 수 있게 해줍니다.

GPTZero

GPTZero 는 Edward Tian이 만들었습니다.

2022년 말, 겨울 방학 동안 프린스턴 대학교, 그는 AI 글쓰기 도구가 얼마나 빠르게 확산되고 있는지 확인했습니다.

그는 이러한 기술이 어떻게 속임수를 쓰거나 허위 정보를 퍼뜨리는 데 사용될 수 있는지 깨달았습니다.

그래서 그는 졸업 논문 프로젝트의 일환으로 GPTZero를 만들기로 결정했습니다. 이 도구는 두 가지를 고려합니다:

"버스트" - 문장 스타일이 얼마나 많이 바뀌었는지(사람은 보통 혼동하기 마련입니다).
"당황" - 인공지능에게 글쓰기가 얼마나 혼란스럽게 느껴졌는지(인간의 글쓰기는 종종 인공지능을 놀라게 합니다).

실제 테스트: 성능은 어떤가요?

실제 시나리오에서 GPTZero와 STEM Forged의 성능을 비교하기 위해 다음에서 영감을 얻은 테스트 방법론을 따랐습니다. ZDNet의 널리 참조되는 벤치마크입니다.

두 도구에서 5개의 서로 다른 텍스트 블록을 실행했습니다:

다양한 프롬프트(교육, 마케팅, 내러티브)를 사용하여 AI가 생성한 세 가지 샘플(ChatGPT-4)을 제공합니다.
2020년 이전에 출판되었으며 사람이 작성한 것으로 확인된 두 개의 텍스트입니다.

각 샘플은 개별적으로 테스트했습니다.

GPTZero의 경우 70% 이상의 점수를 강력한 AI 탐지를 나타내는 것으로 간주했습니다.

0~10점 척도를 사용하는 STEM Forged의 경우, 7점 이상은 AI가 생성한 콘텐츠의 강력한 신호로 해석됩니다.

STEM 단조 결과

STEM Forged는 추상적인 패턴을 보는 대신 각 문장이 얼마나 'AI처럼' 들리는지에 따라 0~10점 척도로 점수를 매겨 교육자에게 보다 실용적이고 세분화된 텍스트 보기를 제공합니다.

테스트 결과, 이 방법은 놀라울 정도로 잘 견뎌냈습니다.

AI가 생성한 세 개의 블록은 모두 높은 신뢰도로 명확하게 표시되었으며, 사람이 작성한 텍스트는 모두 낮은 점수로 안전 영역에 머물렀습니다.

문장 단위로 세분화하면 특히 미묘한 글쓰기 스타일에 차이가 있는 것 같았습니다.

구조화된 블록부터 크리에이티브 블록까지 모든 블록을 일관된 정확도로 처리했습니다.

텍스트 블록	STEM 점수 (1-10)	AI로 감지되었나요?
블록 1 - AI	9	예
블록 2 - AI	8	예
블록 3 - AI	8	예
블록 4 - 인간	3	아니요
블록 5 - 인간	2	아니요

요약: STEM Forged는 5개의 샘플을 모두 정확하게 식별하여 각 AI 생성 블록에 플래그를 지정하고 사람이 작성한 텍스트를 모두 통과했습니다.

GPTZero 결과

GPTZero는 텍스트의 리듬과 예측 가능성을 분석하는 방식으로 탐지에 접근하며, '당황스러움' 및 '파열성' 등의 개념을 사용하여 사람이 작성한 것인지 기계가 작성한 것인지를 추측합니다.

테스트 결과, 보다 구조화되고 공식적인 AI 결과물을 꽤 잘 처리했지만, 창의력이나 자연스러운 대화가 필요한 언어에서는 어려움을 겪었습니다.

말이 되죠: 인공지능이 명백하게 로봇처럼 들릴 때는 충분히 잘 견디지만, 톤이 좀 더 인간적이거나 자연스러워지는 순간 신뢰도가 떨어지는 경향이 있습니다.

텍스트 블록	점수 (%)	AI로 감지되었나요?
블록 1 - AI	91%	예
블록 2 - AI	82%	예
블록 3 - AI	68%	아니요
블록 4 - 인간	15%	아니요
블록 5 - 인간	5%	아니요

요약: GPTZero는 AI가 생성한 텍스트 3개 중 2개를 정확하게 식별했으며, 사람이 작성한 텍스트에 플래그를 지정하지 않아 총 5개 중 4개의 분류가 정확했습니다.

분석

STEM Forged는 AI와 인간 샘플 모두에서 일관되게 강력한 결과를 제공했습니다.

AI가 생성한 모든 블록에 높은 점수(8점 이상)를 부여하고 인간 텍스트에 낮은 점수를 정확하게 할당하여 이 테스트 세트에서 완벽한 성능을 달성했습니다.

반면, GPTZero는 명확한 AI 콘텐츠는 비교적 잘 처리했지만, 내러티브 작성에 어려움을 겪어 창의적인 AI 샘플 중 하나를 잘못 분류했습니다.

각 도구의 장단점

STEMForged

이제 STEM 단조 AI 검출기.

STEM 단조 AI 탐지기의 장점

신뢰도 점수는 경계선 텍스트의 잘못된 플래그를 줄입니다.
무제한 스캔이 가능하고, 긴 형식의 제출물과 다국어 제출물을 지원하며, 강의실 워크플로우를 염두에 두고 제작되었습니다.
데이터 보존 없음 - 제출된 데이터는 저장되거나 재사용되지 않으므로 기관의 규정 준수 요구사항에 부합합니다.
문장 수준 감지 기능은 AI가 생성한 특정 섹션을 강조 표시합니다.
즉시 결과를 확인할 수 있는 사용하기 쉬운 대시보드.
최신 모델을 유지하기 위한 정기적인 모델 업데이트.

STEM 위조 AI 탐지기의 단점

특히 영어가 모국어가 아닌 사용자의 경우 사람이 작성한 콘텐츠를 AI가 생성한 것으로 표시할 수 있습니다.

GPTZero

무엇을 분석해 보겠습니다. GPTZero 가 잘하는 점과 부족한 점

GPT 제로의 장점:

거의 완벽에 가까운 정확도로 새로운 ChatGPT, Gemini 또는 Claude 콘텐츠에 즉시 플래그를 지정합니다.

다음과 같은 고급 탐지 방법을 사용합니다. 당혹감 (텍스트가 얼마나 무작위인지) 및 파열성 (문장 변형).

Chrome 확장 프로그램 및 파일 업로드를 통해 쉽게 통합할 수 있습니다.

라이트 유저에게 이상적인 10,000단어 무료 티어를 제공합니다.

GPT 제로의 단점:

때로는 고전적인 인간 글(예: 역사 문서)을 호출하기도 합니다. "AI 생성" (오탐).

AI 텍스트가 약간 조정되면 인식하지 못합니다. (거짓 부정).

다국어 콘텐츠와 영어가 모국어가 아닌 문구로 인해 어려움을 겪습니다.

프리미엄 요금제는 가격이 비싸고 사용하지 않은 크레딧은 매월 만료됩니다.

AI 콘텐츠 감지 및 검토를 위한 대체 도구

학술 환경에서 AI가 생성한 콘텐츠를 감지하는 데 있어서는 STEM Forged가 선두를 달리고 있습니다.

교육자가 공정하고 명확하며 대규모로 과제를 쉽게 검토할 수 있는 기능을 갖춘 교실용으로 특별히 제작되었습니다.

하지만 훌륭한 콘텐츠 검토는 감지하는 것에서 끝나지 않습니다.

엣지 케이스 처리, 독창성 확인, 톤과 구조 다듬기 등 어떤 작업을 하든 언디텍터블 AI와 같은 도구를 추가하면 워크플로우를 한층 더 발전시킬 수 있습니다.

함께 사용하면 강력한 콤보를 이룹니다: STEM Forged는 탐지 프로세스에 정확성과 신뢰성을 제공하고, Undetectable AI는 콘텐츠를 다듬고, 검증하고, 강화하는 스마트한 방법을 제공합니다.

다음은 광범위한 검토 스택에서 STEM Forged를 보완하는 몇 가지 감지할 수 없는 AI 도구입니다:

1 - AI 탐지기

The 감지할 수 없는 AI 탐지기 를 #1 포브스 선정 최고의 AI 탐지기.

클릭 한 번으로 ChatGPT, Gemini, Claude, Llama 등과 같은 AI가 작성한 텍스트인지 확인할 수 있습니다.

최근에는 감지할 수 없는 AI 탐지기가 ZDNet 리뷰 는 AI가 생성한 콘텐츠를 100%의 정확도로 일관되게 플래그를 지정하는 몇 안 되는 도구 중 하나로 꼽힙니다.

스템 포지드 vs GPT제로: 어떤 AI 탐지기가 더 낫나요? 스템 포지드

출처: 데이비드 게워츠/ZDNET

이 도구가 효율적인 이유는 다음과 같습니다:

무료입니다: 처음에는 비용을 지불할 필요가 없습니다. 동일한 강력한 AI 탐지 기능을 무료로 이용할 수 있습니다.
여러 감지기의 결과를 표시합니다: 이 도구는 하나의 감지기가 아닌 여러 개의 AI 감지기로 텍스트를 한 번에 검사합니다.
전문가들이 신뢰합니다: 전 세계 기업(포브스, 버즈피드, USA 투데이 등)과 전문가들이 사용하는데, 그 이유는 잘 작동하고 사용자의 정보를 안전하게 보호해 주기 때문입니다.
다양한 언어로 작동합니다: 텍스트가 다른 언어로 되어 있어도 걱정하지 마세요! 이 도구는 여러 언어로 된 콘텐츠를 확인할 수 있습니다.

간편한 사용: 이 도구는 심플한 디자인으로 되어 있어 기술에 대해 잘 모르더라도 누구나 사용할 수 있습니다.
매우 정확합니다: 포브스와 같은 유명 언론 매체에서도 그 정확성에 대해 찬사를 보냈습니다.

버즈피드에서도 이 도구를 검토하면서 다음과 같이 언급했습니다:

"감지할 수 없는 AI는 AI가 생성한 콘텐츠를 더욱 인간답게 만드는 데 앞장서고 있으며, 더 널리 채택되고 수용될 수 있는 길을 열어주고 있습니다."

2 - AI 표절 검사기

The AI 표절 검사기 는 학생, 교사, 기업 등 누구에게나 100%만의 독창적인 글쓰기를 보장합니다.

이 도구는 완전 무료이며 빠르고 효과적입니다.

작동 방식은 다음과 같습니다:

확인하려는 텍스트를 복사합니다.
도구에 붙여넣습니다.
"AI 표절 확인"을 클릭합니다.

3 - AI 이미지 검출기

The AI 이미지 디텍터 를 사용하면 로그인이나 워터마크 없이도 이미지가 AI에 의해 생성된 것인지 사람이 만든 것인지 즉시 식별할 수 있습니다.

주요 이미지 형식을 지원하며 Midjourney, DALL-E, Stable Diffusion과 같은 도구에서 콘텐츠를 감지하도록 훈련된 최첨단 모델을 사용합니다.

사용 방법은 다음과 같습니다:

이미지를 업로드하거나 도구로 끌어다 놓습니다.
'감지'를 클릭하여 이미지를 분석하여 AI가 생성한 패턴을 확인합니다.
신뢰도 점수 및 탐지 설명 검토
결과를 다운로드하거나 몇 초 안에 다른 이미지를 사용해 보세요.

최종 평결: 어느 쪽이 더 낫나요?

모든 논의가 끝난 후, 진짜 질문은 어떤 것이 더 나은가 하는 것입니다.

두 도구 모두 견고하며, 글쓰기를 확인하고, AI 콘텐츠를 발견하고, 작업물을 보호하는 등 본연의 역할을 충실히 수행합니다.

하지만 STEM Forged가 앞장서고 있습니다. 더 정확하고 테스트 성능이 뛰어나며 신뢰할 수 있는 AI 탐지 도구를 찾는 사용자들에게 최고의 선택입니다.

인공지능과 인간 콘텐츠를 모두 처리하는 데 있어 GPTZero가 따라올 수 없는 수준의 자신감을 가지고 있습니다.

다음과 함께 사용할 경우 감지할 수 없는 AI를 사용하면 조합이 더욱 강력해집니다.

이 조합은 모든 기본을 포괄하여 글쓰기가 진정성 있고 안전하며 명확하게 느껴지도록 합니다.

무거운 작업은 인공지능에게 맡기고 글쓰기에 집중하세요.

결국 가장 중요한 것은 단순히 시험에 합격하는 것이 아니라 실력을 갖추는 것이기 때문입니다.