인공지능 탐지기에 걸리지 않고 콘텐츠를 작성할 수 있나요?
공정한 질문입니다.
이 글에서는 과학, 코딩, 수학 분야와 관련된 복잡한 작업을 처리하도록 훈련된 모델인 GPT o1에 대해 알아보세요.
하지만 글을 쓸 수 있는지, 그리고 AI 탐지기를 몰래 통과할 수 있는지 여부는 살펴볼 가치가 있습니다.
이 글을 읽고 나면 다음과 같은 내용을 알게 될 것입니다:
- GPT-o1이란 무엇인가요?
- AI 탐지기는 어떻게 작동하나요?
- GPT-o1 콘텐츠를 감지할 수 있나요?
- OpenAI의 o1-mini와 o1-preview는 정말 탐지할 수 없나요?
- GPT-o1으로 AI 탐지기를 우회하는 방법은 무엇인가요?
- GPT-o1과 GPT-4o: 어느 쪽이 더 탐지 가능성이 높나요?
그럼 시작해 보겠습니다.
GPT-o1이란 무엇인가요?
2024년 9월, OpenAI는 더 가볍고 비용 효율적인 o1-mini라는 버전과 함께 GPT-o1-preview를 출시했습니다.
2024년 12월에는 프리뷰 버전이 정식 GPT-o1 모델로 공식 교체되었습니다.
OpenAI에 따르면, GPT-o1은 응답을 생성하기 전에 더 많은 계산 '사고' 시간을 할애하여 매우 복잡한 문제를 해결하도록 만들어졌습니다.
다시는 AI가 내 문자를 감지할까 걱정하지 마세요. Undetectable AI 도움을 드릴 수 있습니다:
- AI 지원 글쓰기 표시하기 사람처럼.
- 바이패스 클릭 한 번으로 모든 주요 AI 탐지 도구를 사용할 수 있습니다.
- 사용 AI 안전하게 그리고 자신 있게 학교와 직장에서
여기에는 경쟁 프로그래밍, 추상 수학, 과학적 추론과 같은 고급 작업도 포함되며, 이 모델은 전문가에 가까운 기교로 처리할 수 있습니다.
그리고 테스트는 이러한 전문성을 입증하는 증거입니다.
벤치마크 테스트에서 o1-preview는 다음과 같이 순위를 매겼습니다. 코드포스의 89번째 백분위수 대회.
에서 미국 초청 수학 시험o1은 83%의 문제를 해결했습니다(12.5/15). 이에 비해 GPT-4o는 13%(1.8/15)를 겨우 풀었습니다.
이 모델은 또한 여러 과학 영역(물리학, 화학, 생물학)에서 박사 수준의 숙련도를 보였습니다.
따라서 이 모델은 주로 연구 및 기술 애플리케이션을 위해 만들어진 것이 분명합니다.
GPT-3.5, GPT-4 및 GPT-4o와의 차이점
GPT-o1의 관점에서 볼 때, GPT-3.5, GPT-4 및 GPT-4o와의 차이점은 작업에 따라 미묘하고 극명하게 드러납니다.
GPT-3.5는 16,385개의 컨텍스트 창(4,096개의 출력 토큰)으로 제한된 구형 데이터 세트에서 작동하며 기본적인 추론과 적절한 코딩 기술을 제공합니다.
일반적인 프롬프트는 잘 처리하지만 중첩된 로직이나 까다로운 알고리즘이 있는 문제를 건네면 금방 한계가 드러납니다.
이에 비해 GPT o1은 다른 인지 등급에서 작동합니다. 따라서 비교는 적절하지 않습니다.
GPT-4는 여전히 견고하고 3.5보다 더 정교하며 특히 뉘앙스가 필요한 작업 등 더 광범위한 작업에서 사용할 수 있습니다. 하지만 o1과 같은 엄격함으로 기술적 복잡성을 파헤치지는 않습니다.
GPT-4o는 속도와 멀티모달 기능을 더욱 개선했지만 심층 분석 작업에서는 여전히 뒤처졌습니다.
더 빠르고, 대화형이며, 범용적으로 사용하기에 더 적합합니다. 현재로서는 창의적인 글쓰기, 채팅 및 멀티미디어 작업을 o1보다 더 잘 처리합니다.
하지만 로직이 많은 사용 사례에 있어서는 o1이 측정 가능한 우위를 점하고 있습니다.
즉, GPT-o1에는 웹 브라우징이나 파일 업로드와 같은 일부 사용자 친화적인 기능이 부족하지만 GPT-4o는 이를 지원합니다.
이 모드도 약간 간결할 수 있습니다. 거부 응답이 더 짧아 4o가 포함하는 경향이 있는 참조나 심층적인 설명을 건너뛰는 경우가 있습니다.
o1의 또 다른 주요 주의 사항은 위험한 쿼리를 처리할 때 위험을 증폭시킬 수 있다는 점입니다.
예를 들어 암벽 등반 기술에 대한 질문을 받았을 때, GPT-o1의 심층적인 참여는 과도한 의존을 조장할 수 있습니다.를 사용하는 반면, GPT-4o는 기본적으로 일반 조언을 사용합니다.
[출처]
기능 | GPT-3.5 | GPT-4 | GPT-4o | GPT o1 |
학습 데이터 | 이전 데이터 세트 | 더 최신의 광범위한 정보 | 최신 정보 | 최신 정보 |
출력 토큰 | 4,096 토큰 | 8,192 토큰 | 16,384 토큰 | 100,000 토큰 |
컨텍스트 창 | 16,385 | 8,192 | 128,000 | 200,000 |
정확성 및 일관성 | Good | 크게 개선됨 | 높음 | 탁월한 |
추론 능력 | 기본 | 고급 | 고급 | 박사급 |
코딩 기술 | 괜찮은 | 능숙한 | 능숙한 | 전문가 수준에 가까운 |
크리에이티브 글쓰기 | 가능 | 더 창의적이고 미묘한 표현 | 빠르고 창의적인 | 불가능 |
응답 속도 | 빠른 | 보통 | 가장 빠른 | 느림(고의적) |
최상의 대상 | 캐주얼 사용 | 일반 작업 | 속도 + 멀티태스킹 | 기술적 깊이 |
AI 탐지기의 작동 방식
AI 탐지기는 GPT 이후 붐이 일면서 점점 더 보편화되고 있습니다.
그 목적은 사람이 쓴 것인지, GPT-o1과 같은 모델이 뱉어낸 것인지 파악하는 것입니다.
이들은 여러 가지 괴상한 지표와 네 가지 주요 머신 러닝 및 NLP 개념을 기반으로 추측을 합니다.
분류기
이러한 감지기의 메인 두뇌를 분류기라고 합니다.
이러한 분류기는 AI 생성 또는 사람이 작성한 것으로 분류된 방대한 데이터 세트를 학습하고 시간이 지남에 따라 두 가지를 구분하는 요소를 학습합니다.
모델이 학습되면 새로운 텍스트 덩어리를 평가하고 AI-인간 스펙트럼에서 해당 텍스트가 어디에 속할지 결정할 수 있습니다.
특정 단어가 얼마나 자주 나타나는지, 문장의 길이가 얼마나 되는지, 전체가 너무 삐걱거리는 소리가 나는지 확인합니다.
임베딩
컴퓨터는 인간과 같은 방식으로 언어를 이해할 수 없기 때문에 임베딩은 단어를 의미, 문맥, 단어 관계를 나타내는 수학적 벡터로 변환합니다.
따라서 감지기가 문장을 분석할 때는 이 다차원 벡터 공간에서 단어가 어디에 있는지, 그리고 그 위치가 사람 또는 AI 출력에서 보이는 패턴과 어떻게 연관되어 있는지 살펴봅니다.
이는 시스템이 '여왕'과 '왕'이 서로 어울리는 단어라는 것을 인식하는 방식입니다.
당혹감
AI 탐지에서 난해성은 글이 얼마나 예측 가능한지를 측정하는 지표입니다.
AI가 생성한 콘텐츠는 논리적으로 흐르고 명확하게 읽히는 텍스트를 만드는 것을 목표로 하기 때문에 난해성이 낮은 경향이 있습니다.
반면에 사람이 직접 쓰는 글은 더 지저분할 수 있습니다. 예측 불가능성, 창의적인 비약 또는 직설적인 이상한 문구가 더 많습니다.
따라서 낮은 난해도 점수는 인공지능이 만든 것이라는 단서가 될 수 있지만, 인간도 가끔은 뻔한 소리를 좋아하기 때문에 절대 단독으로 사용되지는 않습니다.
파열성
버스트니스는 글의 다양성을 측정합니다.
인간 작가는 짧고 간결한 대사와 복잡하고 긴 대사를 자연스럽게 섞어 쓰기 때문에 일반적으로 더 높은 폭발성을 보입니다.
AI는 안전하게 플레이하는 경향이 있습니다. 이상한 우회로를 택하거나 생각하던 도중에 갑자기 궤도를 이탈하지 않습니다. 그래서 더 쉽게 발견할 수 있습니다.
GPT-o1 콘텐츠를 감지할 수 있나요?
Chat GPT o1은 더 이상 무료로 제공되지 않으며 일반 플러스 요금제에도 포함되지 않습니다.
OpenAI의 프로 요금제는 $200부터 시작되는 고가의 요금제로 인상되었습니다.
이제 GPT o1을 직접 테스트할 수 있는 완전한 공개 액세스 권한은 없지만 탐지 가능성에 대한 교육적인 추측을 할 수 있습니다.
OpenAI는 이 모델이 STEM을 염두에 두고 만들어졌다는 점을 분명히 했습니다.
따라서 이를 바탕으로 볼 때, 모델의 인간 필기 모방 능력은 완전히 나쁘지는 않더라도 평균 수준이라고 볼 수 있습니다.
두 개의 유튜브 채널에서 Chat GPT o1 모델, 특히 o1-mini 및 o1-프리뷰의 샘플 결과물을 게시한 덕분에 저희는 인기 있는 탐지 도구를 통해 해당 문자를 실행하고 어떤 종류의 위험 신호가 나타나는지 확인할 수 있었습니다.
OpenAI의 o1-mini와 o1-preview는 정말 탐지할 수 없나요?
YouTube 동영상에서 바로 두 개의 텍스트 샘플을 가져와서 o1-preview와 o1-mini를 통해 프롬프트를 실행했습니다.
이 출력물이 실제로 경보를 울리지 않고 AI 탐지기를 통과할 수 있는지 살펴봅시다.
o1-프리뷰를 감지할 수 있나요?
다음에서 텍스트 샘플을 선택했습니다. 괴짜 소설가의 동영상에서 "트로이의 헬렌"이라는 제목의 짧은 기사를 작성했습니다: 천 척의 배를 발사한 얼굴"이라는 제목의 기사를 작성했습니다.
총 265단어로 구성된 인트로와 처음 두 개의 제목에 집중했습니다.
텍스트를 감지할 수 없는 AI, 퀼봇및 Originality.ai를 사용하여 모든 기본 사항을 다룰 수 있습니다.
탐지할 수 없는 AI는 인상적이지 않았습니다. 99%의 콘텐츠를 AI가 생성한 것으로 표시했고, 거기서 멈추지 않았습니다.
또한 QuillBot, ZeroGPT 및 Grammarly와 같은 다른 탐지기도 동일한 결론을 내릴 것으로 예측했습니다. 이제 QuillBot을 통해 텍스트를 실행하여 이를 확인해 보겠습니다.
퀼봇도 그 뒤를 따랐습니다. 이 텍스트는 100%로 AI일 가능성이 높다고 표시했습니다.
하지만 의심의 여지를 주는 것을 좋아합니다. 텍스트의 다른 부분 위로 마우스를 가져가면 낮음, 보통, 높음과 같은 신뢰 수준을 확인할 수 있습니다.
그리고 Originality.ai가 있습니다. 100%의 확신을 가지고 AI가 작성한 텍스트가 들어왔습니다. 98%가 아니라 99도 아니고 100입니다. 그리고 "아마도"라는 단어도 사용하지 않습니다.
o1-mini를 감지할 수 있나요?
이제 O1-mini에 대해 이야기해 보겠습니다.
여기에 사용한 텍스트는 다음에서 가져온 것입니다. 다른 유튜버 훨씬 더 나은 프롬프트를 사용했습니다. 글에 더 많은 개성과 인간적인 흐름이 있었습니다.
AI 탐지기들도 알아차렸습니다. 퀼봇은 이를 AI 45%, 인간 55%라고 불렀습니다. 사실 꽤 괜찮은 결과입니다.
확인하지 않고 그냥 훑어보기만 하면 사람이 쓴 글이라고 믿을 수도 있습니다.
하지만 너무 안심할 필요는 없습니다. 감지할 수 없는 AI와 Originality.ai는 속지 않았습니다.
둘 다 여전히 각각 99%와 100%의 확실성을 가진 AI라고 불렀습니다. 따라서 더 나은 프롬프트가 있어도 글은 울타리를 넘지 못했습니다.
결론부터 말씀드리겠습니다: OpenAI의 o1-preview와 o1-mini는 확실히 감지할 수 있습니다. 언디텍터블의 AI 탐지기.
프롬프트를 조정하고, 문장을 바꾸고, 여기저기서 도구를 속일 수도 있습니다. 하지만 Chat GPT o1은 여전히 AI 감지로 탐지될 가능성이 높습니다.
GPT-o1으로 AI 탐지기를 우회하는 방법
이제 깔끔하고 빠르며 기이할 정도로 일관성 있는 GPT o1의 새 텍스트를 바로 사용할 수 있게 되었습니다. 훌륭합니다. 하지만 이제 진짜 비결은 사람이 실제로 쓴 것처럼 보이게 만드는 것입니다.
GPT o1이 작업을 완료하면 그대로 게시하면 안 됩니다. 사람이 작성한 것처럼 보이게 만들어야 합니다.
하지만 수동으로 하는 대신 AI 휴머나이저를 통해 할 수 있습니다.
이러한 도구는 로봇처럼 들리는 텍스트를 받아 약간의 인간적인 느낌을 더하는 방법을 알고 있습니다. 탐지기가 해독하기 어려운 종류의 문자를요.
하지만 여기에 문제가 있습니다. 이러한 목적을 위해 텍스트를 '인간화'한다고 약속하지만 결국에는 심하게 재해시된 텍스트처럼 들리게 하는 도구가 꽤 많이 나와 있습니다.
이것이 바로 언디텍터블 AI가 주목받아야 하는 이유입니다.
다음과 같은 도구 제품군 휴머나이저, 스텔스 라이터및 패러프레이저 AI 탐지기가 실제로 어떻게 생각하는지 이해합니다.
- 휴머나이저는 눈에 띄지 않을 정도로 흐름과 문구를 조정합니다.
- 스텔스 작성기는 분류자를 혼란스럽게 하는 핵심 요소인 문장 구조에 변화를 더합니다.
- 그리고 패러프레이저는 원래의 의미를 그대로 유지하면서 텍스트의 모양을 변경합니다.
기본적으로 이러한 도구는 AI의 언어를 알고 있으며, AI를 게임에서 벗어나는 방법을 알고 있습니다.
따라서 글쓰기에 GPT o1을 사용하고 있고 작업물이 사람으로 통과되기를 원한다면 후처리 단계를 건너뛰지 마세요.
탐지 불가능한 AI를 사용하여 조금만 정리해도 탐지 도구를 능가하는 큰 차이를 만들 수 있습니다.
아래 위젯에서 AI 디텍터와 휴머나이저를 바로 만나보세요!
GPT-o1과 GPT-4o: 어느 쪽이 더 탐지 가능성이 높나요?
GPT o1은 수학과 과학에 크게 의존하는 반면, GPT-4o는 언어에 있어서는 조금 더 기교가 있다고 이미 이야기한 바 있습니다. 그렇다면 GPT o1과 4o는 글쓰기에서 어떻게 비교될까요?
먼저 이 프롬프트를 사용하여 GPT 4o를 사용하여 400단어 분량의 콘텐츠를 생성했습니다:
그런 다음 동일한 세 가지 AI 탐지기를 통해 GPT-4o의 출력을 실행했습니다: 감지할 수 없는 AI, QuillBot, Originality.ai.
감지할 수 없는 AI는 99%의 콘텐츠를 AI로 표시했습니다. 꽤나 인상적인 AI 탐지 성능이지 않나요?
그러자 퀼봇이 들어와서 "그렇게 빠르지는 않아요."라고 말했습니다. 동일한 텍스트에 대해 AI가 생성한 것으로 73%를 표시했는데, 이는 45%를 기록한 GPT o1-mini보다 훨씬 더 가혹한 판단이었습니다.
Originality.ai는 여전히 전체 의심 모드에 머물러 있었습니다. 항상 그렇듯이 GPT-4o의 콘텐츠를 100% AI로 클럭했습니다.
그렇다면 이 모든 것이 무엇을 의미할까요? 언디텍터블 AI 및 오리지날리티 AI와 같은 대부분의 인공지능 탐지기는 ChatGPT o1 및 4o 텍스트를 잘 포착합니다.
하지만 점수를 매긴다면 GPT o1이 확실히 더 잘 탐지됩니다. 여러 탐지기에 걸쳐 개선된 프롬프트에도 불구하고 99-100% AI로 일관되게 플래그가 지정되었습니다.
솔직히 말이 되죠. GPT o1은 언어 모델을 위해 만들어진 것이 아닙니다. 문제를 해결하기 위해 만들어진 STEM 우선 모델입니다.
반면에 GPT-4o는 특히 솔리드 프롬프트와 함께 사용할 때 더욱 자연스러운 소리를 내는 방법을 알고 있습니다.
따라서 스텔스가 중요한 글쓰기 작업을 위해 두 가지 중 하나를 선택해야 한다면 레이더를 피할 수 있는 GPT-4o가 더 유리합니다.
최종 결론: GPT-o1을 탐지할 수 있나요?
조사 결과, GPT o1은 탐지 가능하다는 결론을 내렸습니다.
프롬프트 엔지니어링이 제대로 되어 있어도 생성되는 텍스트는 여전히 대부분의 AI 탐지기를 트립합니다.
하지만 솔직히 말해서 글쓰기는 훈련된 업무가 아니었습니다. GPT o1은 방정식 풀기, 코딩, 데이터 분석과 같은 STEM 관련 작업을 위해 만들어졌습니다.
따라서 실제로 사람이 말하는 것처럼 들리는 콘텐츠를 작성하려는 경우 GPT o1은 적합하지 않을 수 있습니다. 언어 유창성이 더 뛰어난 GPT-4o를 사용하거나 감지할 수 없는 AI 콘텐츠 작성을 위해 특별히 제작된 도구를 사용하는 것이 더 좋습니다.
이것이 바로 언디텍터블 AI의 역할입니다.
우리의 AI 휴머나이저 는 자연스럽고 미묘한 차이가 있으며 설득력 있게 들리는 방식으로 콘텐츠를 다시 작성합니다.
블로그 게시물, 에세이, 제품 설명 등 어떤 글을 작성하든 AI 감지 알람을 설정하지 않고도 주제에 맞게 조정됩니다.
알람에 대해 말하자면, 콘텐츠가 실제로 얼마나 감지되는지 테스트하고 싶다면(GPT o1, GPT-4o 또는 다른 모델에서 생성된 것이든 상관없이) AI 감지기는 시장에서 가장 정확한 도구 중 하나입니다.
이제 추측을 건너뛰세요.