Czy detektory AI są dokładne? Prawda kryjąca się za narzędziami

Każde narzędzie do wykrywania sztucznej inteligencji, z którym można się dziś zetknąć, prawdopodobnie pochwali się śmiałym twierdzeniem, że jest > 95% dokładne. Niektóre nawet twierdzą, że są niezawodne w 100%!

Ale czy detektory AI są dokładne? Naprawdę?

Modele sztucznej inteligencji są stale aktualizowane. Na przykład obecna wersja ChatGPT jest znacznie bardziej zniuansowana i świadoma kontekstu niż wersja, którą widzieliśmy w 2022 roku.

Jest więc całkiem naturalne, że wiele detektorów AI będzie miało trudności z dokładnym oznaczeniem tekstu jako wygenerowanego przez AI.

Niektóre narzędzia są jednak niezaprzeczalnie lepsze od innych. Aby jednak dowiedzieć się, które z nich rzeczywiście spełniają swoje oczekiwania, należy je przetestować.

Dokładnie to zrobiliśmy w tym artykule.

Oceniliśmy 10 najpopularniejszych detektorów AI w tym samym teście porównawczym używanym przez ZDNet, aby sprawdzić, jak dokładne są detektory AI.

Oto, co znaleźliśmy!

Kluczowe wnioski

Detektory AI analizują częstotliwość występowania słów, odmianę zdań i składnię, aby określić, czy tekst został napisany przez człowieka, czy wygenerowany przez AI.

Wykrywanie AI przez wiele narzędzi nie jest niezawodne, ponieważ wiele tekstów pisanych przez ludzi i AI ma te same struktury gramatyczne, co prowadzi do fałszywych wyników pozytywnych i negatywnych.

Trzy główne techniki dokładnego wykrywania treści AI to statystyczne modelowanie języka, metadane i znaki wodne oraz klasyfikatory uczenia maszynowego

Undetectable AI łączy wiele algorytmów wykrywania w jeden sfederowany system. Oferuje bezpłatne i niezawodne wykrywanie AI bez typowych kompromisów płatnych narzędzi.

Czy detektory sztucznej inteligencji są dokładne? Czy detektory sztucznej inteligencji są dokładne?

Czym są detektory sztucznej inteligencji i jak działają?

Detektory AI to narzędzia, które określają, czy dany fragment tekstu został napisany przez człowieka, czy wygenerowany przez sztuczną inteligencję.

System dzieli tekst na mierzalne cechy, a następnie skanuje w poszukiwaniu wzorców, które ujawniają autorstwo maszyny.

Tekst generowany przez sztuczną inteligencję ma tendencję do podążania za wzorcami statystycznymi. Modele językowe są szkolone w celu przewidywania następnego słowa w sekwencji, więc ich pismo jest zbudowane na prawdopodobieństwach, które tworzą subtelne ślady.

Nigdy więcej nie martw się, że sztuczna inteligencja wykryje twoje teksty. Undetectable AI Może ci pomóc:

Spraw, by pisanie wspomagane przez sztuczną inteligencję wyglądało podobny do człowieka.
Obejście wszystkie główne narzędzia do wykrywania AI za pomocą jednego kliknięcia.
Użycie AI bezpiecznie i pewnie w szkole i pracy.

Wypróbuj ZA DARMO

Detektory AI wychwytują te ślady poprzez analizę częstotliwości słów, różnorodności w strukturze zdań, złożoności składni i ogólnej losowości (lub jej braku) we frazowaniu.

Dwa najważniejsze wskaźniki wykorzystywane przez detektory AI to:

Zakłopotanie: Jest to miara tego, jak bardzo model jest "zaskoczony" następnym słowem w zdaniu. Ludzkie pismo zwykle wykazuje wyższy poziom zakłopotania, ponieważ ludzie odbiegają od wzorców, używają idiomów, wprowadzają emocje itp. Pismo generowane przez sztuczną inteligencję.

Rozerwanie: Mierzy zmienność długości i rytmu zdań. Ludzie naturalnie piszą krótkimi, długimi i nierównymi zdaniami, podczas gdy treści pisane przez sztuczną inteligencję są spójne pod względem długości.

Dlaczego wykrywanie sztucznej inteligencji jest tak trudne?

Pomimo różnic między pisaniem przez człowieka i sztuczną inteligencję, wykrywanie tekstu wygenerowanego przez sztuczną inteligencję jest nieco trudne, zwłaszcza gdy został on edytowany.

Oto kilka powodów.

Podobieństwo między pisaniem przez człowieka i sztuczną inteligencję

Pisanie w swojej istocie, zarówno ludzkie, jak i pisane przez sztuczną inteligencję, wykorzystuje ten sam system językowy gramatyki, czasów, składni i frazowania.

Modele AI nie wymyślają języka od zera.

Po prostu uczą się na podstawie tego, co ludzie już napisali w latach poprzedzających ich rozwój.

Zbiory danych, na których są szkolone, są z natury pisane przez człowieka.

Tak więc każde dobrze rozwinięte narzędzie do generowania sztucznej inteligencji zinternalizuje ludzkie wzorce ekspresji i spróbuje je odtworzyć.

Im więcej danych konsumują, tym bardziej "ludzkie" staje się ich pisanie.

Fałszywie pozytywne i fałszywie negatywne wyniki

Detektory AI nie są nieomylne.

Fałszywy wynik pozytywny występuje, gdy tekst napisany przez człowieka jest nieprawidłowo oznaczony jako wygenerowany przez sztuczną inteligencję.

W przeciwieństwie do tego, fałszywy wynik negatywny ma miejsce, gdy tekst napisany przez sztuczną inteligencję pozostaje niewykryty.

Oba te błędne oznaczenia są dość powszechne.

Ponieważ wiele detektorów AI opiera się na statystycznym prawdopodobieństwie, a nie na faktycznej pewności, ich dokładność pozostaje ograniczona.

Stała ewolucja modelu

Wykrywanie sztucznej inteligencji jest ruchomym celem. Każda nowa generacja modeli językowych staje się trudniejsza do wykrycia.

Kiedy ChatGPT został po raz pierwszy wprowadzony do użytku publicznego w 2022 roku, jego odpowiedzi były powtarzalne, często formułowane.

Każdy dzisiejszy detektor AI z łatwością wychwyciłby tego rodzaju tekst jako napisany przez AI.

Jednak najnowszy model GPT-5 tworzy tekst świadomy kontekstu i inteligentny emocjonalnie.

Ponieważ jakość wyników stale się poprawia, wykrywanie bardziej zróżnicowanego stylistycznie tekstu AI jest wyzwaniem.

Jak dokładne są obecnie detektory sztucznej inteligencji?

Szczera odpowiedź na to pytanie jest taka, że w dużej mierze zależy to od testowanego detektora i metody wykrywania.

Niektóre narzędzia do wykrywania sztucznej inteligencji zapewniają niemal doskonałe wyniki w kontrolowanych warunkach, ale gdy są narażone na dane ze świata rzeczywistego, ich wydajność staje się chaotyczna.

Punkt odniesienia Badanie ZDNet Oceniono 11 detektorów AI na podstawie pięciu próbek tekstu (trzech wygenerowanych przez ChatGPT, dwóch przez ludzi).

Każde narzędzie, które oznaczyło próbkę z prawdopodobieństwem > 70% AI, zostało uznane za "wykonane połączenie".

Badanie wykazało, że Undetectable AI było jednym z niewielu narzędzi, które osiągnęło dokładność 100%, tj. poprawnie oznaczyło wszystkie pięć próbek (zarówno ludzkich, jak i AI) bez błędu.

Ale czy wykrywacze treści AI są również dokładne dla codziennych użytkowników w rzeczywistych warunkach?

Rzecz w tym, że teksty ze świata rzeczywistego rzadko są "czystą sztuczną inteligencją" lub "czystym człowiekiem".

Wiele z nich to edytowane, parafrazowane treści z celowym szumem, a przy takich przeciwnych warunkach dokładność wielu detektorów gwałtownie spada.

A recenzowane badanie Copyleaks, TurnItIn i Originality wykazały, że chociaż "mają wysoką dokładność" w odniesieniu do GPT-3.5 i treści ludzkich, mają trudności z rozróżnieniem wyników na poziomie GPT-4.

Porównanie 10 najlepszych wykrywaczy AI

Teraz, aby dowiedzieć się, jakie są najdokładniejsze detektory sztucznej inteligencji, przetestowaliśmy kilka narzędzi przy użyciu metody oceny ZDNet, tj. przy użyciu łącznie pięciu próbek tekstu: trzech napisanych przez ChatGPT i dwóch przez ludzi.

Oto jedna próbka ChatGPT i jedna próbka napisana przez człowieka, której użyliśmy.

ChatGPT Tekst:

Tekst pisany przez człowieka:

Niewykrywalna sztuczna inteligencja

Pierwszym testowanym przez nas narzędziem było Niewykrywalna sztuczna inteligencjai przeszedł wszystkie testy.

Wszystkie pięć próbek tekstu zostało poprawnie zidentyfikowanych jako 100% napisane przez człowieka lub napisane przez sztuczną inteligencję.

Platforma pokazywała nawet wskaźniki, w przypadku których inne detektory mogły podnieść flagi.

System wykorzystuje wiele algorytmów wykrywania wzorowanych na wielu różnych modelach sztucznej inteligencji (ChatGPT, Gemini, Claude, Llama i inne), ale zamiast polegać bezpośrednio na tych modelach, zbudowali własny system oparty na federacji i konsensusie.

Zasadniczo każdy algorytm jest szkolony na wzorcach z tych detektorów, ale działa niezależnie, aby uzyskać zbiorową ocenę.

Undetectable AI twierdzi również, że "humanizuje" tekst generowany przez sztuczną inteligencję, aby uniknąć wykrycia, a z naszych wyników wynika, że twierdzenie to utrzymało się imponująco dobrze.

GPTZero

Następnie przetestowaliśmy GPTZero, które również spełniło nasz benchmark dokładności i uzyskało wynik powyżej progu 80% we wszystkich pięciu próbkach.

Prawidłowo zidentyfikował zarówno fragmenty napisane przez człowieka, jak i dwa teksty wygenerowane przez sztuczną inteligencję z pewnością 100%.

Jedynym wyjątkiem była jedna próbka wygenerowana przez sztuczną inteligencję, którą GPTZero oznaczył jako wygenerowaną przez sztuczną inteligencję 71%, ale która nadal mieści się w dokładnym zakresie według naszych kryteriów.

Copyleaks

Copyleaks osiągnął mieszane wyniki w naszych testach. Potknął się zaraz po wyjściu z bramki, błędnie klasyfikując pierwszą próbkę napisaną przez człowieka jako 100% wygenerowaną przez sztuczną inteligencję.

Oznaczono nawet dziewięć tak zwanych "nadużywanych fraz AI".

Jednak każdy kolejny test był dokładny, tj. identyfikował każdy tekst w pozostałych czterech próbkach.

Ta niespójność wskazuje na to, że Copyleaks może czasami popadać w skrajności, tak jak miało to miejsce w przypadku naszej próbki napisanej przez człowieka.

Mimo to, patrząc na wszystkie testy, średnia dokładność wyniosła około 80%.

Quillbot

QuillBot był kolejnym wyróżniającym się narzędziem w naszych testach, zaraz za Undetectable AI. Było to drugie narzędzie, które zidentyfikowało każdy utwór napisany przez człowieka i wygenerowany przez sztuczną inteligencję z dokładnością 100%.

Warto zauważyć, że QuillBot był pierwotnie znany ze swoich możliwości parafrazowania.

Ale jego detektor AI jest również wyrafinowanym narzędziem analitycznym zdolnym do wskazania spójności językowej, która zdradza autorstwo AI.

Warto również zauważyć, że Quillbot nie był zbyt dokładny w pierwszych dniach swojej premiery, ale z biegiem lat zdecydowanie się poprawił. Obecnie jest to jeden z niewielu niezawodnych detektorów AI, jakie można znaleźć.

ZeroGPT

Wyniki testów ZeroGPT również wykazały dobrą spójność.

Pierwsza próbka napisana przez człowieka została oznaczona jako 0% wygenerowana przez sztuczną inteligencję, a druga jako 9,44% wygenerowana przez sztuczną inteligencję, co w obu przypadkach mieści się w akceptowalnym zakresie dla prawdziwego ludzkiego pisma.

Z drugiej strony, wszystkie trzy próbki wygenerowane przez AI zostały poprawnie zidentyfikowane jako 100% napisane przez AI.

Tak więc nasza runda testów dodaje ZeroGPT do listy niezawodnych detektorów AI.

Grammarly

Grammarly jest powszechnie znaną marką, jeśli chodzi o pomoc pisarzom w tworzeniu poprawnych gramatycznie treści, ale nie można powiedzieć tego samego o jej możliwościach wykrywania AI.

W naszych testach wykrywacz Grammarly wykazał mieszane i nieco niespójne wyniki.

W przypadku próbek wygenerowanych przez sztuczną inteligencję oznaczył je jako 92%, 81% i 54% wygenerowane przez sztuczną inteligencję, co oznacza, że poprawnie zidentyfikował dwa, ale nie zdał jednego testu, niedoszacowując prawdopodobieństwa sztucznej inteligencji.

W przypadku tekstów napisanych przez ludzi, jeden z nich był poprawny, a drugi błędnie sklasyfikowany jako sztuczna inteligencja.

Można więc powiedzieć, że 60% był dokładny w naszej analizie.

Oryginalność.ai

Originality.ai był również jednym z bardzo niezawodnych detektorów AI, ponieważ poprawnie skanował zarówno te wygenerowane przez AI, jak i te napisane przez człowieka, dając wynik 100%.

Originality.ai to dedykowana sztuczna inteligencja i platforma do wykrywania plagiatu. Analizuje ona teksty na poziomie szczegółowym i została niezależnie przetestowana pod kątem wychwytywania parafrazowanych i edytowanych treści.

Jedynym haczykiem związanym z Originality.ai jest to, że nie jest on całkowicie darmowy.

Platforma oferuje 12 000 znaków dla nowych użytkowników, po czym dodatkowe skany działają w systemie kredytowym.

Cena detektora AI wynosi 2000 kredytów (1 kredyt równa się 100 słowom) za $14,95 miesięcznie.

Writer.com

Writer.com nie do końca spełnił oczekiwania w zakresie wykrywania sztucznej inteligencji, mimo że ma całkiem niezłą nazwę do tworzenia tekstu generowanego przez sztuczną inteligencję.

Spośród pięciu próbek tekstu błędnie zidentyfikował 2 próbki napisane przez sztuczną inteligencję jako napisane przez człowieka.

Oznacza to, że tylko trzy z pięciu wyników testów były dokładne, co jest wyraźnym błędem.

Writer.com ogłosił również, że jego narzędzie do wykrywania sztucznej inteligencji, wraz z punktem końcowym API, zostanie wyłączone 22 grudnia.

Do tego czasu będzie działać jak zwykle. Pokazuje to, że firma odchodzi od przestrzeni wykrywania AI.

Monika

Było to kolejne z tych narzędzi, które wypadło naprawdę dobrze podczas testów.

Monica poprawnie zidentyfikowała każdą próbkę napisaną przez człowieka i wygenerowaną przez sztuczną inteligencję bez jednego błędu, więc możesz bezpiecznie dodać ją do swojej listy niezawodnych detektorów AI.

Firma twierdzi, że łączy mocne strony analityczne AI ZeroGPT, GPTZero i Copyleaks w jednym zunifikowanym narzędziu.

System jest podobny do Niewykrywalna sztuczna inteligencja, która również łączy wiele detektorów w celu autentycznego wykrywania sztucznej inteligencji.

Sapling AI Detector

Sapling nie okazał się niezawodnym wykrywaczem AI, ponieważ nie udało mu się zidentyfikować wszystkich pięciu próbek tekstu.

Spośród naszych próbek Sapling zidentyfikował 2 treści napisane przez człowieka jako 100% AI, co jest dalekie od normy.

Ale to, co najbardziej wyróżnia Sapling, to jego przejrzystość. Firma otwarcie przyznaje, że jej detektor AI może generować fałszywe alarmy w przypadku krótkich tekstów.

Stwierdza również, że aktywnie pracuje nad ulepszeniem systemu, aby zmniejszyć liczbę takich błędów.

Wyjaśniają również, że żaden obecny detektor sztucznej inteligencji, w tym Sapling, nie powinien być używany jako samodzielna metoda określania autorstwa.

Użyj AI Checker aby przeanalizować, jak niezawodne są inne detektory sztucznej inteligencji.

Testując przykładowy tekst za pomocą wielu narzędzi wykrywających i porównując wyniki spójności, AI Checker pomaga ujawnić, które systemy błędnie oznaczają lub nadmiernie oznaczają treści.

Jest to szybki i przejrzysty sposób na zmierzenie dokładności detektora przed zaufaniem jego wynikom.

Wyjaśnienie popularnych metod wykrywania sztucznej inteligencji

Wykrywanie AI nie opiera się na jednej uniwersalnej formule.

Zastosowano i zweryfikowano kilka metod określania, czy dany fragment tekstu został napisany przez człowieka, czy przez sztuczną inteligencję.

Statystyczne modelowanie języka

Jest to najstarsza i najczęściej stosowana metoda wykrywania treści AI. Opiera się na analizie prawdopodobieństwa sekwencji słów, tj. prawdopodobieństwa, że jedno słowo nastąpi po drugim.

Tekst generowany przez sztuczną inteligencję ma zwykle niższą "złożoność", więc można powiedzieć, że jest bardziej przewidywalny i spójny pod względem struktury.

Z drugiej strony, ludzie wprowadzają zmienność do tekstu.

Detektory treści wykorzystujące tę metodę obliczają złożoność i rozerwanie, aby ocenić ich pochodzenie.

Metadane i znak wodny

Wskaźniki te dotyczą sposobu generowania tekstu, a nie jego struktury.

Znak wodny oznacza osadzanie niewidocznych sygnałów w danych wyjściowych sztucznej inteligencji na poziomie tokenu. Zasadniczo wzorce te mogą być wykrywane tylko przez określone algorytmy.

Wykrywanie metadanych sprawdza dane kontekstowe, takie jak znaczniki czasu, szybkość generowania i wzorce wywołań API, aby wywnioskować, czy sztuczna inteligencja była zaangażowana w proces pisania.

Ale ponownie, gdy tekst generowany przez sztuczną inteligencję jest edytowany, sygnały te są tracone, a zatem działają tylko w kontrolowanych środowiskach testowych.

Gdy tekst wygenerowany przez sztuczną inteligencję zawiera niewidoczne znaki wodne, narzędzia takie jak Undetectable AI's Narzędzie do usuwania tekstowych znaków wodnych AI może pomóc oczyścić te ukryte wzorce.

Zrzut ekranu z narzędzia Undetectable AI do usuwania znaków wodnych AI

Wykrywa i usuwa odciski na poziomie tokenów, przywracając naturalną czytelność tekstu bez zmiany jego znaczenia.

Klasyfikatory uczenia maszynowego

Detektory AI w coraz większym stopniu opierają się na klasyfikatorach uczenia maszynowego wyszkolonych do rozpoznawania "tekstury" pisma AI.

Klasyfikatory te analizują tysiące cech językowych i strukturalnych zarówno zbiorów danych napisanych przez ludzi, jak i wyprodukowanych przez sztuczną inteligencję.

W oparciu o tę analizę opracowują model probabilistyczny, aby oznaczyć nowy tekst jako sztuczną inteligencję, człowieka lub hybrydę.

Siłą tego podejścia jest to, że klasyfikatory stale nadążają za zmianami w podejściu nowszych generatywnych modeli sztucznej inteligencji.

Wypróbuj nasz AI Detector i Humanizer w widżecie poniżej!

Wnioski

Odpowiadając na pytanie: "Czy detektory AI są dokładne?" Tak, kilka narzędzi jest niezawodnie dokładnych, a Undetectable AI jest jednym z nich.

Osiągnął dokładność 100% w każdej próbce testowej napisanej przez sztuczną inteligencję i człowieka.

Narzędzie jest również bezpłatne, w przeciwieństwie do wielu innych detektorów AI, które ukrywają swoje najlepsze funkcje za paywallami lub systemami opartymi na kredytach.

Przewagą Undetectable AI jest federacyjny model wykrywania, który łączy mocne strony wielu wiodących detektorów w jeden, ujednolicony system.

Wielowarstwowe podejście znacznie zmniejsza liczbę fałszywych alarmów i fałszywych alarmów negatywnych.

Jeśli więc szukasz niezawodnego detektora AI, Niewykrywalna sztuczna inteligencja jest tym, który warto wypróbować!