Können GPT-o1-Inhalte von KI-Tools erkannt werden?

Kann GPT o1 Inhalte schreiben, ohne von den KI-Detektoren erfasst zu werden?

Das ist eine berechtigte Frage. 

In diesem Artikel erfahren Sie, dass GPT o1 ein Modell ist, das für die Bearbeitung komplexer Aufgaben in den Bereichen Wissenschaft, Codierung und Mathematik trainiert wurde. 

Aber hey, ob es schreiben kann und ob man es an den KI-Detektoren vorbeischmuggeln kann, ist eine Erkundung wert.

Das werden Sie nach der Lektüre dieses Artikels mitnehmen:

  • Was ist GPT-o1?
  • Wie funktionieren AI-Detektoren?
  • Kann der Inhalt von GPT-o1 erkannt werden?
  • Sind OpenAIs o1-mini und o1-preview wirklich unauffindbar?
  • Wie umgeht man AI-Detektoren mit GPT-o1?
  • GPT-o1 vs. GPT-4o: Was ist besser nachweisbar?

Fangen wir also an.

Was ist GPT-o1?

Im September 2024 brachte OpenAI GPT-o1-preview auf den Markt, zusammen mit einer leichteren, kostengünstigeren Variante namens o1-mini. 

Im Dezember 2024 wurde die Vorschauversion offiziell durch das vollständige GPT-o1-Modell ersetzt. 

Laut OpenAI ist GPT-o1 dafür ausgelegt, hochkomplexe Probleme zu lösen, indem es mehr Zeit zum Nachdenken aufwendet, bevor es Antworten generiert. 

Machen Sie sich nie wieder Sorgen, dass KI Ihre Texte erkennt. Undetectable AI Kann Ihnen helfen:

  • Lassen Sie Ihr AI-unterstütztes Schreiben erscheinen menschenähnlich.
  • Bypass alle wichtigen KI-Erkennungstools mit nur einem Klick.
  • Verwenden Sie AI sicher und zuversichtlich in Schule und Beruf.
Kostenlos testen

Dazu gehören fortgeschrittene Aufgaben wie kompetitives Programmieren, abstrakte Mathematik und wissenschaftliches Denken, die das Modell mit nahezu fachmännischer Finesse bewältigen kann.

Und die Tests sind der Beweis für dieses Fachwissen. 

In den Benchmark-Tests rangierte o1-preview unter den 89. Perzentil bei Codeforces Wettbewerbe.

Auf der American Invitational Mathematics Examination (Amerikanische Einladungsprüfung in Mathematik)o1 löste 83% der Probleme (12,5/15). Im Vergleich dazu knackte GPT-4o kaum 13% (1,8/15).

Dieses Modell zeigte auch, dass die Schüler in mehreren wissenschaftlichen Bereichen (Physik, Chemie und Biologie) über einen Doktortitel verfügen.

Es ist also klar, dass das Modell in erster Linie für Forschung und technische Anwendungen gedacht ist.

Unterschiede zu GPT-3.5, GPT-4 und GPT-4o

Aus der Sicht von GPT-o1 sind die Unterschiede zu GPT-3.5, GPT-4 und GPT-4o sowohl subtil als auch deutlich, je nach Aufgabenstellung.

GPT-3.5 arbeitet mit einem älteren Datensatz mit einem begrenzten Kontextfenster von 16.385 Token (4.096 Output-Token) und bietet grundlegende Argumente und gute Programmierkenntnisse. 

Er kommt mit allgemeinen Aufgabenstellungen gut zurecht, aber wenn man ihm ein Problem mit verschachtelter Logik oder einem kniffligen Algorithmus stellt, wird man schnell seine Grenzen erkennen.

Im Vergleich dazu arbeitet GPT o1 in einer anderen kognitiven Klasse. Der Vergleich ist also nicht richtig.

GPT-4 ist nach wie vor solide, raffinierter als 3.5 und für ein breiteres Spektrum von Aufgaben geeignet, insbesondere für solche, die Nuancen erfordern. Aber auch es geht nicht mit der gleichen Strenge in die technische Komplexität wie o1. 

GPT-4o hat die Geschwindigkeit und die multimodalen Fähigkeiten weiter verbessert, blieb aber bei tiefgreifenden analytischen Aufgaben zurück.

Es ist schneller, interaktiver und besser für den allgemeinen Gebrauch ausgestattet. Kreatives Schreiben, Chatten und Multimedia-Aufgaben lassen sich damit besser erledigen als mit o1.

Aber wenn es um logiklastige Anwendungsfälle geht, hat o1 einen messbaren Vorsprung. 

Allerdings fehlen dem GPT-o1 einige benutzerfreundliche Funktionen wie das Surfen im Internet oder das Hochladen von Dateien, die das GPT-4o unterstützt.

Der Modus kann auch ein wenig knapp sein. Seine Ablehnungsantworten sind kürzer und übergehen manchmal Verweise oder tiefere Erklärungen, die 4o in der Regel enthält. 

Ein weiterer großer Nachteil von o1 ist, dass es die Risiken bei gefährlichen Abfragen erhöhen kann.

Zum Beispiel bei der Frage nach Klettertechniken, Das eingehende Engagement der GPT-o1 könnte zu einer übermäßigen Abhängigkeit führenwährend GPT-4o standardmäßig einen allgemeinen Ratschlag gibt.

[Quelle]

MerkmalGPT-3.5GPT-4GPT-4oGPT o1
AusbildungsdatenÄlterer DatensatzAktueller & umfangreicherHöchst aktuellHöchst aktuell
Token ausgeben4.096 Wertmarken 8.192 Token 16.384 Wertmarken100.000 Token 
Kontext-Fenster16,3858,192128,000200,000
Genauigkeit und KohärenzGutErheblich verbessertHochAußergewöhnlich
Logische FähigkeitenGrundlegendFortgeschritteneFortgeschrittenePhD-Ebene
KodierfähigkeitenAnständigKompetentKompetentNahezu Expertenniveau
Kreatives SchreibenFähigKreativer und nuancierterSchnell, kreativNicht durchführbar
ReaktionsgeschwindigkeitSchnellMäßigSchnellsteLangsamer (absichtlich)
Am besten fürGelegentliche NutzungAllgemeine AufgabenGeschwindigkeit + MultitaskingTechnische Tiefe

Wie AI-Detektoren funktionieren

KI-Detektoren haben sich im Zuge des Post-GPT-Booms immer mehr durchgesetzt.

Sie dienen dazu, herauszufinden, ob etwas von einer Person geschrieben oder von einem Modell wie GPT-o1 ausgespuckt wurde.

Sie stellen eine Vermutung an, die auf einer Reihe nerdiger Metriken und vier wichtigen Konzepten für maschinelles Lernen und NLP basiert.

Klassifikator

Das Hauptgehirn dieser Detektoren wird als Klassifikator bezeichnet.

Diese Klassifikatoren werden auf riesigen Datensätzen trainiert, die entweder als KI-generiert oder als von Menschen geschrieben gekennzeichnet sind, und lernen mit der Zeit, was die beiden unterscheidet.

Sobald das Modell trainiert ist, kann es einen neuen Textabschnitt bewerten und entscheiden, wo er wahrscheinlich auf dem KI-Mensch-Spektrum liegt.

Es wird geprüft, wie oft bestimmte Wörter vorkommen, wie lang die Sätze sind und ob das Ganze zu sauber klingt.

Einbettungen

Da Computer Sprache nicht so erfassen können wie wir, werden Wörter durch Einbettungen in mathematische Vektoren umgewandelt, die Bedeutung, Kontext und Wortbeziehungen darstellen.

Wenn ein Detektor also einen Satz analysiert, untersucht er, wo sich die Wörter in diesem mehrdimensionalen Vektorraum befinden und wie sich ihre Positionen zu Mustern verhalten, die entweder in menschlichen oder KI-Ausgaben zu sehen sind.

So weiß das System, dass "Königin" und "König" zusammengehören.

Perplexität

Bei der KI-Erkennung ist die Perplexität ein Maß dafür, wie vorhersehbar ein Schriftstück ist.

KI-generierte Inhalte sind in der Regel weniger verwirrend, da sie darauf abzielen, einen logischen Textfluss und eine klare Lesbarkeit zu gewährleisten. 

Das menschliche Schreiben hingegen kann chaotischer sein. Es ist reicher an Unvorhersehbarkeit, kreativen Sprüngen oder einfach nur seltsamen Formulierungen. 

Ein niedriger Perplexitätswert kann also ein Hinweis darauf sein, dass etwas von einer KI stammt, aber er wird nie isoliert verwendet, denn auch Menschen klingen manchmal gerne einleuchtend.

Burstiness

Burstiness misst, wie viel Abwechslung Ihr Text bietet. 

Menschliche Autoren weisen in der Regel eine höhere Sprunghaftigkeit auf, weil wir von Natur aus zwischen kurzen, knappen Zeilen und ausufernden, komplexen Zeilen wechseln.

KI tendiert dazu, auf Nummer sicher zu gehen. Sie nimmt keine seltsamen Umwege oder springt plötzlich mitten im Gedanken ab. Und das macht es einfacher, sie zu erkennen.

Kann der Inhalt von GPT-o1 erkannt werden?

Chat GPT o1 ist nicht mehr kostenlos erhältlich und auch nicht mehr Teil des regulären Plus-Tarifs. 

Es wurde auf den Pro-Tarif von OpenAI aufgestockt, der bei $200 beginnt.

Auch wenn wir keinen uneingeschränkten öffentlichen Zugang haben, um GPT o1 selbst zu testen, können wir dennoch eine fundierte Vermutung über seine Nachweisbarkeit anstellen.

OpenAI hat ziemlich deutlich gemacht, dass dieses Modell mit MINT im Hinterkopf entwickelt wurde. 

Auf dieser Grundlage kann man davon ausgehen, dass die Fähigkeit des Modells, menschliche Schrift nachzuahmen, eher durchschnittlich, wenn nicht sogar schlecht ist.

Dank einiger YouTube-Kanäle, die Beispielausgaben von Chat GPT o1-Modellen - insbesondere o1-mini und o1-preview - gepostet haben, konnten wir diese Texte durch gängige Erkennungstools laufen lassen und sehen, welche roten Fahnen auftauchen.

Sind OpenAIs o1-mini und o1-preview wirklich unauffindbar?

Wir haben zwei Textbeispiele direkt aus YouTube-Videos entnommen, in denen Aufforderungen durch o1-preview und o1-mini liefen.

Mal sehen, ob ihre Ergebnisse tatsächlich an den KI-Detektoren vorbeigehen können, ohne Alarm zu schlagen.

Ist o1-preview auffindbar?

Wir haben eine Textprobe aus einer Video von The Nerdy Novelistwo das Modell o1-preview einen kurzen Artikel mit dem Titel "Helena von Troja: Das Gesicht, das Tausende von Schiffen zu Wasser ließ". 

Wir konzentrierten uns auf die Einleitung und die ersten beiden Überschriften, die insgesamt 265 Wörter umfassten.

Wir haben den Text in Nicht nachweisbare AI, QuillBot, und Originalität.ainur um alle Bereiche abzudecken.

Undetectable AI war nicht beeindruckt. Sie kennzeichnete 99% der Inhalte als KI-generiert und hörte damit nicht auf.

Außerdem wurde vorhergesagt, dass andere Detektoren wie QuillBot, ZeroGPT und Grammarly zu demselben Ergebnis kommen würden. Bestätigen wir dies also, indem wir den Text durch QuillBot laufen lassen.

QuillBot folgte diesem Beispiel. Er kennzeichnete den Text als 100% wahrscheinlich AI. 

Aber sie gibt gerne einen Vertrauensvorschuss. Sie können mit dem Mauszeiger über verschiedene Teile des Textes fahren und die Vertrauensstufen sehen: niedrig, mittel, hoch. 

Und dann ist da noch Originality.ai. Es kam mit 100% Vertrauen, dass der Text KI-geschrieben wurde. Nicht 98%. Nicht 99. 100. Und es verwendet nicht einmal das Wort "wahrscheinlich".

Ist o1-mini nachweisbar?

Lassen Sie uns nun über o1-mini sprechen. 

Der Text, den wir hier verwendet haben, stammt aus ein anderer YouTuber der eine viel bessere Aufforderung verwendet hat, und das zeigt sich. Der Text hatte mehr Persönlichkeit und einen menschlicheren Fluss.

Die KI-Detektoren haben es auch bemerkt. QuillBot nannte hier etwa 45% KI, 55% Mensch. Das ist eigentlich ein ordentliches Ergebnis.

Wenn Sie es nur kurz lesen würden, ohne es zu überprüfen, könnten Sie sogar glauben, dass ein Mensch es geschrieben hat.

Aber machen Sie es sich nicht zu bequem. Unerkennbare KI und Originality.ai haben sich nicht täuschen lassen.

Beide nannten es immer noch AI mit 99% bzw. 100% Gewissheit. Selbst mit einer besseren Eingabeaufforderung konnte die Schrift also nicht über den Zaun gebracht werden.

Was uns zum Fazit bringt: OpenAIs o1-preview und o1-mini sind definitiv auffindbar, besonders wenn Sie eine Der AI-Detektor von Undetectable

Sie können Ihre Eingabeaufforderung optimieren, Ihre Sätze umformulieren und vielleicht sogar hier und da ein Tool überlisten. Aber Chat GPT o1 hat immer noch hohe Chancen, als KI-Erkennung erkannt zu werden.

Umgehung von AI-Detektoren mit GPT-o1

Sie haben also Ihren glänzenden neuen Text direkt von GPT o1 bekommen - sauber, schnell und unheimlich kohärent. Großartig. Aber jetzt kommt der eigentliche Trick: Er muss so aussehen, als hätte ihn ein Mensch geschrieben. 

Wenn GPT o1 seine Arbeit getan hat, kann man es nicht einfach roh veröffentlichen. Es muss so aussehen, als ob ein Mensch es geschrieben hätte.

Aber anstatt dies manuell zu tun, können Sie es durch KI-Humanizer tun. 

Diese Tools verstehen es, roboterhaft klingenden Text mit ein wenig menschlicher Verrücktheit zu versehen. Die Art, die Detektoren nur schwer entschlüsseln können.

Aber hier ist das Problem. Es gibt eine ganze Reihe von Tools für diesen Zweck, die versprechen, Ihren Text zu "vermenschlichen", ihn aber am Ende wie einen schlecht aufbereiteten Text klingen lassen.

Aus diesem Grund verdient die unerkennbare KI etwas Aufmerksamkeit.

Unser Angebot an Tools wie Humanizer, Stealth Writer, und Paraphrasierer tatsächlich verstehen, wie KI-Detektoren denken. 

  • Humanizer optimiert den Fluss und die Formulierungen gerade so weit, dass sie nicht auffallen. 
  • Stealth Writer sorgt für Variation in der Satzstruktur, was für die Verwirrung der Klassifizierer entscheidend ist. 
  • Und der Paraphraser formt den Text um, wobei die ursprüngliche Bedeutung erhalten bleibt.

Im Grunde kennen diese Tools die Sprache der KI und wissen, wie man sie aus dem Konzept bringt.

Wenn Sie also GPT o1 zum Schreiben verwenden und wollen, dass Ihre Arbeit als menschlich durchgeht, sollten Sie den Nachbearbeitungsschritt nicht auslassen.

Selbst eine kleine Bereinigung mit Undetectable AI kann einen großen Unterschied machen, wenn es darum geht, Erkennungstools zu schlagen.

Entdecken Sie unseren AI-Detektor und Humanizer direkt im Widget unten!

GPT-o1 vs. GPT-4o: Was ist besser nachweisbar?

Wir haben bereits darüber gesprochen, dass GPT o1 stark auf Mathematik und Naturwissenschaften ausgerichtet ist, während GPT-4o etwas mehr Finesse in Bezug auf Sprache hat. Aber wie sieht der Vergleich zwischen GPT o1 und 4o beim Schreiben aus?

Zunächst haben wir diese Aufforderung genutzt, um mit GPT 4o 400 Wörter Inhalt zu erstellen:

Dann haben wir die Ausgabe von GPT-4o durch die gleichen drei KI-Detektoren laufen lassen: Unerkennbare KI, QuillBot und Originality.ai.

Unerkennbare KI hat 99% der Inhalte als KI gekennzeichnet. Das ist doch eine beeindruckende KI-Erkennung, oder?

Dann meldete sich QuillBot und sagte: "Nicht so schnell". Er stufte 73% desselben Textes als KI-generiert ein, ein noch härteres Urteil als für GPT o1-mini, das er mit 45% bewertete.

Originality.ai befand sich immer noch im Modus "Voller Verdacht". Der Inhalt von GPT-4o wurde wie immer mit 100% AI gemessen.

Was bedeutet das also alles? Die meisten KI-Detektoren wie Undetectable AI und Orginality AI sind gut im Erkennen von ChatGPT o1 und 4o Text.

Aber wenn es um die Bewertung geht, ist GPT o1 eindeutig besser zu erkennen. Bei mehreren Detektoren wurde es durchgängig bei 99-100% AI angezeigt, selbst bei verbesserter Eingabeaufforderung. 

Und ehrlich gesagt, macht das auch Sinn. Das GPT o1 wurde nicht als Sprachmodell konzipiert. Es ist ein MINT-Modell, das in erster Linie dazu dient, Probleme zu lösen. 

Das GPT-4o hingegen weiß, wie man natürlicher klingt, insbesondere in Verbindung mit einem soliden Souffleur.

Wenn Sie also bei Schreibaufgaben, bei denen es auf Unauffälligkeit ankommt, zwischen den beiden wählen müssen, ist das GPT-4o die bessere Wahl, um am Radar vorbeizukommen.

Abschließendes Urteil: Ist GPT-o1 nachweisbar?

Unsere Ergebnisse zeigen: Ja, GPT o1 ist nachweisbar. 

Selbst mit einer guten Souffleurtechnik stört der Text, den er erzeugt, die meisten KI-Detektoren. 

Aber um ehrlich zu sein, war das Schreiben nicht die Aufgabe, für die es ausgebildet wurde. Der GPT o1 wurde für MINT-bezogene Aufgaben wie das Lösen von Gleichungen, das Programmieren und die Verarbeitung von Daten entwickelt.

Wenn Sie also versuchen, Inhalte zu erstellen, die tatsächlich menschlich klingen, ist GPT o1 wahrscheinlich nicht das richtige Modell dafür. Sie sind besser dran, wenn Sie GPT-4o verwenden, das über mehr Sprachgewandtheit verfügt, oder noch besser, wenn Sie ein Tool verwenden, das speziell für das Schreiben von nicht nachweisbaren KI-Inhalten entwickelt wurde.

An dieser Stelle kommt Undetectable AI ins Spiel. 

Unser AI Humanizer schreibt Ihre Inhalte so um, dass sie natürlich, nuanciert und überzeugend menschlich klingen. 

Ganz gleich, ob Sie Blogbeiträge, Aufsätze oder Produktbeschreibungen schreiben, es passt sich an Ihr Thema an, ohne dass die KI-Erkennung Alarm schlägt.

Apropos Alarm: Wenn Sie testen möchten, wie auffindbar Ihre Inhalte wirklich sind (egal, ob sie vom GPT o1, GPT-4o oder einem anderen Modell stammen), ist unser AI-Detektor eines der genauesten Tools auf dem Markt.

Überspringen Sie also das Rätselraten.

Testen Sie Undetectable AI noch heute.

Undetectable AI (TM)