Kan GPT-o1-indhold opdages af AI-værktøjer?

Kan GPT o1 skrive indhold uden at blive fanget af AI-detektorer?

Det er et rimeligt spørgsmål. 

I denne artikel kan du læse, at GPT o1 er en model, der er trænet til at håndtere komplekse opgaver inden for videnskab, kodning og matematik. 

Men hey, hvis den kan skrive, og om du kan snige den forbi AI-detektorer eller ej, er det værd at udforske.

Her er, hvad du får ud af at læse denne artikel:

  • Hvad er GPT-o1?
  • Hvordan fungerer AI-detektorer?
  • Kan GPT-o1-indhold opdages?
  • Er OpenAI's o1-mini og o1-preview virkelig umulige at opdage?
  • Hvordan omgår man AI-detektorer med GPT-o1?
  • GPT-o1 vs GPT-4o: Hvilken er mest synlig?

Så lad os begynde.

Hvad er GPT-o1?

I september 2024 lancerede OpenAI GPT-o1-preview sammen med en lettere og mere omkostningseffektiv variant kaldet o1-mini. 

I december 2024 blev preview-versionen officielt erstattet af den fulde GPT-o1-model. 

Ifølge OpenAI er GPT-o1 skabt til at tackle meget komplekse problemer ved at bruge mere tid på at "tænke", før den genererer svar. 

Du skal aldrig bekymre dig om, at AI opdager dine tekster igen. Undetectable AI Kan hjælpe dig:

  • Få din AI-assisterede skrivning til at fremstå Menneskelignende.
  • Bypass alle større AI-detektionsværktøjer med bare ét klik.
  • Brug AI sikkert og selvsikkert i skolen og på arbejdet.
Prøv GRATIS

Dette omfatter avancerede opgaver som konkurrencepræget programmering, abstrakt matematik og videnskabeligt ræsonnement, som modellen kan håndtere med næsten ekspertfinesse.

Og testene er et bevis på denne ekspertise. 

I benchmarktest lå o1-preview blandt de bedste. 89. percentil på Codeforces konkurrencer.

På den Amerikansk indbydende matematikeksameno1 løste 83% af problemerne (12,5/15). Til sammenligning klarede GPT-4o knap 13% (1,8/15).

Denne model viste også færdigheder på ph.d.-niveau på tværs af flere videnskabelige domæner (fysik, kemi og biologi).

Så det er tydeligt, at modellen primært er lavet til forskning og tekniske anvendelser.

Hvordan den adskiller sig fra GPT-3.5, GPT-4 & GPT-4o

Set fra GPT-o1's perspektiv er forskellene til GPT-3.5, GPT-4 og GPT-4o både små og store, alt efter hvilken opgave man skal løse.

GPT-3.5 fungerer på et ældre datasæt med et begrænset kontekstvindue på 16.385 (4.096 output-tokens) og tilbyder grundlæggende ræsonnement og anstændige kodningsfærdigheder. 

Den klarer sig fint med generelle opgaver, men hvis du giver den et problem med indlejret logik eller en vanskelig algoritme, vil du hurtigt se dens begrænsninger.

Sammenlignet med den opererer GPT o1 i en anden kognitiv klasse. Så sammenligningen er ikke rigtig.

GPT-4 er stadig solid, mere raffineret end 3.5 og i stand til at løse en bredere vifte af opgaver, især dem, der kræver nuancer. Men selv den graver sig ikke ned i teknisk kompleksitet med samme stringens som o1. 

GPT-4o forbedrede hastigheden og de multimodale evner yderligere, men haltede stadig bagefter i dybe analytiske opgaver.

Den er hurtigere, mere interaktiv og bedre udstyret til generel brug. Den håndterer kreativ skrivning, chat og multimedieopgaver bedre end o1 indtil videre.

Men når det drejer sig om logiktunge use cases, har o1 et målbart forspring. 

Når det er sagt, mangler GPT-o1 nogle brugervenlige funktioner som webbrowsing eller filuploads, som GPT-4o understøtter.

Tilstanden kan også være lidt kortfattet. Dens afvisningssvar er kortere og springer nogle gange henvisninger eller dybere forklaringer over, som 4o har en tendens til at inkludere. 

Et andet stort forbehold ved o1 er, at det kan forstærke risici, når man adresserer farlige forespørgsler.

For eksempel når man bliver spurgt om klatreteknikker, GPT-o1's dybdegående engagement kan tilskynde til overdreven afhængighed, mens GPT-4o som standard bruger generiske råd.

[kilde]

FunktionGPT-3.5GPT-4GPT-4oGPT o1
TræningsdataÆldre datasætNyere og mere omfattendeDen mest opdateredeDen mest opdaterede
Output-tokens4.096 jetoner 8.192 tokens 16.384 tokens100.000 tokens 
Kontekst-vindue16,3858,192128,000200,000
Nøjagtighed og sammenhængGodBetydeligt forbedretHøjEnestående
Evner til at ræsonnereGrundlæggendeAvanceretAvanceretPh.d.-niveau
Færdigheder i kodningAnstændigDygtigDygtigTæt på ekspertniveau
Kreativ skrivningI stand tilMere kreativ og nuanceretHurtig, kreativIkke muligt
ReaktionshastighedHurtigModeratHurtigsteLangsommere (bevidst)
Bedst tilTilfældig brugGenerelle opgaverHastighed + multitaskingTeknisk dybde

Sådan fungerer AI-detektorer

AI-detektorer er blevet mere og mere almindelige i tiden efter GPT-boomet.

Deres formål er at finde ud af, om noget er skrevet af en person eller spyttet ud af en model som GPT-o1.

De kommer med et gæt baseret på en masse nørdede målinger og fire store maskinlærings- og NLP-koncepter.

Klassifikator

Hovedhjernen i disse detektorer kaldes en klassifikator.

Disse klassifikatorer trænes på massive datasæt, der er mærket som enten AI-genererede eller menneskeskrevne, og med tiden lærer de, hvad der adskiller de to.

Når modellen er trænet, kan den vurdere et nyt stykke tekst og beslutte, hvor det sandsynligvis hører hjemme på AI-menneske-spektret.

Den tjekker, hvor ofte bestemte ord optræder, hvor lange sætningerne er, og om det hele lyder for rent.

Indlejringer

Da computere ikke kan forstå sprog på samme måde som os, omdanner embeddings ord til matematiske vektorer, der repræsenterer betydning, kontekst og ordrelationer.

Så når en detektor analyserer en sætning, ser den på, hvor ordene befinder sig i dette flerdimensionelle vektorrum, og hvordan deres positioner relaterer til mønstre, der ses i enten menneskers eller AI's output.

Det er sådan, systemet ved, at "dronning" og "konge" er ting, der hører sammen.

Forvirring

I AI-detektion er perplexitet en metrik, der måler, hvor forudsigeligt et stykke skrift er.

AI-genereret indhold har en tendens til at være mindre forvirrende, fordi det sigter mod at producere tekst, der flyder logisk og læses tydeligt. 

I mellemtiden kan menneskelig skrivning være mere rodet. Den er rigere på uforudsigelighed, kreative spring eller direkte underlige formuleringer. 

Så en lav perplexitetsscore kan være et fingerpeg om, at noget kommer fra en AI, men den bruges aldrig isoleret, for selv mennesker kan godt lide at lyde indlysende nogle gange.

Sprængthed

Spændstighed måler, hvor meget variation der er i det, du skriver. 

Menneskelige forfattere udviser normalt større sprængkraft, fordi vi naturligt blander tingene mellem korte, rappe linjer og lange, komplekse linjer.

AI har en tendens til at spille sikkert. Den tager ikke mærkelige omveje eller kører pludselig af sporet midt i en tanke. Og det gør den lettere at spotte.

Kan GPT-o1-indhold opdages?

Chat GPT o1 er ikke gratis og er heller ikke længere en del af den almindelige Plus-plan. 

Den er blevet hævet til OpenAI's Pro-plan, som starter ved en høj pris på $200.

Selv om vi ikke har fuld offentlig adgang til selv at teste GPT o1, kan vi stadig komme med et kvalificeret gæt på, om den kan opdages.

OpenAI gjorde det ret klart, at denne model var bygget med STEM i tankerne. 

Så ud fra det er det et sikkert bud, at modellens evne til at efterligne menneskelig skrivning vil være temmelig gennemsnitlig, hvis ikke helt dårlig.

Takket være et par YouTube-kanaler, der har lagt eksempler på output fra Chat GPT o1-modeller ud - specifikt o1-mini og o1-preview - fik vi mulighed for at køre disse tekster gennem populære detektionsværktøjer og se, hvilken slags røde flag der dukker op.

Er OpenAI's o1-mini og o1-preview virkelig umulige at opdage?

Vi hentede to teksteksempler direkte fra YouTube-videoer, der kørte prompts gennem o1-preview og o1-mini.

Lad os se, om deres output faktisk kan slippe forbi AI-detektorer uden at udløse alarmer.

Kan o1-preview opdages?

Vi valgte en tekstprøve fra en video af The Nerdy Novelist, hvor o1-preview-modellen genererede en kort artikel med titlen "Helen of Troy: Ansigtet, der satte tusind skibe i søen". 

Vi fokuserede på introen og de to første overskrifter, som var på 265 ord i alt.

Vi smed teksten ind i Uopdagelig AI, QuillBotog Originalitet.aibare for at dække alle baser.

Undetectable AI var ikke imponeret. Den markerede 99% af indholdet som AI-genereret og stoppede ikke der.

Den forudsagde også, at andre detektorer - som QuillBot, ZeroGPT og Grammarly - ville komme til samme konklusion. Så lad os bekræfte dette ved at køre teksten gennem QuillBot.

QuillBot fulgte trop. Den markerede teksten som 100% sandsynligvis AI. 

Men den vil gerne lade tvivlen komme den til gode. Du kan holde musen over forskellige dele af teksten og se tillidsniveauerne: lav, moderat, høj. 

Og så er der Originality.ai. Den kom ind med 100% tillid til, at teksten var skrevet af AI. Ikke 98%. Ikke 99. 100. Og den bruger ikke engang ordet "sandsynligvis".

Kan o1-mini opdages?

Lad os nu tale om o1-mini. 

Den tekst, vi har brugt her, er fra en anden YouTuber der brugte et meget bedre oplæg, og det kan ses. Teksten havde mere personlighed og et mere menneskeligt flow.

AI-detektorerne lagde også mærke til det. QuillBot kaldte denne for ca. 45% AI, 55% menneske. Det er faktisk et godt resultat.

Hvis du bare læste det hurtigt igennem uden at tjekke, ville du måske endda tro, at det var en person, der havde skrevet det.

Men bliv ikke for tryg. Undetectable AI og Originality.ai lod sig ikke narre.

De kaldte det begge stadig AI med henholdsvis 99% og 100% sikkerhed. Så selv med en bedre opfordring kunne skriften ikke komme over hegnet.

Hvilket bringer os til bundlinjen: OpenAI's o1-preview og o1-mini kan helt sikkert spores, især hvis du bruger en Undetectables AI-detektor

Du kan tilpasse din prompt, omformulere dine sætninger, måske endda narre et værktøj her og der. Men Chat GPT o1 har stadig store chancer for at blive opdaget som AI-detektion.

Sådan omgår du AI-detektorer med GPT-o1

Så du har fået din skinnende nye tekst direkte fra GPT o1 - ren, hurtig og uhyggeligt sammenhængende. Det er fantastisk. Men nu kommer det virkelige trick: at få det til at se ud, som om et menneske faktisk har skrevet det. 

Når GPT o1 har gjort sit arbejde, kan man ikke bare lægge det ud i rå tilstand. Du skal få det til at se ud, som om et menneske har skrevet det.

Men i stedet for at gøre det manuelt, kan du gøre det ved hjælp af AI-menneskeliggørelse. 

Disse værktøjer ved, hvordan man tager robotklingende tekst og giver den lidt menneskelig underlighed. Den slags, som detektorer har svært ved at afkode.

Men her er sagen. Der findes en hel del værktøjer til dette formål, som lover at "menneskeliggøre" din tekst, men som ender med at få den til at lyde som en dårligt omskrevet tekst.

Det er derfor, Undetectable AI fortjener lidt opmærksomhed.

Vores pakke af værktøjer som Humanizer, Skjult forfatterog Parafraser faktisk forstår, hvordan AI-detektorer tænker. 

  • Humanizer justerer flowet og formuleringerne lige nok til at flyve under radaren. 
  • Stealth Writer tilføjer variation i sætningsstrukturen, hvilket er vigtigt for at forvirre klassifikatorer. 
  • Og parafraseren omformer teksten, mens den oprindelige betydning forbliver intakt.

I bund og grund kender disse værktøjer AI's sprog, og de ved, hvordan man får den ud af fatning.

Så hvis du bruger GPT o1 til at skrive, og du vil have dit arbejde til at passere som menneskeligt, skal du ikke springe efterbehandlingstrinnet over.

Selv en lille oprydning ved hjælp af Undetectable AI kan gøre en stor forskel i forhold til at slå detektionsværktøjer.

Oplev vores AI Detector og Humanizer lige i widgetten nedenfor!

GPT-o1 vs GPT-4o: Hvilken er mest synlig?

Vi har allerede talt om, hvordan GPT o1 læner sig kraftigt op ad matematik og naturvidenskab, mens GPT-4o har lidt mere finesse, når det gælder sprog. Men hvordan klarer GPT o1 vs 4o sig på skrift?

Først brugte vi denne opfordring til at generere 400 ords indhold ved hjælp af GPT 4o:

Derefter kørte vi GPT-4o's output gennem de samme tre AI-detektorer: Undetectable AI, QuillBot og Originality.ai.

Undetectable AI markerede 99% af indholdet som AI. Det er en imponerende AI-detektion, ikke?

Så kom QuillBot ind og sagde: "Ikke så hurtigt." Den markerede 73% af den samme tekst som AI-genereret, en endnu hårdere dom end den gav til GPT o1-mini, som den scorede til 45%.

Originality.ai var stadig fastlåst i fuld mistænksomhedstilstand. Den målte GPT-4o's indhold til 100% AI, som altid.

Så hvad betyder alt dette? De fleste Ai-detektorer som Undetectable AI og Orginality AI er gode til at fange ChatGPT o1- og 4o-tekst.

Men hvis vi skal holde regnskab, er GPT o1 klart mere synlig. På tværs af flere detektorer blev den konsekvent markeret ved 99-100% AI, selv med forbedret prompting. 

Og helt ærligt, det giver mening. GPT o1 blev ikke bygget til at være en sprogmodel. Det er en STEM-first-model, bygget til at løse problemer. 

GPT-4o forstår derimod at lyde mere naturlig, især når den er parret med en solid prompt.

Så hvis du skal vælge mellem de to til skriveopgaver, hvor skjulthed er vigtig, er GPT-4o din bedste chance for at slippe forbi radaren.

Endelig dom: Kan GPT-o1 opdages?

Vores resultater konkluderer, at ja, GPT o1 kan påvises. 

Selv med en god prompt-teknik kan den tekst, den genererer, stadig snyde de fleste AI-detektorer. 

Men for at være helt ærlig, så var skrivning ikke det job, den var trænet til at udføre. GPT o1 blev bygget til STEM-relaterede opgaver som løsning af ligninger, kodning og databehandling.

Så hvis du prøver at lave indhold, der rent faktisk lyder menneskeligt, er GPT o1 nok ikke modellen til det. Det er bedre at bruge GPT-4o, som har et mere flydende sprog, eller endnu bedre at bruge et værktøj, der er bygget specielt til at skrive uopdaget AI-indhold.

Det er her, Undetectable AI kommer ind i billedet. 

Vores AI Humanizer omskriver dit indhold på en måde, så det lyder naturligt, nuanceret og overbevisende menneskeligt. 

Uanset om du skriver blogindlæg, essays eller produktbeskrivelser, tilpasser den sig dit emne uden at udløse AI-alarmer.

Og apropos alarmer: Hvis du vil teste, hvor detekterbart dit indhold egentlig er (uanset om det er fra GPT o1, GPT-4o eller en anden model), er vores AI Detector et af de mest præcise værktøjer på markedet.

Så spring gætteriet over.

Prøv Undetectable AI i dag.

Undetectable AI (TM)