Kan GPT-o1-innhold oppdages av AI-verktøy?

Kan GPT o1 skrive innhold uten å bli fanget opp av AI-detektorer?

Det er et rimelig spørsmål. 

I denne artikkelen kan du lese at GPT o1 er en modell som er trent opp til å håndtere komplekse oppgaver knyttet til vitenskap, koding og matematikk. 

Men hei, hvis den kan skrive, og om du kan snike den forbi AI-detektorer, er det verdt å utforske.

Dette er hva du vil sitte igjen med etter å ha lest denne artikkelen:

  • Hva er GPT-o1?
  • Hvordan fungerer AI-detektorer?
  • Kan GPT-o1-innhold oppdages?
  • Er OpenAIs o1-mini og o1-preview virkelig uoppdagelige?
  • Hvordan omgå AI-detektorer med GPT-o1?
  • GPT-o1 vs GPT-4o: Hva er lettest å oppdage?

Så la oss begynne.

Hva er GPT-o1?

I september 2024 lanserte OpenAI GPT-o1-preview, sammen med en lettere og mer kostnadseffektiv variant kalt o1-mini. 

I desember 2024 ble forhåndsversjonen offisielt erstattet av den fullstendige GPT-o1-modellen. 

Ifølge OpenAI er GPT-o1 laget for å takle svært komplekse problemer ved å bruke mer tid på å "tenke" før den genererer svar. 

Aldri bekymre deg for at AI oppdager tekstene dine igjen. Undetectable AI Kan hjelpe deg:

  • Få AI-assistert skriving til å vises ...menneskelignende.
  • Bypass alle de viktigste AI-deteksjonsverktøyene med bare ett klikk.
  • Bruk AI trygt og selvsikkert i skole og arbeid.
Prøv gratis

Dette inkluderer avanserte oppgaver som konkurranseprogrammering, abstrakt matematikk og vitenskapelig resonnering, som modellen kan håndtere med nesten ekspertfinesse.

Og testene er et bevis på denne ekspertisen. 

I referansetestingen ble o1-preview rangert blant de 89. persentil på Codeforces konkurranser.

American Invitational Mathematics Examinationo1 løste 83% av problemene (12,5/15). Til sammenligning klarte GPT-4o så vidt 13% (1,8/15).

Denne modellen viste også ferdigheter på doktorgradsnivå på tvers av flere vitenskapelige områder (fysikk, kjemi og biologi).

Så det er tydelig at modellen først og fremst er laget for forskning og tekniske anvendelser.

Hvordan den skiller seg fra GPT-3.5, GPT-4 og GPT-4o

Sett fra GPT-o1s perspektiv er forskjellene fra GPT-3.5, GPT-4 og GPT-4o både subtile og tydelige, avhengig av oppgaven som skal utføres.

GPT-3.5 opererer på et eldre datasett med et begrenset kontekstvindu på 16 385 (4096 utgangstokener) og tilbyr grunnleggende resonnering og gode kodingsferdigheter. 

Den klarer seg greit med generelle oppgaver, men hvis du gir den en oppgave med nestet logikk eller en vanskelig algoritme, vil du raskt se dens begrensninger.

Sammenlignet med den opererer GPT o1 i en annen kognitiv klasse. Så sammenligningen er ikke riktig.

GPT-4 er fortsatt solid, mer raffinert enn 3.5 og i stand til å løse et bredere spekter av oppgaver, spesielt de som krever nyanser. Men selv ikke den går like grundig til verks i teknisk kompleksitet som o1. 

GPT-4o forbedret hastigheten og de multimodale egenskapene ytterligere, men lå fortsatt etter når det gjaldt dype analytiske oppgaver.

Den er raskere, mer interaktiv og bedre rustet for generell bruk. Den håndterer kreativ skriving, chatting og multimedieoppgaver bedre enn o1 for øyeblikket.

Men når det gjelder logikktunge brukstilfeller, har o1 et målbart forsprang. 

Når det er sagt, mangler GPT-o1 noen brukervennlige funksjoner som surfing på nettet eller filopplasting, som GPT-4o støtter.

Modusen kan også være litt kortfattet. Avslagene er kortere, og noen ganger hoppes det over referanser eller dypere forklaringer som 4o har en tendens til å inkludere. 

En annen viktig ulempe med o1 er at den kan forsterke risikoen ved farlige spørsmål.

For eksempel på spørsmål om klatreteknikker, GPT-o1s dyptgående engasjement kan føre til overdreven avhengighet, mens GPT-4o bruker generiske råd som standard.

[kilde]

FunksjonGPT-3.5GPT-4GPT-4oGPT o1
OpplæringsdataEldre datasettNyere og mer omfattendeMest oppdaterteMest oppdaterte
Utgangstokener4 096 poletter 8 192 poletter 16 384 poletter100 000 tokens 
Kontekstvindu16,3858,192128,000200,000
Nøyaktighet og koherensBraBetydelig forbedretHøyEksepsjonell
Evner til å resonnereGrunnleggendeAvansertAvansertDoktorgradsnivå
KodingsferdigheterGreiDyktigDyktigNær ekspertnivå
Kreativ skrivingI stand tilMer kreativ og nyansertRask, kreativIkke gjennomførbart
ResponshastighetRaskModeratRaskestLangsommere (bevisst)
Best forTilfeldig brukGenerelle oppgaverHastighet + multitaskingTeknisk dybde

Slik fungerer AI-detektorer

AI-detektorer har blitt stadig vanligere i tiden etter GPT-boomen.

Hensikten er å finne ut om noe er skrevet av en person eller spyttet ut av en modell som GPT-o1.

De gjetter basert på en rekke nerdete beregninger og fire viktige maskinlærings- og NLP-konsepter.

Klassifikator

Hovedhjernen i disse detektorene kalles en klassifikator.

Klassifisererne trenes opp på enorme datasett som er merket som enten AI-genererte eller menneskeskrevne, og over tid lærer de seg hva som skiller de to fra hverandre.

Når modellen er opplært, kan den vurdere en ny tekstbit og avgjøre hvor den sannsynligvis hører hjemme på AI-menneske-spekteret.

Den sjekker hvor ofte visse ord dukker opp, hvor lange setningene er, og om det hele høres for rent ut.

Embeddings

Siden datamaskiner ikke kan forstå språk på samme måte som oss, konverterer embeddings ord til matematiske vektorer som representerer betydning, kontekst og ordrelasjoner.

Så når en detektor analyserer en setning, ser den på hvor ordene befinner seg i dette flerdimensjonale vektorrommet, og hvordan posisjonene deres relaterer seg til mønstre som kan sees i enten menneskelige eller AI-resultater.

Det er slik systemet vet at "dronning" og "konge" hører sammen.

Forvirring

I AI-deteksjon er perplexitet et mål på hvor forutsigbart et stykke tekst er.

AI-generert innhold har en tendens til å være mindre forvirrende fordi det tar sikte på å produsere tekst som flyter logisk og leses tydelig. 

Menneskelig skriving kan derimot være mer rotete. Den er rikere på uforutsigbarhet, kreative sprang eller rett og slett merkelige formuleringer. 

En lav perplexity-score kan altså være en ledetråd om at noe kommer fra en AI, men den brukes aldri isolert, for selv mennesker liker å høres åpenbare ut iblant.

Sprengthet

Sprengkraft måler hvor mye variasjon det du skriver har. 

Menneskelige forfattere viser vanligvis større sprøhet fordi vi naturlig veksler mellom korte, kjappe replikker og langstrakte, komplekse replikker.

AI har en tendens til å spille på det sikre. Den tar ikke rare omveier eller går plutselig av sporet midt i en tanke. Og det gjør den lettere å oppdage.

Kan GPT-o1-innhold oppdages?

Chat GPT o1 er ikke tilgjengelig gratis og er heller ikke en del av det vanlige Plus-abonnementet lenger. 

Den har blitt oppgradert til OpenAIs Pro-abonnement, som starter på bratte $200.

Selv om vi ikke har full offentlig tilgang til å teste GPT o1 selv, kan vi likevel komme med en kvalifisert gjetning om oppdagbarheten.

OpenAI gjorde det ganske klart at denne modellen var bygget med STEM i tankene. 

Basert på dette er det rimelig å anta at modellens evne til å etterligne menneskelig skrift er ganske gjennomsnittlig, om ikke helt dårlig.

Takket være et par YouTube-kanaler som har lagt ut eksempler på utdata fra Chat GPT o1-modeller - spesielt o1-mini og o1-preview - har vi kunnet kjøre disse tekstene gjennom populære deteksjonsverktøy og se hva slags røde flagg som dukker opp.

Er OpenAIs o1-mini og o1-preview virkelig uoppdagelige?

Vi hentet to teksteksempler direkte fra YouTube-videoer som kjørte spørsmål gjennom o1-preview og o1-mini.

La oss se om utgangene deres faktisk kan slippe forbi AI-detektorer uten å utløse alarmer.

Kan o1-preview oppdages?

Vi valgte ut et tekstutvalg fra en video av The Nerdy Novelisthvor o1-preview-modellen genererte en kort artikkel med tittelen "Helen of Troy: Ansiktet som sjøsatte tusen skip". 

Vi fokuserte på introen og de to første overskriftene, som til sammen var på 265 ord.

Vi kastet teksten inn i Ikke påvisbar AI, QuillBot, og Originalitet.ai, bare for å dekke alle baser.

Uoppdagelig AI var ikke imponert. Den flagget 99% av innholdet som AI-generert, og stoppet ikke der.

Den forutså også at andre detektorer - som QuillBot, ZeroGPT og Grammarly - ville komme til samme konklusjon. Så la oss bekrefte dette ved å kjøre teksten gjennom QuillBot.

QuillBot fulgte etter. Den flagget teksten som 100% sannsynlig AI. 

Men den liker å la tvilen komme deg til gode. Du kan holde musepekeren over ulike deler av teksten og se tillitsnivåene: lav, moderat, høy. 

Og så er det Originality.ai. Den kom inn med 100% tillit til at teksten var skrevet av kunstig intelligens. Ikke 98%. Ikke 99. 100. Og den bruker ikke engang ordet "sannsynlig".

Er o1-mini detekterbar?

La oss nå snakke om o1-mini. 

Teksten vi har brukt her er hentet fra en annen YouTuber som brukte en mye bedre ledetekst, og det synes. Teksten hadde mer personlighet og en mer menneskelig flyt.

AI-detektorene la også merke til det. QuillBot kalte denne for 45% AI, 55% menneske. Det er faktisk et anstendig resultat.

Hvis du bare leste den raskt uten å sjekke, ville du kanskje til og med trodd at det var en person som hadde skrevet den.

Men ikke bli for komfortabel. Undetectable AI og Originality.ai lot seg ikke lure.

Begge kalte det fortsatt AI med henholdsvis 99% og 100% sikkerhet. Så selv med en bedre ledetekst klarte ikke skriften å komme over gjerdet.

Noe som bringer oss til bunnlinjen: OpenAIs o1-preview og o1-mini er definitivt detekterbare, spesielt hvis du bruker en Undetectables AI-detektor

Du kan justere ledeteksten din, omformulere setningene dine, kanskje til og med lure et verktøy her og der. Men Chat GPT o1 har fortsatt stor sjanse for å bli oppdaget som AI-deteksjon.

Slik omgår du AI-detektorer med GPT-o1

Så du har fått den skinnende nye teksten din rett fra GPT o1 - ren, rask og uhyggelig sammenhengende. Det er flott. Men nå kommer det virkelige trikset: å få det til å se ut som om et menneske faktisk har skrevet den. 

Når GPT o1 har gjort jobben sin, kan du ikke bare legge den ut rå. Du må få det til å se ut som om et menneske har skrevet det.

Men i stedet for å gjøre det manuelt, kan du gjøre det ved hjelp av AI-menneskeliggjørere. 

Disse verktøyene vet hvordan de skal ta robotklingende tekst og gi den litt menneskelig raritet. Den typen som detektorer sliter med å dekode.

Men her er saken. Det finnes en rekke verktøy for dette formålet som lover å "menneskeliggjøre" teksten din, men som ender opp med å få den til å høres ut som en dårlig omskrevet tekst.

Derfor fortjener Undetectable AI litt oppmerksomhet.

Vår pakke med verktøy som Humanizer, Stealth Writer, og Omskriver faktisk forstår hvordan AI-detektorer tenker. 

  • Humanizer justerer flyten og formuleringene akkurat nok til å fly under radaren. 
  • Stealth Writer gir variasjon i setningsstrukturen, noe som er viktig for å forvirre klassifisører. 
  • Parafraseren omformer teksten samtidig som den opprinnelige meningen beholdes intakt.

Disse verktøyene kan AI-språket, og de vet hvordan de skal få den til å miste grepet.

Så hvis du bruker GPT o1 til skriving, og du vil at arbeidet ditt skal godkjennes som menneskelig, må du ikke hoppe over etterbehandlingstrinnet.

Selv en liten opprydding ved hjelp av Undetectable AI kan utgjøre en stor forskjell når det gjelder å slå deteksjonsverktøy.

Oppdag vår AI Detector og Humanizer rett i widgeten nedenfor!

GPT-o1 vs GPT-4o: Hva er lettest å oppdage?

Vi har allerede snakket om hvordan GPT o1 er svært orientert mot matematikk og naturfag, mens GPT-4o er litt mer finurlig når det gjelder språk. Men hvordan er GPT o1 og 4o sammenlignet når det gjelder skriving?

Først brukte vi denne ledeteksten til å generere 400 ord med innhold ved hjelp av GPT 4o:

Deretter kjørte vi GPT-4os utdata gjennom de samme tre AI-detektorene: Uoppdagelig AI, QuillBot og Originality.ai.

Uoppdagelig AI flagget 99% av innholdet som AI. Det er imponerende AI-deteksjon, ikke sant?

Så kom QuillBot inn og sa: "Ikke så fort." Den markerte 73% av den samme teksten som AI-genererte, en enda strengere dom enn den ga til GPT o1-mini, som den vurderte til 45%.

Originality.ai var fortsatt i full mistenksomhetsmodus. Den klokket GPT-4os innhold til 100% AI, som alltid.

Så hva betyr alt dette? De fleste Ai-detektorer som Undetectable AI og Orginality AI er gode til å fange opp ChatGPT o1- og 4o-tekst.

Men hvis vi skal holde tellingen, er GPT o1 helt klart mer detekterbar. På tvers av flere detektorer ble den konsekvent flagget ved 99-100% AI, selv med forbedret prompting. 

Og det er ærlig talt logisk. GPT o1 ble ikke bygget for å være en språkmodell. Det er en STEM-først-modell, bygget for å løse problemer. 

GPT-4o, derimot, vet å høres mer naturlig ut, spesielt når den kombineres med en solid prompt.

Så hvis du må velge mellom de to for skriveoppgaver der det er viktig å holde seg skjult, er GPT-4o det beste alternativet for å slippe forbi radaren.

Endelig dom: Er GPT-o1 mulig å oppdage?

Våre funn konkluderer med at ja, GPT o1 kan påvises. 

Selv med god prompt-teknikk vil teksten den genererer, fortsatt få de fleste AI-detektorer til å snuble. 

Men for å være ærlig var det ikke skriving den var opplært til å gjøre. GPT o1 ble bygget for STEM-relaterte oppgaver som å løse ligninger, kode og samle inn data.

Så hvis du prøver å lage innhold som faktisk høres menneskelig ut, er GPT o1 sannsynligvis ikke modellen for det. Det er bedre å bruke GPT-4o, som har mer språkflyt, eller enda bedre, bruke et verktøy som er utviklet spesielt for å skrive innhold som ikke kan oppdages av kunstig intelligens.

Det er her Undetectable AI kommer inn i bildet. 

Våre AI Humanizer omskriver innholdet ditt på en måte som høres naturlig, nyansert og overbevisende menneskelig ut. 

Enten du skriver blogginnlegg, essays eller produktbeskrivelser, tilpasser den seg til emnet ditt uten å utløse AI-alarmer.

Og apropos alarmer: Hvis du vil teste hvor detekterbart innholdet ditt egentlig er (enten det er fra GPT o1, GPT-4o eller en hvilken som helst annen modell), er vår AI Detector et av de mest nøyaktige verktøyene på markedet.

Så hopp over gjetningene.

Prøv Undetectable AI i dag.

Undetectable AI (TM)