Poate GPT o1 să scrie conținut fără a fi prins de detectoarele AI?
Este o întrebare corectă.
În acest articol, veți citi că GPT o1 este un model care a fost antrenat pentru a gestiona sarcini complexe legate de domeniul științei, codării și matematicii.
Dar, hei, dacă poate scrie și dacă îl poți strecura sau nu printre detectoarele AI, merită explorat.
Iată cu ce veți pleca după ce veți citi acest articol:
- Ce este GPT-o1?
- Cum funcționează detectoarele de IA?
- Poate fi detectat conținutul GPT-o1?
- Sunt o1-mini și o1-preview de la OpenAI cu adevărat nedetectabile?
- Cum să ocoliți detectoarele AI cu GPT-o1?
- GPT-o1 vs GPT-4o: Care este mai detectabil?
Așa că să începem.
Ce este GPT-o1?
În septembrie 2024, OpenAI a lansat GPT-o1-preview, alături de o variantă mai ușoară și mai economică numită o1-mini.
Până în decembrie 2024, versiunea de previzualizare a fost înlocuită oficial de modelul complet GPT-o1.
Potrivit OpenAI, GPT-o1 este creat pentru a aborda probleme extrem de complexe, dedicând mai mult timp de "gândire" computațională înainte de a genera răspunsuri.
Nu vă mai îngrijorați niciodată că AI vă detectează textele. Undetectable AI Vă poate ajuta:
- Faceți să apară scrisul dvs. asistat de AI asemănătoare omului.
- Bypass toate instrumentele majore de detectare AI cu un singur clic.
- Utilizați AI în siguranță și cu încredere în școală și la locul de muncă.
Aceasta include sarcini avansate precum programarea competitivă, matematica abstractă și raționamentul științific, pe care modelul le poate gestiona cu o finețe aproape de cea a unui expert.
Iar testele sunt dovada acestei expertize.
În testele de referință, o1-preview s-a clasat în 89 percentila pe Codeforces concursuri.
Pe American Invitational Mathematics Examination, o1 a rezolvat 83% de probleme (12,5/15). Prin comparație, GPT-4o abia a rezolvat 13% (1,8/15).
Acest model a arătat, de asemenea, competențe la nivel de doctorat în mai multe domenii științifice (fizică, chimie și biologie).
Așadar, este clar că modelul a fost creat pentru cercetare și aplicații tehnice, în primul rând.
Cum diferă de GPT-3.5, GPT-4 și GPT-4o
Din perspectiva GPT-o1, diferențele față de GPT-3.5, GPT-4 și GPT-4o sunt atât subtile, cât și puternice, în funcție de sarcina în cauză.
GPT-3.5 funcționează pe un set de date mai vechi, cu o fereastră de context limitată la 16.385 (4.096 token-uri de ieșire) și oferă un raționament de bază și abilități de programare decente.
Se descurcă bine cu solicitările generale, dar dați-i o problemă cu logică imbricate sau un algoritm complicat, și veți vedea rapid marginile sale.
În comparație cu acesta, GPT o1 operează într-o clasă cognitivă diferită. Așadar, comparația nu este corectă.
GPT-4 rămâne solid, mai rafinat decât 3.5 și capabil într-o gamă mai largă de sarcini, în special cele care necesită nuanțe. Dar chiar și acesta nu sapă în complexitatea tehnică cu aceeași rigoare ca o1.
GPT-4o a îmbunătățit și mai mult viteza și capacitățile multimodale, dar a rămas în urmă în ceea ce privește sarcinile analitice profunde.
Este mai rapid, mai interactiv și mai bine echipat pentru utilizarea în scopuri generale. Deocamdată, se descurcă mai bine cu scrierea creativă, chat-ul și sarcinile multimedia decât o1.
Dar, atunci când vine vorba de cazuri de utilizare cu logică intensă, o1 deține un avans măsurabil.
Acestea fiind spuse, GPT-o1 nu dispune de unele caracteristici ușor de utilizat, cum ar fi navigarea pe web sau încărcarea de fișiere, pe care GPT-4o le acceptă.
Modul poate fi, de asemenea, puțin laconic. Răspunsurile sale de refuz sunt mai scurte, care uneori trec peste referințe sau explicații mai profunde pe care 4o tinde să le includă.
O altă avertizare majoră a o1 este că poate amplifica riscurile atunci când abordează interogări periculoase.
De exemplu, când este întrebat despre tehnicile de alpinism, Angajamentul aprofundat al GPT-o1 ar putea încuraja încrederea excesivă, în timp ce GPT-4o utilizează în mod implicit sfaturi generice.
[sursă]
Caracteristică | GPT-3.5 | GPT-4 | GPT-4o | GPT o1 |
Date de formare | Set de date mai vechi | Mai recent și mai extins | Cele mai recente | Cele mai recente |
Jetoane de ieșire | 4,096 jetoane | 8.192 jetoane | 16.384 de jetoane | 100.000 de jetoane |
Fereastra contextuală | 16,385 | 8,192 | 128,000 | 200,000 |
Acuratețe și coerență | Bun | Îmbunătățit semnificativ | Înaltă | Excepțional |
Capacități de raționament | De bază | Avansat | Avansat | Nivel doctorat |
Competențe de codificare | Decent | Competent | Competent | Nivel apropiat de expert |
Scriere creativă | Capabil | Mai creativ și nuanțat | Rapid, creativ | Nu este fezabil |
Viteza de răspuns | Rapid | Moderat | Cel mai rapid | Mai lent (deliberat) |
Cel mai bun pentru | Utilizare ocazională | Sarcini generale | Viteză + multitasking | Adâncime tehnică |
Cum funcționează detectoarele AI
Detectoarele de inteligență artificială au devenit din ce în ce mai frecvente în perioada de boom post-GPT.
Scopul lor este de a afla dacă ceva a fost scris de o persoană sau scuipat de un model precum GPT-o1.
Ei fac o presupunere bazată pe o grămadă de parametri tocilari și patru concepte majore de învățare automată și NLP.
Clasificator
Creierul principal al acestor detectoare se numește clasificator.
Aceste clasificatoare sunt antrenate pe seturi masive de date etichetate fie ca fiind generate de AI, fie ca fiind scrise de oameni, iar în timp ele învață ce le diferențiază pe cele două.
Odată ce modelul este antrenat, acesta poate evalua o nouă bucată de text și poate decide unde se situează aceasta în spectrul AI-uman.
Acesta verifică cât de des apar anumite cuvinte, cât de lungi sunt propozițiile și dacă totul sună prea curat.
Încorporări
Deoarece computerele nu pot înțelege limbajul așa cum o facem noi, încorporările transformă cuvintele în vectori matematici care reprezintă sensul, contextul și relațiile dintre cuvinte.
Prin urmare, atunci când un detector analizează o propoziție, acesta se uită la locul în care se află cuvintele în acest spațiu vectorial multidimensional și la modul în care pozițiile lor sunt legate de modelele observate în rezultatele obținute de oameni sau de inteligența artificială.
Acesta este modul în care sistemul știe că "regină" și "rege" sunt lucruri care merg împreună.
Perplexitate
În detectarea inteligenței artificiale, perplexitatea este un parametru care măsoară cât de previzibil este un text scris.
Conținutul generat de inteligența artificială tinde să aibă o perplexitate mai scăzută, deoarece urmărește să producă text care curge logic și se citește clar.
Scrisul uman, între timp, poate fi mai dezordonat. Este mai bogată în imprevizibilitate, salturi creative sau formulări pur și simplu ciudate.
Așadar, un scor de perplexitate scăzut poate fi un indiciu că ceva provine de la un AI, dar nu este niciodată folosit în mod izolat, deoarece, ei bine, chiar și oamenilor le place să pară evidenți uneori.
Burstiness
Burstiness măsoară cât de multă varietate are scrisul tău.
Autorii umani manifestă, de obicei, o mai mare spontaneitate, deoarece amestecăm în mod natural lucrurile între rânduri scurte și rapide și rânduri complexe și întinse.
Inteligența artificială are tendința de a merge la sigur. Nu face ocoluri ciudate și nu iese brusc de pe șine în mijlocul gândirii. Iar asta o face mai ușor de observat.
Poate fi detectat conținutul GPT-o1?
Chat GPT o1 nu este disponibil gratuit și nici nu mai face parte din planul regulat Plus.
Acesta a fost ridicat la planul Pro al OpenAI, care începe de la un preț piperat de $200.
Acum, chiar dacă nu avem acces public complet pentru a testa GPT o1 noi înșine, putem totuși face o presupunere educată cu privire la detectabilitatea sa.
OpenAI a precizat destul de clar că acest model a fost construit cu gândul la STEM.
Deci, pe baza acestui fapt, este un pariu sigur că abilitatea modelului de a imita scrisul uman va fi destul de medie, dacă nu chiar foarte proastă.
Datorită câtorva canale YouTube care au postat exemple de rezultate de la modelele Chat GPT o1, în special o1-mini și o1-preview, am putut rula aceste texte prin instrumente de detectare populare și să vedem ce fel de semnale roșii apar.
Sunt o1-mini și o1-preview de la OpenAI cu adevărat nedetectabile?
Am extras două mostre de text direct din videoclipurile YouTube care au rulat promptere prin o1-preview și o1-mini.
Să vedem dacă rezultatele lor se pot strecura printre detectoarele de inteligență artificială fără a declanșa alarme.
Este o1-preview detectabil?
Am selectat un eșantion de text dintr-un video de The Nerdy Novelist, unde modelul o1-preview a generat un scurt articol intitulat "Helen of Troy: Chipul care a lansat o mie de corăbii".
Ne-am concentrat pe introducere și pe primele două titluri, care însumau 265 de cuvinte în total.
Am aruncat textul în AI nedetectabil, QuillBot, și Originalitate.ai, doar pentru a acoperi toate bazele.
AI nedetectabil nu a fost impresionat. A marcat 99% din conținut ca fiind generat de AI și nu s-a oprit aici.
De asemenea, a prezis că și alți detectori - precum QuillBot, ZeroGPT și Grammarly - vor ajunge la aceeași concluzie. Deci, să confirmăm acest lucru prin rularea textului prin QuillBot.
QuillBot i-a urmat exemplul. Acesta a marcat textul ca fiind 100% probabil AI.
Dar îi place să ofere un beneficiu al îndoielii. Puteți trece pe diferite părți ale textului și să vedeți nivelurile de încredere: scăzut, moderat, ridicat.
Și mai este Originality.ai. Acesta a venit cu 100% încredere că textul a fost scris AI. Nu 98%. Nu 99. 100. Și nici măcar nu folosește cuvântul "probabil".
Este o1-mini detectabil?
Acum să vorbim despre o1-mini.
Textul pe care l-am folosit aici este din un alt YouTuber care a folosit un prompt mult mai bun, iar asta se vede. Scrisul a avut mai multă personalitate și un flux mai uman.
Detectoarele AI au observat și ele. QuillBot a numit-o pe aceasta aproximativ 45% AI, 55% uman. Acesta este de fapt un rezultat decent.
Dacă ai citi-o rapid, fără să verifici, ai putea chiar să crezi că o persoană a scris-o.
Dar nu te simți prea confortabil. Undetectable AI și Originality.ai nu au fost păcălite.
Amândoi au spus că este vorba de inteligență artificială, cu o certitudine de 99% și, respectiv, 100%. Așadar, chiar și cu un prompt mai bun, scrisul nu a putut trece de gard.
Ceea ce ne aduce la concluzia finală: OpenAI o1-preview și o1-mini sunt cu siguranță detectabile, mai ales dacă utilizați un Detectorul AI al lui Undetectable.
Puteți să vă modificați promptul, să vă reformulați frazele, poate chiar să păcăliți un instrument ici și colo. Dar Chat GPT o1 are încă șanse mari de a fi detectat ca detectare AI.
Cum să ocoliți detectoarele AI cu GPT-o1
Deci, aveți noul text strălucitor direct din GPT o1 - curat, rapid și straniu de coerent. Grozav. Dar acum vine adevărata șmecherie: să-l faci să arate ca și cum un om chiar l-a scris.
Odată ce GPT o1 și-a făcut treaba, nu trebuie doar să îl postați brut. Trebuie să faci să pară că a fost scrisă de un om.
Dar în loc să o faceți manual, o puteți face prin intermediul AI humanizers.
Aceste instrumente știu cum să ia un text care sună robotic și să îi dea un pic de ciudățenie umană. Genul pe care detectoarele se străduiesc să îl decodifice.
Dar iată care este treaba. Există destul de multe instrumente pentru acest scop care promit să vă "umanizeze" textul, dar sfârșesc prin a-l face să sune ca un text refăcut prost.
De aceea, inteligența artificială nedetectabilă merită o atenție deosebită.
Setul nostru de instrumente, cum ar fi Umanizator, Scriitor pe furiș, și Parafrazator înțeleg de fapt cum gândesc detectoarele AI.
- Humanizer ajustează fluxul și frazarea suficient de mult pentru a trece neobservat.
- Stealth Writer adaugă variații în structura propoziției, ceea ce este esențial pentru confundarea clasificatorilor.
- Iar Parafrazatorul remodelează textul, păstrând intact sensul original.
Practic, aceste instrumente cunosc limbajul inteligenței artificiale și știu cum să o scoată din joc.
Așadar, dacă utilizați GPT o1 pentru scriere și doriți ca munca dvs. să treacă drept umană, nu săriți peste etapa de postprocesare.
Chiar și o mică curățare folosind AI nedetectabil poate face o mare diferență în învingerea instrumentelor de detectare.
Descoperiți AI Detector și Humanizer chiar în widgetul de mai jos!
GPT-o1 vs GPT-4o: Care este mai detectabil?
Am vorbit deja despre faptul că GPT o1 se axează în mare măsură pe matematică și știință, în timp ce GPT-4o are ceva mai multă finețe când vine vorba de limbă. Dar cum se compară GPT o1 vs 4o la scris?
În primul rând, am folosit acest prompt pentru a genera 400 de cuvinte de conținut folosind GPT 4o:
Apoi, am rulat rezultatul GPT-4o prin aceleași trei detectoare AI: Undetectable AI, QuillBot și Originality.ai.
AI nedetectabil a marcat 99% din conținut ca fiind AI. Aceasta este o detectare impresionantă a IA, nu-i așa?
Apoi QuillBot a intervenit și a spus: "Nu așa de repede". Acesta a marcat 73% din același text ca fiind generat de AI, o apreciere chiar mai aspră decât cea pe care a dat-o GPT o1-mini, pe care l-a notat la 45%.
Originality.ai era încă blocat în modul suspiciune totală. Acesta a înregistrat conținutul GPT-4o la 100% AI, la fel ca întotdeauna.
Deci, ce înseamnă toate acestea? Cele mai multe detectoare Ai, cum ar fi Undetectable AI și Orginality AI, sunt bune la prinderea ChatGPT o1 și 4o text.
Dar dacă ținem scorul, GPT o1 este în mod clar mai detectabil. Prin intermediul mai multor detectoare, acesta a fost semnalat în mod constant la 99-100% AI, chiar și cu promptare îmbunătățită.
Și sincer, asta are sens. GPT o1 nu a fost construit pentru a fi un model lingvistic. Este un model STEM-first, construit pentru a rezolva probleme.
GPT-4o, pe de altă parte, știe cum să sune mai natural, mai ales atunci când este asociat cu un prompt solid.
Deci, dacă alegeți între cele două pentru sarcini de scriere în care stealth contează, GPT-4o este cea mai bună șansă de a trece neobservat.
Verdict final: GPT-o1 este detectabil?
Constatările noastre concluzionează că da, GPT o1 este detectabil.
Chiar și cu un prompt decent, textul pe care îl generează încurcă majoritatea detectoarelor AI.
Dar, ca să fim corecți, scrisul nu a fost sarcina pentru care a fost pregătit. GPT o1 a fost construit pentru sarcini legate de STEM, cum ar fi rezolvarea ecuațiilor, codificarea și procesarea datelor.
Așadar, dacă încercați să creați conținut care să sune uman, GPT o1 probabil că nu este modelul potrivit. Ar fi mai bine să folosiți GPT-4o, care are mai multă fluență lingvistică, sau, mai bine, să folosiți un instrument creat special pentru a scrie conținut AI nedetectabil.
Aici intervine AI nedetectabil.
noastre AI Humanizer vă rescrie conținutul într-un mod care sună natural, nuanțat și convingător de uman.
Fie că scrieți articole de blog, eseuri sau descrieri de produse, se adaptează la subiectul dvs. fără a declanșa alarmele de detectare a inteligenței artificiale.
Și apropo de alarme, dacă doriți să testați cât de detectabil este conținutul dvs. (fie că este de la GPT o1, GPT-4o sau orice alt model), detectorul nostru AI este unul dintre cele mai precise instrumente de pe piață.
Așadar, săriți peste presupuneri.