GPT o1 peut-il écrire du contenu sans se faire repérer par les détecteurs d'IA ?
C'est une question légitime.
Dans cet article, vous lirez que GPT o1 est un modèle qui a été formé pour traiter des tâches complexes liées au domaine des sciences, du codage et des mathématiques.
Mais bon, s'il peut écrire, et si vous pouvez ou non le faire passer en douce devant les détecteurs de l'IA, cela vaut la peine d'être exploré.
Voici ce que vous retiendrez de la lecture de cet article :
- Qu'est-ce que le GPT-o1 ?
- Comment fonctionnent les détecteurs d'IA ?
- Le contenu du GPT-o1 peut-il être détecté ?
- Les logiciels o1-mini et o1-preview d'OpenAI sont-ils vraiment indétectables ?
- Comment contourner les détecteurs d'IA avec GPT-o1 ?
- GPT-o1 vs GPT-4o : Lequel est le plus détectable ?
Commençons donc.
Qu'est-ce que le GPT-o1 ?
En septembre 2024, OpenAI a lancé GPT-o1-preview, ainsi qu'une variante plus légère et plus économique appelée o1-mini.
En décembre 2024, la version préliminaire a été officiellement remplacée par le modèle GPT-o1 complet.
Selon OpenAI, GPT-o1 est conçu pour résoudre des problèmes très complexes en consacrant plus de temps à la "réflexion" informatique avant de générer des réponses.
Ne vous inquiétez plus jamais de la détection de vos messages par l'IA. Undetectable AI peut vous aider :
- Faites apparaître votre écriture assistée par l'IA à l'image de l'homme.
- By-pass tous les principaux outils de détection de l'IA en un seul clic.
- Utilisation AI en toute sécurité et en toute confiance à l'école et au travail.
Il s'agit notamment de tâches avancées telles que la programmation compétitive, les mathématiques abstraites et le raisonnement scientifique, que le modèle peut traiter avec une finesse proche de celle d'un expert.
Les tests témoignent de cette expertise.
Lors des tests de référence, o1-preview s'est classé parmi les meilleurs. 89ème percentile sur Codeforces compétitions.
Sur le site Examen de mathématiques sur invitation de l'Amériqueo1 a résolu 83% de problèmes (12,5/15). À titre de comparaison, GPT-4o a à peine résolu 13% (1,8/15).
Ce modèle a également montré des compétences de niveau doctoral dans plusieurs domaines scientifiques (physique, chimie et biologie).
Il est donc clair que ce modèle a été conçu principalement pour la recherche et les applications techniques.
Différences avec GPT-3.5, GPT-4 et GPT-4o
Du point de vue de GPT-o1, les différences avec GPT-3.5, GPT-4 et GPT-4o sont à la fois subtiles et marquées, en fonction de la tâche à accomplir.
GPT-3.5 fonctionne sur un ensemble de données plus ancien avec une fenêtre contextuelle limitée à 16 385 (4 096 tokens de sortie) et offre un raisonnement de base et des compétences de codage décentes.
Il se débrouille bien avec les questions générales, mais si vous lui soumettez un problème de logique imbriquée ou un algorithme délicat, vous verrez rapidement ses limites.
Par rapport à lui, le GPT o1 opère dans une classe cognitive différente. La comparaison n'est donc pas correcte.
Le GPT-4 reste solide, plus raffiné que le 3.5 et capable d'effectuer un plus grand nombre de tâches, en particulier celles qui requièrent de la nuance. Mais même lui ne creuse pas la complexité technique avec la même rigueur qu'o1.
Le GPT-4o a encore amélioré la vitesse et les capacités multimodales, mais reste à la traîne pour les tâches analytiques approfondies.
Il est plus rapide, plus interactif et mieux équipé pour une utilisation générale. Pour l'instant, il gère mieux l'écriture créative, le chat et les tâches multimédias qu'o1.
Mais lorsqu'il s'agit de cas d'utilisation très logiques, o1 a une longueur d'avance mesurable.
Cela dit, le GPT-o1 ne dispose pas de certaines fonctions conviviales telles que la navigation sur le web ou le téléchargement de fichiers, qui sont prises en charge par le GPT-4o.
Le mode peut également être un peu laconique. Ses réponses de refus sont plus courtes et passent parfois sous silence des références ou des explications plus approfondies que 4o a tendance à inclure.
Un autre inconvénient majeur de o1 est qu'il peut amplifier les risques lorsqu'il s'agit de répondre à des requêtes dangereuses.
Par exemple, lorsqu'on l'interroge sur les techniques d'escalade, L'engagement approfondi du GPT-o1 pourrait encourager une dépendance excessivealors que le GPT-4o propose par défaut des conseils génériques.
[source]
Fonctionnalité | GPT-3.5 | GPT-4 | GPT-4o | GPT o1 |
Données de formation | Ensemble de données plus anciennes | Plus récent et plus étendu | La plus récente | La plus récente |
Jetons de sortie | 4 096 jetons | 8 192 jetons | 16 384 jetons | 100 000 jetons |
Fenêtre contextuelle | 16,385 | 8,192 | 128,000 | 200,000 |
Précision et cohérence | Bon | Amélioration significative | Haut | Exceptionnel |
Capacités de raisonnement | De base | Avancé | Avancé | Niveau doctorat |
Compétences en matière de codage | Décent | Maîtrise de la langue | Maîtrise de la langue | Niveau proche de celui d'un expert |
Écriture créative | Capable | Plus créatif et nuancé | Rapide, créatif | Non réalisable |
Vitesse de réponse | Rapide | Modéré | Le plus rapide | Plus lent (délibéré) |
Meilleur pour | Utilisation occasionnelle | Tâches générales | Vitesse + multitâche | Profondeur technique |
Fonctionnement des détecteurs d'IA
Les détecteurs d'intelligence artificielle sont devenus de plus en plus courants dans le contexte de l'essor de l'après-TGP.
Leur objectif est de déterminer si un texte a été écrit par une personne ou s'il a été produit par un modèle comme GPT-o1.
Ils émettent une hypothèse basée sur une série de mesures complexes et sur quatre concepts majeurs d'apprentissage automatique et de traitement automatique des langues.
Classificateur
Le cerveau principal de ces détecteurs s'appelle un classificateur.
Ces classificateurs sont formés sur des ensembles de données massifs étiquetés comme étant soit générés par l'IA, soit écrits par l'homme, et au fil du temps, ils apprennent ce qui différencie les deux.
Une fois le modèle formé, il peut évaluer un nouveau morceau de texte et décider de sa place dans le spectre IA-humain.
Il vérifie la fréquence de certains mots, la longueur des phrases et si l'ensemble ne semble pas trop propre.
Emboîtements
Comme les ordinateurs ne peuvent pas appréhender le langage de la même manière que nous, les embeddings convertissent les mots en vecteurs mathématiques qui représentent le sens, le contexte et les relations entre les mots.
Ainsi, lorsqu'un détecteur analyse une phrase, il regarde où se trouvent les mots dans cet espace vectoriel multidimensionnel et comment leur position est liée aux modèles observés dans les résultats humains ou de l'IA.
C'est ainsi que le système sait que "reine" et "roi" sont des choses qui vont ensemble.
Perplexité
Dans le domaine de la détection de l'IA, la perplexité est un indicateur qui mesure le degré de prévisibilité d'un texte.
Les contenus générés par l'IA ont tendance à être moins perplexes, car ils visent à produire des textes logiques et clairs.
L'écriture humaine, quant à elle, peut être plus désordonnée. Elle est plus riche en imprévisibilité, en sauts créatifs ou en formulations carrément bizarres.
Ainsi, un faible score de perplexité peut être un indice que quelque chose provient d'une IA, mais il n'est jamais utilisé de manière isolée parce que, eh bien, même les humains aiment parfois paraître évidents.
L'éclatement
L'éclatement mesure le degré de variété de votre écriture.
Les auteurs humains font généralement preuve d'une plus grande rapidité d'exécution parce qu'ils mélangent naturellement des lignes courtes et percutantes avec des lignes longues et complexes.
L'IA a tendance à jouer la carte de la sécurité. Elle ne prend pas de détours bizarres et ne déraille pas soudainement au milieu de ses pensées. Il est donc plus facile de la repérer.
Le contenu du GPT-o1 peut-il être détecté ?
Chat GPT o1 n'est pas disponible gratuitement et ne fait plus partie du plan Plus.
Il est passé à la formule Pro d'OpenAI, qui commence à $200.
Même si nous ne disposons pas d'un accès public complet pour tester nous-mêmes le GPT o1, nous pouvons tout de même émettre une hypothèse éclairée quant à sa détectabilité.
OpenAI a clairement indiqué que ce modèle avait été conçu pour les STIM.
Sur cette base, il y a donc fort à parier que la capacité du modèle à imiter l'écriture humaine sera plutôt moyenne, voire tout à fait mauvaise.
Grâce à quelques chaînes YouTube qui ont publié des exemples de sorties des modèles Chat GPT o1, en particulier o1-mini et o1-preview, nous avons pu faire passer ces textes par les outils de détection les plus courants et voir quels types de signaux d'alerte apparaissaient.
Les logiciels o1-mini et o1-preview d'OpenAI sont-ils vraiment indétectables ?
Nous avons extrait deux échantillons de texte directement de vidéos YouTube qui contenaient des invites via o1-preview et o1-mini.
Voyons si leurs résultats peuvent passer les détecteurs d'intelligence artificielle sans déclencher d'alarme.
o1-preview est-il détectable ?
Nous avons sélectionné un échantillon de texte à partir d'un vidéo par The Nerdy Novelistoù le modèle o1-preview a généré un court article intitulé "Hélène de Troie : Le visage qui a lancé mille navires".
Nous nous sommes concentrés sur l'introduction et les deux premiers titres, soit 265 mots au total.
Nous avons jeté le texte dans IA indétectable, QuillBotet Originalité.aiIl s'agit de couvrir tous les aspects de la question.
L'IA indétectable n'a pas été impressionnée. Elle a signalé 99% du contenu comme étant généré par l'IA et ne s'est pas arrêtée là.
Il a également prédit que d'autres détecteurs, comme QuillBot, ZeroGPT et Grammarly, parviendraient à la même conclusion. Confirmons donc cela en soumettant le texte à QuillBot.
QuillBot a suivi le mouvement. Il a signalé le texte comme étant 100%, probablement de l'IA.
Mais il aime accorder le bénéfice du doute. Vous pouvez survoler différentes parties du texte et voir les niveaux de confiance : faible, modéré, élevé.
Et puis il y a Originality.ai. Il est arrivé avec 100% de certitude que le texte avait été écrit par l'IA. Pas 98%. Pas 99. 100. Et il n'utilise même pas le mot "probable".
o1-mini est-il détectable ?
Parlons maintenant de o1-mini.
Le texte que nous avons utilisé ici est tiré de un autre YouTuber qui a utilisé un meilleur sujet, et cela se voit. L'écriture avait plus de personnalité et un flux plus humain.
Les détecteurs d'IA l'ont également remarqué. QuillBot a estimé qu'il s'agissait de 45% d'IA, 55% d'humain. C'est en fait un bon résultat.
Si vous le lisez rapidement sans le vérifier, vous pourriez même croire qu'une personne l'a écrit.
Mais ne prenez pas trop vos aises. L'IA indétectable et Originality.ai n'ont pas été dupés.
Ils l'ont tous deux qualifié d'IA avec respectivement 99% et 100% de certitude. Ainsi, même avec un meilleur message, l'écriture n'a pas réussi à franchir la barrière.
Ce qui nous amène à la conclusion : o1-preview et o1-mini d'OpenAI sont tout à fait détectables, surtout si vous utilisez un logiciel d'analyse de l'information de type Le détecteur d'IA d'Undetectable.
Vous pouvez modifier votre message d'accueil, reformuler vos phrases, et peut-être même tromper un outil ici et là. Mais Chat GPT o1 a toujours de grandes chances d'être détecté comme une détection de l'IA.
Comment contourner les détecteurs d'IA avec GPT-o1
Vous avez donc votre nouveau texte tout droit sorti de GPT o1 - propre, rapide et étrangement cohérent. C'est parfait. Mais voici maintenant le véritable défi : faire en sorte qu'il ait l'air d'avoir été écrit par un être humain.
Une fois que GPT o1 a fait son travail, il ne suffit pas de l'afficher tel quel. Vous devez faire en sorte qu'il ait l'air d'avoir été écrit par un humain.
Mais au lieu de le faire manuellement, vous pouvez le faire à l'aide d'humanisateurs d'IA.
Ces outils savent comment prendre un texte à consonance robotique et lui donner un peu de bizarrerie humaine. Le genre de texte que les détecteurs peinent à décoder.
Mais voilà. Il existe un grand nombre d'outils qui promettent d'"humaniser" votre texte, mais qui finissent par le faire sonner comme un texte mal remanié.
C'est pourquoi l'IA indétectable mérite d'être mise en lumière.
Notre suite d'outils tels que Humanisateur, Rédacteur furtifet Paraphraseur comprendre le mode de fonctionnement des détecteurs d'IA.
- Humanizer modifie le débit et la formulation juste assez pour passer inaperçu.
- Stealth Writer ajoute des variations dans la structure des phrases, ce qui est essentiel pour confondre les classificateurs.
- Et le paraphraseur remodèle le texte tout en gardant le sens original intact.
En fait, ces outils connaissent le langage de l'IA et savent comment la déstabiliser.
Par conséquent, si vous utilisez GPT o1 pour l'écriture et que vous souhaitez que votre travail soit considéré comme humain, ne sautez pas l'étape du post-traitement.
Même un petit nettoyage à l'aide de l'IA indétectable peut faire une grande différence pour battre les outils de détection.
Découvrez notre détecteur d'IA et notre humanisateur dans le widget ci-dessous !
GPT-o1 vs GPT-4o : Lequel est le plus détectable ?
Nous avons déjà évoqué le fait que le GPT o1 s'appuie fortement sur les mathématiques et les sciences, tandis que le GPT-4o est un peu plus fin lorsqu'il s'agit de la langue. Mais quelle est la différence entre le GPT o1 et le GPT-4o en matière d'écriture ?
Tout d'abord, nous avons utilisé cette invite pour générer 400 mots de contenu à l'aide du GPT 4o :
Ensuite, nous avons passé la sortie de GPT-4o par les trois mêmes détecteurs d'IA : Undetectable AI, QuillBot et Originality.ai.
L'IA indétectable a identifié 99% du contenu comme étant de l'IA. La détection de l'IA est impressionnante, n'est-ce pas ?
C'est alors que QuillBot est intervenu et a dit : "Pas si vite". Il a signalé 73% du même texte comme étant généré par l'IA, un jugement encore plus sévère que celui qu'il a donné au GPT o1-mini, qu'il a noté à 45%.
Originality.ai était toujours en mode suspicion totale. Il a enregistré le contenu de GPT-4o à 100% AI, comme toujours.
Qu'est-ce que cela signifie ? La plupart des détecteurs d'Ai comme Undetectable AI et Orginality AI sont capables d'attraper les textes ChatGPT o1 et 4o.
Mais si nous comptons les points, GPT o1 est clairement plus détectable. Sur plusieurs détecteurs, il a été systématiquement signalé à 99-100% AI, même avec des messages d'incitation améliorés.
Et honnêtement, c'est logique. Le GPT o1 n'a pas été conçu pour être un modèle linguistique. Il s'agit d'un modèle STEM-first, conçu pour résoudre des problèmes.
Le GPT-4o, quant à lui, sait comment sonner de manière plus naturelle, surtout lorsqu'il est associé à une prompte solide.
Par conséquent, si vous devez choisir entre les deux pour des tâches d'écriture où la discrétion est importante, GPT-4o est votre meilleure chance de passer inaperçu.
Verdict final : GPT-o1 est-il détectable ?
Nos résultats concluent que oui, le GPT o1 est détectable.
Même avec une ingénierie d'invite décente, le texte qu'il génère fait encore trébucher la plupart des détecteurs d'IA.
Mais pour être honnête, l'écriture n'était pas le travail pour lequel il a été formé. Le GPT o1 a été conçu pour des tâches liées aux STIM, telles que la résolution d'équations, le codage et le traitement de données.
Par conséquent, si vous essayez de rédiger un contenu à consonance humaine, GPT o1 n'est probablement pas le modèle idéal. Il est préférable d'utiliser GPT-4o, qui a une plus grande maîtrise du langage, ou mieux encore, d'utiliser un outil conçu spécifiquement pour rédiger un contenu IA indétectable.
C'est là que l'IA indétectable intervient.
Notre AI Humanizer réécrit votre contenu de manière à ce qu'il paraisse naturel, nuancé et humainement convaincant.
Que vous rédigiez des articles de blog, des essais ou des descriptions de produits, il s'adapte à votre sujet sans déclencher les alarmes de détection de l'IA.
En ce qui concerne les alarmes, si vous souhaitez tester la détectabilité de votre contenu (qu'il provienne de GPT o1, GPT-4o ou d'un autre modèle), notre AI Detector est l'un des outils les plus précis du marché.
Ne vous laissez donc pas influencer par les suppositions.