Comment détecter ChatGPT : Outils et conseils pour la détection

Depuis son lancement en novembre 2022, aucune application n'a eu autant d'impact sur le monde que ChatGPT.

Elle est presque à elle seule à l'origine de la révolution de l'IA qui touche presque tous les secteurs d'activité de la planète.

Le monde de la création et de la publication de contenu figure en tête de liste.

Depuis des milliers d'années, l'homme met son stylo sur le papier ou ses doigts sur le clavier et imprime manuellement des mots.

Mais avec l'introduction de ChatGPT, tout cela a changé pour toujours.

Avec seulement quelques invites simples, les gens peuvent utiliser ChatGPT pour produire des articles en l'espace de quelques secondes.

Mais avec plus de 100 millions d'utilisateurs dans le monde, les gens ont commencé à se demander comment détecter le ChatGPT lorsqu'ils lisent du contenu en ligne.

Le ChatGPT peut-il donc être détecté ? Absolument.

Cet article présente les meilleurs outils et conseils pour détecter le ChatGPT et la manière dont vous pouvez les utiliser à votre avantage.

Qu'est-ce que ChatGPT ?

Il a été introduit en 2022 par la société OpenAI en tant que modèle de langage étendu (LLM) pour nous aider à accomplir une grande variété de tâches.

Les LLM sont souvent décrits comme des chatbots, car les utilisateurs peuvent converser avec ChatGPT pour obtenir le résultat souhaité.

Le GPT signifie Generative Pre-trained Transformer (transformateur génératif pré-entraîné). Il a été finement ajusté pour fournir des informations et des réponses sur un ton de conversation décontracté.

Le modèle actuel de ChatGPT est le GPT4 qui a été publié en mars 2023.

Le ChatGPT a continué à évoluer pour devenir plus qu'un simple LLM.

Aujourd'hui, le système peut identifier des images et utiliser la synthèse vocale pour fournir un son semblable à celui d'un être humain.

Il est également intégré dans des milliers d'applications différentes, notamment dans la suite d'applications de Microsoft telles que Teams et le navigateur web Bing.

Microsoft détient une participation de 10% dans OpenAI et a engagé l'ancien fondateur et PDG Sam Altman pour diriger son propre groupe de travail sur l'IA.

ChatGPT peut-il être détecté ?

La réponse est oui, mais aussi non, et nous allons l'expliquer.

Si vous voulez être littéral, ChatGPT ne peut être détecté avec une certitude de 100% par aucun outil de détection humain ou IA.

Même si vous utilisez un détecteur d'IA pour analyser un article ou un passage particulier, il ne vous indiquera que la probabilité qu'il ait été créé par l'IA.

Il ne peut pas vous dire spécifiquement que c'est ChatGPT qui l'a produit ou un autre LLM comme Claude AI ou Google Bard.

Ce que nous pouvons identifier dans les écrits générés par l'IA, ce sont certains schémas prévisibles.

Ces modèles apparaîtront pour des éléments tels que la syntaxe et la structure des phrases du texte.

D'autres mesures sont utilisées, comme l'éclatement du texte, c'est-à-dire la variation de la longueur des phrases, et la perplexité, c'est-à-dire le degré de complexité du texte.

Qui aurait besoin d'un détecteur de ChatGPT ?

Toute personne qui traite de matériel ou de contenu publié d'une manière ou d'une autre devrait utiliser un outil de détection ChatGPT.

Ces outils ont été particulièrement utiles aux enseignants pour déterminer la malhonnêteté académique et aux éditeurs qui reçoivent des travaux plagiés générés par l'IA.

Mais les détecteurs d'IA peuvent aider presque tous ceux qui lisent des articles ou des blogs en ligne.

Une partie du problème avec les LLM comme ChatGPT est qu'ils peuvent fournir des résultats plagiés ou inexacts.

C'est ce qu'on appelle les hallucinations de l'IA et, à moins de faire des recherches et de vérifier les faits, vous pourriez, sans le savoir, publier des informations indéniablement fausses.

Comment savoir si quelque chose a été écrit par ChatGPT ?

Bien qu'il soit difficile de déterminer si un texte est écrit par ChatGPT, il n'est pas nécessaire de disposer d'un outil de détection de l'IA pour reconnaître certains schémas.

Voici 8 éléments qui peuvent vous faire penser que ce que vous lisez a été produit par ChatGPT.

1. Rechercher des modèles et des incohérences

Comme nous l'avons mentionné, il existe de nombreux modèles reconnaissables dans les textes générés par l'IA.

Il ne s'agit pas seulement de modèles dans la syntaxe ou la structure du texte, mais aussi dans la façon dont le texte lui-même peut être prédictif.

L'IA n'est pas capable de sortir des sentiers battus et préfère fournir un résultat sûr et cohérent, facile à lire et à comprendre.

Les textes créés par l'IA se caractérisent par une simplicité excessive et un langage prévisible.

2. Vérifier les signes d'erreur humaine

Vous ne vous en rendez peut-être pas compte, mais la plupart des textes écrits par l'homme contiennent des erreurs.

C'est tout à fait normal et c'est la norme depuis des siècles.

Des rédacteurs et des réviseurs humains peuvent certainement passer à côté d'une ponctuation incorrecte ou d'un problème de grammaire ou de temps.

Mais par rapport au texte de l'IA, l'écriture humaine est plus soignée et plus naturelle.

Les outils d'IA comme ChatGPT n'écrivent pas le texte, mais le produisent à partir de toutes les données sur lesquelles ils ont été formés.

Il peut s'agir d'erreurs de grammaire ou de choix de mots qui nous paraissent maladroits, mais qui sont indiscernables par l'outil d'IA lui-même.

3. Rechercher l'absence de langage descriptif

C'est exactement ce que représente le score de perplexité pour le contenu généré par l'IA.

La plupart des LLM sont conçus et programmés pour ne pas dérouter l'utilisateur. C'est pourquoi ces outils utilisent un langage plus simple et plus facile à comprendre.

Il y a également un manque de diversité dans le choix des mots et vous vous en rendrez compte lorsque les mêmes mots ou phrases apparaîtront souvent plusieurs fois dans le même texte.

4. Attention au contexte

Pourquoi devriez-vous prêter attention au contexte ? Parce que les outils d'intelligence artificielle ne sont souvent pas très performants en la matière.

N'oubliez pas que l'IA produit essentiellement des résultats et des réponses à partir d'ensembles de données antérieurs.

Il n'est pas forcément facile pour ChatGPT de comprendre en permanence de nouveaux contextes pour chaque conversation.

ChatGPT devient plus intelligent et peut à la fois apprendre et être formé à la compréhension du contexte des conversations précédentes.

Mais lorsqu'il s'agit du texte de la conversation, ChatGPT et d'autres outils d'intelligence artificielle ne parviennent pas à fournir le contexte que les rédacteurs humains peuvent facilement inclure.

5. Utilisation excessive de mots de transition

Les mots de transition sont excellents pour relier les phrases et les idées entre elles.

Cette structure est naturelle pour les rédacteurs humains, mais les outils d'intelligence artificielle semblent surcompenser avec des mots de transition.

Ces LLM sont formés pour fournir des structures et des longueurs de phrases similaires.

Pour lutter contre cela, il semble qu'ils aient également un algorithme hyperactif qui tente de relier des phrases ou des concepts de manière non naturelle.

Si ce texte vous semble étrange à la lecture, il est probable que l'IA ait été impliquée dans sa production.

6. Phrases qui semblent correctes mais qui n'ont pas de sens

Si vous voyez des phrases qui ont l'air correctes mais qui sont légèrement fausses lorsque vous essayez de les comprendre, c'est qu'elles ont probablement été écrites par l'IA.

Ces outils sont bien formés lorsqu'il s'agit de structures de phrases, mais peuvent souvent manquer la cible lorsqu'il s'agit du sujet de la phrase.

N'oubliez jamais que ChatGPT et les autres outils d'IA ne font que régurgiter des données qu'ils ont apprises ailleurs, ce qui peut donner lieu à des expressions et des phrases maladroites.

7. Manque d'originalité

La plupart des textes sur l'IA ne présentent aucune originalité.

Il lui manque la nuance et l'âme d'un rédacteur humain. Ce n'est pas pour rien que les directives EEAT de Google rendent difficile le classement des contenus générés par l'IA.

Google recherche dans le contenu des exemples d'expérience, d'expertise, d'autorité et de fiabilité.

Autant d'éléments que l'IA a du mal à fournir, surtout de manière originale et stimulante.

Il y a même eu des exemples de textes d'IA entièrement plagiés à partir d'une autre source.

Les outils d'IA sont incroyablement utiles mais manquent d'originalité par rapport aux humains.

8. Erreurs factuelles

Nous avons déjà brièvement évoqué les hallucinations de l'IA et, malheureusement, elles constituent toujours le coût de l'utilisation d'un outil d'écriture par l'IA.

Si ChatGPT fournit un résultat factuellement inexact, il appartient à l'utilisateur de vérifier l'authenticité et l'exactitude de ce résultat.

ChatGPT lui-même peut fournir des erreurs factuelles sans sourciller.

Si vous remarquez que certaines choses sont manifestement incorrectes dans un texte, il y a de fortes chances qu'il s'agisse d'un outil d'intelligence artificielle ou d'un auteur humain terriblement mal informé.

Comment repérer les fausses informations générées par ChatGPT ?

Malheureusement, l'utilisation d'outils d'intelligence artificielle pour produire du contenu s'accompagne souvent d'informations erronées.

Mais comment repérer les informations erronées dans le texte généré par ChatGPT ?

C'est difficile et vous devez faire un peu de recherche, mais vous finirez par reconnaître les signes de désinformation.

Commencez par les phrases maladroites ou les faits ou expressions répétés qui ressortent du texte.

Voici votre premier indice : ChatGPT et d'autres LLM commettent souvent des erreurs de ponctuation ou de grammaire lorsqu'ils ont des hallucinations.

Un autre moyen de repérer la désinformation est le test du bon sens humain : si quelque chose que vous lisez vous semble suspect, vérifiez les faits.

Lorsqu'un LLM est en proie à des hallucinations, il répondra de la même manière décontractée et conversationnelle.

Il n'y a aucun moyen pour lui de savoir que sa production est factuellement incorrecte !

Quels sont les outils utilisés pour détecter ChatGPT ?

Si vous avez besoin d'un outil capable de détecter l'écriture ChatGPT, vous avez de la chance.

Le secteur des détecteurs d'IA a explosé avec des dizaines d'applications différentes qui prétendent toutes être capables d'identifier un texte généré par l'IA.

Fonctionnent-ils ? À des degrés divers. Voici notre sélection des meilleurs outils pour détecter les contenus créés par ChatGPT.

SEO.ai

En plus d'avoir l'une des URL les plus cool de l'industrie de l'IA, SEO.AI fournit également une longue liste d'outils d'IA gratuits et payants pour les créateurs de contenu.

L'offre principale du site est une plateforme qui aide à générer du contenu SEO-friendly qui a un classement SERP élevé et qui est optimisé pour Google EEAT.

Mais SEO.ai propose également un outil gratuit de détection de l'IA. Cet outil peut détecter les dernières versions GPT-3.5 et GPT-4 de ChatGPT et d'autres LLM comme Google Bard.

SEO.ai affirme que le détecteur peut signaler le contenu généré par l'IA avec une précision de 98,4%.

Copyleaks

Copyleaks est un outil d'IA bien connu qui permet d'identifier les contenus plagiés ou générés par l'IA.

Un rapport de juillet 2023 d'une équipe de l'université de Cornell montre que Copyleaks était l'outil de détection d'IA le plus précis du marché, avec une précision de 99,1%.

Cet outil est disponible en version gratuite et en version premium payante qui offre de nombreuses fonctionnalités supplémentaires telles que la détection de 30 langues différentes et des analyses illimitées.

Il est même accompagné d'une extension Google Chrome qui vous permet d'utiliser Copyleaks avec n'importe quel site ouvert dans une fenêtre Chrome.

GPTZero

GPTZeroComme son nom l'indique, il s'agit d'un outil d'IA qui peut être utilisé pour détecter si le contenu a été écrit par ChatGPT ou tout autre LLM.

Elle affirme être la référence en matière de détection de l'IA et l'outil de détection de l'IA le plus fiable du marché.

GPTZero s'est associé à l'American Federation of Teachers pour garantir l'honnêteté académique dans des millions de classes à travers le pays.

Cette application propose également une version gratuite et une version premium.

La version gratuite est limitée à 5 000 caractères par balayage et à 10 000 mots par mois au total.

Un prix de $10/mois vous permettra d'obtenir jusqu'à 150 000 mots et $16/mois vous permettra d'obtenir jusqu'à 300 000 mots par mois.

GPTZero propose également l'analyse de fichiers et de documents par lots, l'analyse du plagiat, ainsi qu'une API et une extension Google Chrome.

Cette application affirme avoir une précision de 99% lorsqu'il s'agit de détecter des contenus rédigés par des humains et une précision de 85% lorsqu'il s'agit d'identifier des contenus générés par l'IA.

Détecteur de sortie GPT-2

Le détecteur de sortie GPT-2 est un outil open-source qui peut détecter un texte écrit par l'IA par rapport à un texte écrit par un humain.

Cet outil a été créé en utilisant une version affinée du modèle RoBERTa et a utilisé le modèle GPT-2 à 1,5 milliard de paramètres.

Ce détecteur d'IA affiche un taux de précision de 99,8%, bien qu'il soit potentiellement limité par le fait qu'il n'inclut pas les modèles plus récents GPT-3.5 et GPT-4.

PoemOfQuotes

PoemOfQuotes n'est peut-être pas l'outil de détection d'IA le plus évident, mais il fonctionne.

Ce site est utilisé comme page de génération de poèmes par l'IA qui a été entraînée sur plus de 178 milliards de paramètres.

L'outil de détection de l'IA est fourni par le site AI Detector Pro et peut s'intégrer directement à Microsoft Word et Google Docs.

Cette application vous fournira même des rapports décrivant les parties de votre texte qui ont probablement été écrites par l'IA et celles qui ont été écrites par un humain.

Il existe une version premium payante qui vous coûtera $13.99/mois pour 100 rapports ou $24.99/mois pour un nombre illimité de rapports.

Correcteur

L'outil de détection de l'IA Corrector est entièrement gratuit, bien qu'il soit limité à 800 mots par analyse.

Le site affirme que son détecteur d'IA est 100% précis et que, contrairement à d'autres détecteurs, il peut détecter le contenu créé par toutes les itérations de ChatGPT, y compris GPT-4.

L'outil de détection de l'IA de Corrector peut identifier le contenu créé par des outils d'IA tels que ChatGPT, Google Bard, Jasper AI, SurferSEO et Quillbot.

Contenu à l'échelle

Contenu à l'échelle est un outil de contenu d'IA complet qui propose un détecteur d'IA comme l'une de ses options.

Ce détecteur d'IA a un taux de précision présumé de 98,3% et a récemment mis à jour sa modélisation pour correspondre à celle de GPT-4, Google Bard et Claude AI.

Content at Scale se targue d'avoir le système de notation le plus simple qui signale aux utilisateurs si le contenu a été créé par un humain ou par un outil d'écriture IA.

Après chaque analyse, Content at Scale fournira également une analyse phrase par phrase, en signalant les sections qui semblent être générées par l'IA.

Le coût du détecteur d'IA comprend l'outil de rédaction générative de Content at Scale qui vous aidera non seulement à produire un contenu de haute qualité, mais aussi à réécrire les anciens contenus et les contenus générés par l'IA d'une manière plus humaine.

Pour un nombre illimité d'analyses de détecteurs d'IA et jusqu'à 25 000 mots d'IA indétectables, Content at Scale ne facture que $49/mois.

Roberta OpenAI Detector - Huggingface

Huggingface est une communauté franco-américaine d'IA en ligne qui permet aux développeurs de collaborer et de partager des applications d'apprentissage automatique.

Il n'est pas surprenant que Hugginface ait produit un certain nombre d'outils d'IA qui sont devenus populaires non seulement dans la communauté des développeurs, mais aussi dans l'industrie du contenu grand public.

Le détecteur Roberta OpenAI a déjà été présenté plus haut dans cet article comme la plateforme du détecteur de sortie GPT-2.

Roberta, ou roBERTa comme on l'appelle, est un modèle d'IA basé sur le modèle Google BERT de 2018.

Roberta a été formé sur un ensemble de données beaucoup plus important que BERT et utilise une architecture de programme légèrement différente.

ChatGPT Detector - Huggingface

(Il semble que ce soit la même chose que pour les autres détecteurs Huggingface AI ? https://huggingface.co/spaces/Hello-SimpleAI/chatgpt-detector-single ce qui semble étrange puisqu'il y a des fautes d'orthographe et que la moitié du texte est en chinois.

GLTR

GLTR ou salle de test du modèle linguistique géant est un détecteur d'IA qui fournit une superposition visuelle du texte avec un code couleur pour les mots ou les phrases créés par l'IA.

GLTR.io utilise la plateforme GPT-2 117M comme base pour l'analyse et l'identification des textes générés par l'IA.

Plutôt qu'un abonnement payant, GLTR est un code ouvert auquel les développeurs peuvent accéder sur GitHub.

La démo gratuite est également disponible sur son site web pour tous ceux qui souhaitent la tester.

Le code couleur de l'outil permet d'identifier les différents modèles de langage, dont certains sont manifestement utilisés plus fréquemment par les outils de rédaction d'IA.

Le seul inconvénient est qu'il est formé sur le modèle GPT-2, désormais dépassé, ce qui signifie qu'il pourrait ne pas être aussi efficace pour repérer les contenus générés par l'IA à partir des versions GPT plus récentes.

Rédacteur

L'outil de détection de l'IA Writer est utilisable gratuitement sur son site web et est entièrement formé au GPT-4 et au ChatGPT.

Actuellement, la limite de numérisation du contenu sur Writer est de 1500 caractères, mais il n'y a pas de limite au nombre de numérisations.

Il s'agit d'un outil extrêmement simple à utiliser qui fournit un score de détection immédiat une fois que vous avez scanné votre texte.

Writer s'accompagne d'autres outils, notamment un outil de génération de contenu par l'IA et un vérificateur de plagiat alimenté par l'IA.

Ces autres produits permettent d'intégrer des extensions directement dans d'autres applications, notamment Figma et Google Chrome.

Voici un exemple de ce paragraphe analysé par Writer pour la détection de l'IA.

Est-ce que ChatGPT a un filigrane ?

Pour l'instant, ChatGPT n'utilise pas de filigrane pour son texte ou ses images. C'est un sujet controversé depuis que ChatGPT a été introduit en 2022.

Sous la pression récente des régulateurs américains, la Maison Blanche a déclaré que plusieurs entreprises, dont OpenAI et Meta ont accepté de travailler sur l'ajout de filigranes à leur contenu généré par l'IA.

Qu'est-ce qu'un filigrane AI ? Il s'agit d'une forme d'intégration d'indicateurs numériques dans le texte lui-même.

Dans la plupart des cas, ces signatures ne seront pas détectables à l'œil nu, mais les outils de détection de l'IA et les scanners seront capables de reconnaître la séquence comme étant unique à ChatGPT.

On pense que ces filigranes permettront aux gens d'identifier facilement si un texte, une vidéo ou une image a été créé par l'IA plutôt que par un être humain.

Google veut-il savoir si ChatGPT écrit un texte ?

Il s'agit là d'un autre débat intéressant dans l'industrie du contenu.

Comme vous le savez, la clé de la monétisation d'un site Web ou d'un blog consiste à obtenir un classement élevé dans les SERP grâce à l'optimisation des mots clés et du référencement.

Google voit plus de 90% du trafic internet mondial. S'il y a donc un ensemble de règles que vous devez suivre, ce sont les règles de référencement de Google.

Après la publication de ChatGPT, Google a révisé ses lignes directrices pour y inclure les principes de l'EEAT.

Il s'agit de l'expérience, de l'expertise, de l'autorité et de la fiabilité.

Google ne se préoccupe pas explicitement de savoir si vous utilisez l'IA pour produire du contenu. Elle mentionne expressément que le contenu généré par l'intelligence artificielle n'est pas contraire à ses lignes directrices tant qu'il n'est pas considéré comme du spam.

Le problème du contenu généré par l'IA est qu'il n'offrira jamais le point de vue d'un humain ou une expérience de première main.

Selon les lignes directrices EEAT de Google, cela signifie qu'un contenu strictement produit par l'IA ne sera généralement pas très bien classé.

Pour ce faire, vous devez modifier manuellement le contenu vous-même ou utiliser un outil tel que celui dont nous parlerons dans la section suivante.

Comment rendre ChatGPT Text indétectable ?

Si le contenu produit par l'IA n'est pas bien classé, comment faire pour que les détecteurs d'IA et même Google ne puissent pas détecter que vous avez utilisé ChatGPT pour produire votre contenu ? En le rendant indétectable.

Indétectable.AI est le principal outil de brouillage de l'IA qui prend votre contenu humain ou généré par l'IA et l'humanise d'un simple clic.

Cet outil garantit que votre contenu humanisé ne sera pas signalé comme étant généré par une IA par certains des meilleurs détecteurs d'IA du marché. Il s'agit notamment de ZeroGPT, Writer, Copyleaks et Sapling.

Que vous utilisiez ChatGPT pour produire votre contenu ou que vous l'écriviez vous-même, Undetectable.AI est un outil indispensable pour tout créateur de contenu qui utilise l'IA pour augmenter sa production de contenu.

Pour seulement $9.99/mois pour un maximum de 10 000 mots ou $5.00/mois pour un paiement annuel, Undetectable.AI est un coût minime pour la tranquillité d'esprit de tout écrivain.

Conclusion

Alors que les outils d'IA tels que ChatGPT continuent d'évoluer et de s'améliorer, il y aura toujours une demande pour des moyens de détecter leur présence.

Il existe une longue liste d'outils de détection d'IA sur le marché aujourd'hui. Certains sont gratuits, d'autres sont open source et d'autres encore nécessitent un abonnement payant.

Mais tous s'efforcent de réduire le nombre de rédacteurs qui utilisent l'IA comme un moyen facile de produire en masse du contenu de qualité médiocre.

Bien qu'ils puissent constituer une gêne pour les rédacteurs, en particulier si votre contenu est signalé comme étant de l'IA par Google, il existe des moyens de contourner ce problème.

Tout d'abord, vous pouvez opter pour la méthode traditionnelle et rédiger le contenu vous-même ou éditer manuellement le texte généré par l'IA.

L'autre méthode consiste à utiliser un outil comme Indétectable.AI pour accomplir cette tâche à votre place.

D'un simple clic, cet outil peut humanisez votre contenu et protégez votre contenu contre l'identification par l'IA.

IA indétectable (TM)