Como detetar ChatGPT: Ferramentas e dicas para deteção

Desde o seu lançamento em novembro de 2022, nenhuma aplicação teve um impacto maior no mundo do que o ChatGPT.

Quase sozinha, provocou a revolução da IA, que está a atingir quase todas as indústrias do mundo.

No topo dessa lista está o mundo da criação e publicação de conteúdos.

Durante milhares de anos, os seres humanos têm vindo a colocar a caneta no papel ou os dedos num teclado e a imprimir palavras manualmente.

Mas com a introdução do ChatGPT, tudo isso mudou para sempre.

Com apenas algumas instruções simples, as pessoas podem utilizar o ChatGPT para produzir artigos numa questão de segundos.

Mas com mais de 100 milhões de utilizadores em todo o mundo, as pessoas começaram a colocar a questão de como detetar o ChatGPT ao ler conteúdos em linha.

Então, ChatGPT pode mesmo ser detectado? Com certeza.

Este artigo aborda as melhores ferramentas e dicas para detetar o ChatGPT e como as pode utilizar em seu benefício.

O que é o ChatGPT?

Foi originalmente introduzido em 2022 pela empresa OpenAI como um modelo de linguagem grande ou LLM para nos ajudar a realizar uma grande variedade de tarefas.

Os LLM são frequentemente descritos como chatbots, uma vez que os utilizadores podem conversar casualmente com o ChatGPT para obter o resultado pretendido.

O GPT significa Generative Pre-trained Transformer (transformador pré-treinado generativo), que foi aperfeiçoado para fornecer informações e respostas num tom de conversa informal.

O modelo atual do ChatGPT é o GPT4, que foi lançado em março de 2023.

O ChatGPT continuou a evoluir para se tornar mais do que um simples LLM.

Atualmente, o sistema pode identificar imagens e utilizar a conversão de texto em voz para fornecer áudio semelhante ao humano.

Está também integrado em milhares de aplicações diferentes, incluindo o conjunto de aplicações da Microsoft, como o Teams e o navegador Web Bing.

A Microsoft detém uma participação de 10% na OpenAI e contratou o antigo fundador e diretor executivo Sam Altman para chefiar a sua própria equipa de IA.

O ChatGPT pode realmente ser detectado?

A resposta é sim, mas também não, e nós explicamos-lhe.

Se quisermos ser literais, o ChatGPT não pode ser detectado com 100% de certeza por qualquer ferramenta de deteção humana ou de IA.

Mesmo que utilize um detetor de IA para analisar um determinado artigo ou passagem, este apenas lhe dirá a probabilidade de ter sido criado por IA.

Não pode dizer especificamente que foi o ChatGPT que o produziu ou outro LLM como o Claude AI ou o Google Bard.

O que podemos identificar na escrita gerada pela IA são certos padrões previsíveis.

Estes padrões aparecem no que respeita a aspectos como a sintaxe e a estrutura das frases do texto.

São utilizadas outras medições, como a explosão do texto, que significa essencialmente a variação do comprimento das frases, e a perplexidade, que é o grau de complexidade do texto.

Quem precisa de um detetor de ChatGPT?

Qualquer pessoa que lide de alguma forma com material ou conteúdo publicado deve utilizar uma ferramenta de deteção de ChatGPT.

Estas ferramentas têm sido particularmente úteis para os professores determinarem a desonestidade académica e para os editores que recebem trabalhos plagiados e gerados por IA.

Mas os detectores de IA podem ajudar praticamente qualquer pessoa que leia artigos ou blogues em linha.

Parte do problema com LLMs como o ChatGPT é o facto de poderem fornecer resultados plagiados ou factualmente incorrectos.

Isto é conhecido como alucinações de IA e, a menos que investigue e verifique os factos, pode publicar, sem saber, informações inegavelmente falsas.

Como é que sei se algo foi escrito por ChatGPT?

Embora seja difícil determinar se algo foi escrito por ChatGPT, não é necessária uma ferramenta de deteção de IA para reconhecer alguns dos padrões.

Aqui estão 8 coisas que podem indicar que o que está a ler foi produzido pelo ChatGPT.

1. Procurar padrões e incoerências

Como mencionámos, há muitos padrões reconhecíveis que aparecem no texto gerado pela IA.

Não se trata apenas de padrões na sintaxe ou na estrutura do texto, mas também da forma como o próprio texto pode ser previsível.

A IA não é capaz de pensar fora da caixa e prefere fornecer um resultado seguro e consistente que seja fácil de ler e compreender.

A simplicidade excessiva e a linguagem previsível são características do texto criado pela IA.

2. Verificar sinais de erro humano

Pode não se aperceber, mas a maioria dos textos escritos por humanos contém algum tipo de erro.

Isto é absolutamente normal e tem sido a norma desde há séculos.

Os redactores humanos com editores humanos podem certamente deixar passar algo como uma pontuação incorrecta ou problemas gramaticais ou de tempo.

Mas, em comparação com o texto da IA, a escrita humana é mais polida e natural.

As ferramentas de IA como o ChatGPT não estão a escrever o texto, mas sim a produzi-lo a partir de todos os dados com que foram treinadas.

Isto pode incluir erros gramaticais ou de escolha de palavras que nos soam mal mas que são indiscerníveis para a própria ferramenta de IA.

3. Procurar a falta de linguagem descritiva

É exatamente esta a pontuação de perplexidade para o conteúdo gerado por IA.

A maioria dos LLM são concebidos e programados para não confundir o utilizador. Por este motivo, estas ferramentas utilizam uma linguagem mais simples e fácil de compreender.

Há também falta de diversidade na escolha das palavras e aperceber-se-á disso quando as mesmas palavras ou frases aparecerem várias vezes no mesmo texto.

4. Prestar atenção ao contexto

Porque é que é necessário prestar atenção ao contexto? Porque as ferramentas de IA são frequentemente muito más a fornecê-lo.

Lembre-se que a IA está essencialmente a produzir os resultados e as respostas a partir de conjuntos de dados anteriores.

Não é necessariamente fácil para o ChatGPT compreender continuamente novos contextos para cada conversa.

O ChatGPT está a ficar mais inteligente e pode aprender e ser treinado para compreender o contexto de conversas anteriores.

Mas quando se trata da saída de texto da conversa, o ChatGPT e outras ferramentas de IA continuam a ser bastante fracos a fornecer contexto que, de outra forma, é muito fácil para os escritores humanos incluírem.

5. Utilização excessiva de palavras de transição

As palavras de transição são excelentes para ligar frases e ideias.

Esta estrutura é natural para os escritores humanos, mas as ferramentas de IA parecem compensar com palavras de transição.

Estes LLMs são treinados para fornecer estruturas e comprimentos de frases semelhantes.

Para combater isto, parece que também têm um algoritmo hiperativo que tenta ligar frases ou conceitos de uma forma não natural.

Se lhe parecer estranho quando o lê, é provável que a IA tenha estado envolvida na produção desse texto.

6. Frases que parecem correctas mas não fazem sentido

Se alguma vez vir estas frases que parecem correctas mas que estão ligeiramente erradas quando se tenta dar-lhes sentido, então é provável que tenham sido escritas por IA.

Estas ferramentas são bem treinadas quando se trata de coisas como a estrutura de frases, mas podem muitas vezes falhar o alvo quando se trata do assunto dessa frase.

Lembre-se sempre de que o ChatGPT e outras ferramentas de IA estão apenas a regurgitar dados que aprenderam noutro lugar e isso pode resultar em algumas frases e sentenças estranhas.

7. Falta de originalidade

Quando se lê a maior parte dos textos de IA, não há qualquer originalidade.

Falta-lhe a nuance e a alma de um escritor humano. Há uma razão pela qual as directrizes EEAT da Google estão a dificultar a classificação de conteúdos gerados por IA.

O Google está à procura de exemplos de experiência, conhecimento especializado, autoridade e fiabilidade do conteúdo.

Tudo isto são coisas que a IA tem dificuldade em fornecer, especialmente de uma forma original e estimulante.

Há mesmo exemplos de textos de IA que são completamente plagiados de outra fonte.

As ferramentas de IA são incrivelmente úteis, mas carecem de originalidade em comparação com os seres humanos.

8. Erros de facto

Já abordámos brevemente as alucinações da IA e, infelizmente, estas continuam a ser o custo de fazer negócios com uma ferramenta de escrita com IA.

Se o ChatGPT fornecer um resultado factualmente impreciso, cabe ao utilizador verificar a autenticidade e a exatidão.

O próprio ChatGPT pode fornecer erros factuais sem pestanejar.

Se reparar que certas coisas estão manifestamente incorrectas num texto, então há uma boa hipótese de se tratar de uma ferramenta de IA ou de um autor humano terrivelmente mal informado.

Como detetar a desinformação gerada pelo ChatGPT?

Infelizmente, a desinformação faz parte do território quando se utilizam ferramentas de IA para produzir conteúdos.

Mas como é que se pode detetar desinformação no texto que foi gerado pelo ChatGPT?

É difícil e é preciso investigar um pouco, mas acabará por ser capaz de reconhecer os sinais de desinformação.

Comece por frases estranhas ou factos ou frases repetidos que se destaquem no texto.

Aqui está a tua primeira pista: O ChatGPT e outros LLMs têm frequentemente erros de pontuação ou de gramática quando estão a alucinar.

Outra forma de detetar a desinformação é o teste do senso comum humano: se algo que lê lhe parece suspeito, verifique os factos.

Quando um LLM está a alucinar, dará a sua resposta com a mesma saída casual e conversacional.

Não há forma de saber que o seu resultado é factualmente incorreto!

Que ferramentas são utilizadas para detetar o ChatGPT?

Se precisar de uma ferramenta que detecte a escrita ChatGPT, está com sorte.

A indústria de detectores de IA explodiu com dezenas de aplicações diferentes que afirmam ser capazes de identificar texto gerado por IA.

Funcionam? Em graus variados. Aqui estão as nossas escolhas para as melhores ferramentas para detetar conteúdo criado pelo ChatGPT.

SEO.ai

Para além de ter um dos URLs mais fixes da indústria da IA, a SEO.AI também fornece uma longa lista de ferramentas de IA gratuitas e pagas para criadores de conteúdos.

A principal oferta do sítio é uma plataforma que ajuda a gerar conteúdos optimizados para SEO, com uma elevada classificação SERP e optimizados para o Google EEAT.

Mas SEO.ai também oferece uma ferramenta gratuita de deteção de IA. Esta ferramenta pode detetar as últimas versões GPT-3.5 e GPT-4 do ChatGPT e outros LLMs como o Google Bard.

A SEO.ai afirma que o detetor pode sinalizar conteúdos gerados por IA com uma precisão de 98,4%.

Copyleaks

O Copyleaks é uma ferramenta de IA bem conhecida que pode ajudar a identificar conteúdos plagiados ou gerados por IA.

Um relatório de julho de 2023 de uma equipa da Universidade de Cornell mostra que o Copyleaks era a ferramenta de deteção de IA mais precisa do mercado, com uma precisão de 99,1%.

Esta ferramenta tem uma versão gratuita e uma versão premium paga que oferece muitas funcionalidades adicionais, como a deteção de até 30 idiomas diferentes e análises ilimitadas.

Até vem com uma extensão do Google Chrome para que possa usar o Copyleaks com qualquer site que tenha aberto numa janela do Chrome.

GPTZero

GPTZero, como o próprio nome sugere, é uma ferramenta de IA que pode ser utilizada para detetar se o conteúdo foi escrito pelo ChatGPT ou por qualquer outro LLM.

Afirma que é o padrão de ouro na deteção de IA e a ferramenta de deteção de IA mais fiável do mercado.

O GPTZero estabeleceu uma parceria com a Federação Americana de Professores para garantir a honestidade académica em milhões de salas de aula em todo o país.

Esta aplicação também oferece uma versão gratuita e uma versão premium.

A versão gratuita tem um limite de 5000 caracteres para digitalizações e um limite total de 10 000 palavras por mês.

Um preço de $10/mês permite-lhe obter até 150 000 palavras e $16/mês permite-lhe obter até 300 000 palavras por mês.

O GPTZero também oferece digitalização de ficheiros e documentos em lote, digitalização de plágio e uma extensão API e Google Chrome.

Esta aplicação afirma ter uma precisão de 99% quando se trata de detetar conteúdo escrito por humanos e uma precisão de 85% na identificação de conteúdo gerado por IA.

Detetor de saída GPT-2

O detetor de saída GPT-2 é uma ferramenta de código aberto que pode detetar texto escrito por IA em comparação com texto escrito por humanos.

Esta ferramenta foi criada através de uma versão aperfeiçoada do modelo RoBERTa e utilizou o modelo GPT-2 de 1,5B parâmetros.

Este detetor de IA ostentou uma taxa de precisão de 99,8%, embora esteja potencialmente limitado por não incluir os modelos GPT-3.5 e GPT-4 mais recentes.

PoemaDeCitações

O PoemOfQuotes pode não ser a ferramenta de deteção de IA mais óbvia, mas funciona certamente.

Este sítio é utilizado como uma página de geração de poemas com IA que foi treinada com mais de 178 mil milhões de parâmetros.

A ferramenta de deteção de IA é fornecida pelo sítio Detetor de IA Pro e pode integrar-se diretamente com o Microsoft Word e o Google Docs.

Esta aplicação até lhe fornece relatórios que descrevem quais as partes do seu texto que foram provavelmente escritas por IA e quais as que foram escritas por um humano.

Existe uma versão premium paga que lhe custará $13.99/mês para 100 relatórios ou $24.99/mês para relatórios ilimitados.

Corretor

A ferramenta de deteção de IA Corretor é de utilização totalmente gratuita, embora tenha um limite de 800 palavras por análise.

O site afirma que o seu detetor de IA é 100% preciso e, ao contrário de outros detectores, consegue detetar conteúdos criados por todas as iterações do ChatGPT, incluindo o GPT-4.

A ferramenta de deteção de IA do Corretor pode identificar conteúdos criados por ferramentas de IA como ChatGPT, Google Bard, Jasper AI, SurferSEO e Quillbot.

Conteúdo em escala

Conteúdo em escala é uma ferramenta de conteúdo de IA de solução completa que oferece um detetor de IA como uma das suas opções.

Este detetor de IA tem uma alegada taxa de precisão de 98,3% e actualizou recentemente a sua modelação para corresponder à do GPT-4, Google Bard e Claude AI.

O Content at Scale orgulha-se de ter o sistema de pontuação mais simples que alerta os utilizadores se o conteúdo foi criado por um humano ou por uma ferramenta de escrita com IA.

Na sequência de cada análise, o Content at Scale fornecerá também uma análise frase a frase, assinalando as secções que parecem ser geradas por IA.

Incluído no custo do detetor de IA está a ferramenta de escrita de IA generativa da Content at Scale que não só o ajudará a produzir conteúdos de alta qualidade, como também ajudará a reescrever conteúdos antigos e conteúdos gerados por IA de uma forma mais humana.

Para análises ilimitadas do detetor de IA e até 25.000 palavras de IA indetectáveis, o Content at Scale cobra apenas $49/mês.

Roberta OpenAI Detetor - Huggingface

A Huggingface é uma comunidade franco-americana de IA em linha que permite aos programadores colaborar e partilhar aplicações de aprendizagem automática.

Não é de surpreender que a Hugginface tenha produzido algumas ferramentas de IA que se tornaram populares não só na comunidade de programadores, mas também na indústria de conteúdos tradicionais.

O detetor Roberta OpenAI já foi apresentada anteriormente neste artigo como a plataforma para o Detetor de Saída GPT-2.

Roberta, ou roBERTa como é conhecida, é um modelo de IA que se baseou no modelo BERT da Google de 2018.

O Roberta foi treinado com um conjunto de dados muito maior do que o BERT e utiliza uma arquitetura de programa ligeiramente diferente.

ChatGPT Detetor - Huggingface

(Parece ser o mesmo que os outros detectores Huggingface AI?) A página Web que encontrei foi https://huggingface.co/spaces/Hello-SimpleAI/chatgpt-detector-single o que parece estranho, uma vez que há erros ortográficos e metade do texto está em chinês.

GLTR

GLTR ou a sala de testes do modelo gigante de língua é um detetor de IA que fornece uma sobreposição visual do texto que codifica por cores as palavras ou frases que foram criadas pela IA.

O GLTR.io utiliza a plataforma GPT-2 117M como base para analisar e identificar textos gerados por IA.

Em vez de uma subscrição paga, o GLTR é um código-fonte aberto que está disponível para acesso pelos programadores no GitHub.

A demonstração gratuita também está disponível para utilização no seu sítio Web para quem quiser testá-la.

O esquema de código de cores da ferramenta é ótimo para identificar diferentes padrões linguísticos, alguns dos quais são obviamente utilizados com mais frequência pelas ferramentas de escrita de IA.

O único inconveniente é o facto de ter sido treinado no modelo GPT-2, agora desatualizado, o que significa que pode não ser tão eficaz na sinalização de conteúdos gerados por IA a partir das versões GPT mais recentes.

Escritor

A ferramenta de deteção de IA do Writer é de utilização gratuita no seu sítio Web e tem formação completa em GPT-4 e ChatGPT.

Atualmente, o limite para digitalizar conteúdos no Writer é de 1500 caracteres, embora não haja limites para o número de vezes que digitaliza conteúdos.

É uma ferramenta extremamente simples de utilizar e fornece uma pontuação de deteção imediata assim que o texto é digitalizado.

O Writer é fornecido com outras ferramentas, incluindo uma ferramenta de geração de conteúdos com IA e um verificador de plágio com IA.

Estes outros produtos permitem a integração de extensões diretamente noutras aplicações, incluindo o Figma e o Google Chrome.

Aqui está um exemplo deste parágrafo analisado pelo Writer para deteção de IA.

O ChatGPT tem uma marca de água?

Atualmente, o ChatGPT não coloca marcas de água nos seus textos ou imagens. Este tem sido um tópico controverso desde que ChatGPT foi introduzido em 2022.

Com a recente pressão dos reguladores dos EUA, a Casa Branca informou que várias empresas, incluindo a OpenAI e a Meta concordaram em trabalhar na adição de marcas de água aos seus conteúdos gerados por IA.

O que é exatamente uma marca de água com IA? É uma forma de incorporar indicadores digitais no próprio texto.

Na sua maioria, estas assinaturas não serão detectáveis pelo olho humano, mas as ferramentas de deteção e os scanners de IA serão capazes de reconhecer a sequência como exclusiva do ChatGPT.

Acredita-se que estas marcas de água permitirão que as pessoas identifiquem facilmente quando o texto, os vídeos ou as imagens foram criados por IA e não por humanos.

A Google está interessada em detetar se o ChatGPT escreve um texto?

Este tem sido outro debate interessante no sector dos conteúdos.

Como sabe, a chave para rentabilizar um sítio Web ou blogue é obter uma classificação elevada nos SERPs através da otimização de palavras-chave e SEO.

O Google vê mais de 90% do tráfego mundial da Internet, por isso, se há um conjunto de directrizes que deve seguir, são as directrizes de SEO do Google.

Após o lançamento do ChatGPT, a Google reviu as suas directrizes para incluir os princípios da EEAT.

Significa Experiência, Perícia, Autoridade e Confiança.

O Google não se preocupa explicitamente com o facto de utilizar a IA para produzir conteúdos. Refere especificamente que os conteúdos gerados por IA não são contrários às suas directrizes, desde que não sejam considerados spam.

O problema com os conteúdos gerados por IA é que nunca irão fornecer a perspetiva de um ser humano ou proporcionar uma experiência em primeira mão.

De acordo com as directrizes EEAT da Google, isto significa que o conteúdo estritamente produzido por IA não terá normalmente uma classificação muito elevada.

Para tal, tem de editar manualmente o conteúdo ou pode utilizar uma ferramenta como a que discutiremos na secção seguinte.

Como tornar o texto ChatGPT indetetável?

Portanto, se o conteúdo produzido por IA não tem uma classificação elevada, como é que podemos fazer com que os detectores de IA e até o próprio Google não consigam detetar que utilizou o ChatGPT para produzir o seu conteúdo? Tornando-o indetetável.

Indetetável.AI é a principal ferramenta de codificação de IA que pega no seu conteúdo humano ou gerado por IA e o humaniza com o clique de um botão.

Esta ferramenta garante que o seu conteúdo humanizado não será sinalizado como gerado por IA por alguns dos melhores detectores de IA do mercado. Estes incluem ZeroGPT, Writer, Copyleaks e Sapling.

Quer esteja a usar o ChatGPT para produzir o seu conteúdo ou a escrevê-lo você mesmo, o Undetectable.AI é um must-have para qualquer criador de conteúdo que esteja a usar IA para escalar a sua produção de conteúdo.

Por apenas $9.99/mês para até 10.000 palavras ou apenas $5.00/mês quando paga anualmente, Undetectable.AI é um custo mínimo para a paz de espírito de qualquer escritor.

Conclusão

À medida que as ferramentas de IA como o ChatGPT continuam a evoluir e a melhorar, haverá sempre uma procura de formas de detetar a sua presença.

Há uma longa lista de ferramentas de deteção de IA que estão no mercado atualmente. Algumas são gratuitas, outras são de código aberto e outras requerem uma subscrição paga.

Mas todos eles estão a trabalhar para reduzir os escritores que utilizam a IA como uma forma fácil de produzir em massa conteúdos de baixa qualidade.

Embora possam ser um incómodo para os escritores, especialmente se o seu conteúdo for assinalado como IA pelo Google, existem formas de o contornar.

Em primeiro lugar, pode seguir o caminho antigo e escrever o conteúdo você mesmo ou editar manualmente o texto gerado pela IA.

O outro método é utilizar uma ferramenta como Indetetável.AI para completar essa tarefa por si.

Com o simples clique de um botão, esta ferramenta pode humanize o seu conteúdo e proteger o seu conteúdo de ser identificado como produzido por IA.

IA indetetável (TM)