Como detectar o ChatGPT: Ferramentas e dicas para detecção

Desde seu lançamento em novembro de 2022, nenhum aplicativo teve um impacto maior no mundo do que o ChatGPT.

Ele provocou, quase sozinho, a revolução da IA, que está se espalhando por quase todos os setores da Terra.

No topo dessa lista está o mundo da criação e publicação de conteúdo.

Há milhares de anos, os seres humanos colocam a caneta no papel ou os dedos em um teclado e imprimem palavras manualmente.

Mas com a introdução do ChatGPT, tudo isso mudou para sempre.

Com apenas algumas instruções simples, as pessoas podem usar o ChatGPT para produzir artigos em questão de segundos.

Mas com mais de 100 milhões de usuários em todo o mundo, as pessoas começaram a se perguntar como detectar o ChatGPT ao ler conteúdo on-line.

Então, o ChatGPT pode realmente ser detectado? Com certeza.

Este artigo discutirá as melhores ferramentas e dicas para detectar o ChatGPT e como você pode usá-las a seu favor.

O que é o ChatGPT?

Ele foi originalmente apresentado em 2022 pela empresa OpenAI como um modelo de linguagem grande, ou LLM, para nos ajudar a realizar uma ampla variedade de tarefas.

Os LLMs são frequentemente descritos como chatbots, pois os usuários podem conversar casualmente com o ChatGPT para obter o resultado desejado.

O GPT significa Generative Pre-trained Transformer (transformador pré-treinado generativo), que foi ajustado para fornecer informações e respostas em um tom de conversa casual.

O modelo atual do ChatGPT é o GPT4, que foi lançado em março de 2023.

O ChatGPT continuou a evoluir para se tornar mais do que apenas um LLM.

Atualmente, o sistema pode identificar imagens e usar conversão de texto em fala para fornecer áudio semelhante ao humano.

Ele também está integrado a milhares de aplicativos diferentes, incluindo o conjunto de aplicativos da Microsoft, como o Teams e o navegador da Web Bing.

A Microsoft possui uma participação de 10% na OpenAI e contratou o ex-fundador e CEO Sam Altman para chefiar sua própria força-tarefa de IA.

O ChatGPT pode realmente ser detectado?

A resposta é sim, mas também não, e vamos explicar.

Se você quiser ser literal, o ChatGPT não pode ser detectado com 100% de certeza por nenhuma ferramenta de detecção humana ou de IA.

Mesmo que você use um detector de IA para analisar um determinado artigo ou passagem, ele só informará a probabilidade de ele ter sido criado por IA.

Ele não pode lhe dizer especificamente que foi o ChatGPT que o produziu ou outro LLM, como o Claude AI ou o Google Bard.

O que podemos identificar na escrita gerada por IA são certos padrões previsíveis.

Esses padrões aparecerão em relação a aspectos como a sintaxe e a estrutura das frases do texto.

Outras medidas são usadas, como a explosão do texto, que significa essencialmente a variação do comprimento da frase, e a perplexidade, que é o grau de complexidade do texto.

Quem precisaria de um detector de ChatGPT?

Qualquer pessoa que lide com material ou conteúdo publicado de alguma forma deve usar uma ferramenta de detecção de ChatGPT.

Essas ferramentas têm sido particularmente úteis para os professores determinarem a desonestidade acadêmica e para os editores que recebem trabalhos plagiados e gerados por IA.

Mas os detectores de IA podem ajudar praticamente qualquer pessoa que leia artigos ou blogs on-line.

Parte do problema com LLMs como o ChatGPT é que eles podem fornecer resultados plagiados ou factualmente imprecisos.

Isso é conhecido como alucinações de IA e, a menos que você pesquise e verifique os fatos, poderá, sem saber, publicar informações inegavelmente falsas.

Como posso saber se algo foi escrito pelo ChatGPT?

Embora seja difícil determinar se algo foi escrito pelo ChatGPT, você não precisa de uma ferramenta de detecção de IA para reconhecer alguns dos padrões.

Aqui estão 8 coisas que podem indicar que o que você está lendo foi produzido pelo ChatGPT.

1. Procure padrões e inconsistências

Como mencionamos, há muitos padrões reconhecíveis que aparecem em textos gerados por IA.

Isso não precisa ser apenas padrões na sintaxe ou na estrutura do texto, mas também em como o próprio texto pode ser preditivo.

A IA não é capaz de pensar fora da caixa e prefere fornecer um resultado seguro e consistente que seja fácil de ler e entender.

A simplicidade excessiva e a linguagem previsível são marcas registradas de textos criados por IA.

2. Verifique se há sinais de erro humano

Talvez você não perceba, mas a maioria dos textos escritos por humanos contém algum tipo de erro.

Isso é completamente normal e tem sido a norma há séculos.

Escritores humanos com editores humanos certamente podem deixar passar algo como pontuação incorreta ou problemas gramaticais ou de tempo verbal.

Mas, em comparação com o texto da IA, a escrita humana é mais refinada e natural.

As ferramentas de IA, como o ChatGPT, não estão escrevendo o texto, mas produzindo-o a partir de todos os dados com os quais foram treinadas.

Isso pode incluir erros de gramática ou de escolha de palavras que soarão estranhos para nós, mas indiscerníveis para a própria ferramenta de IA.

3. Procure a falta de linguagem descritiva

É exatamente isso que a pontuação de perplexidade representa para o conteúdo gerado por IA.

A maioria dos LLMs é projetada e programada para não confundir o usuário. Por esse motivo, essas ferramentas usam uma linguagem mais simples e fácil de entender.

Também há falta de diversidade quando se trata da escolha de palavras, e você perceberá isso quando as mesmas palavras ou frases aparecerem várias vezes no mesmo texto.

4. Preste atenção ao contexto

Por que você precisa prestar atenção ao contexto? Porque as ferramentas de IA geralmente são muito ruins em fornecê-lo.

Lembre-se de que a IA está essencialmente produzindo o resultado e as respostas de conjuntos de dados anteriores.

Não é necessariamente fácil para o ChatGPT entender continuamente novos contextos para cada conversa.

O ChatGPT está ficando mais inteligente e pode aprender e ser treinado para entender o contexto de conversas anteriores.

Porém, quando se trata da saída de texto da conversa, o ChatGPT e outras ferramentas de IA ainda são muito ruins em fornecer contexto que, de outra forma, seria muito fácil para os escritores humanos incluírem.

5. Uso excessivo de palavras de transição

As palavras de transição são excelentes para unir frases e ideias.

Essa estrutura é natural para os escritores humanos, mas para as ferramentas de IA, elas parecem compensar com palavras de transição.

Esses LLMs são treinados para fornecer estruturas e comprimentos de frases semelhantes.

Para combater isso, parece que eles também têm um algoritmo hiperativo que tenta unir frases ou conceitos de uma forma não natural.

Se parecer estranho quando você o ler, é provável que a IA tenha participado da produção desse texto.

6. Frases que parecem corretas, mas não fazem sentido

Se você já viu essas frases que parecem corretas, mas que estão um pouco erradas quando se tenta entendê-las, é provável que tenham sido escritas por IA.

Essas ferramentas são bem treinadas quando se trata de coisas como estrutura de frases, mas muitas vezes podem errar o alvo quando se trata do assunto da frase.

Lembre-se sempre de que o ChatGPT e outras ferramentas de IA estão apenas regurgitando dados que aprenderam em outro lugar, e isso pode resultar em algumas frases e sentenças estranhas.

7. Falta de originalidade

Quando você lê a maioria dos textos de IA, simplesmente não há nenhuma originalidade neles.

Não há a nuance e a alma de um escritor humano. Há um motivo pelo qual as diretrizes EEAT do Google estão dificultando a classificação do conteúdo gerado por IA.

O Google está procurando exemplos de experiência, conhecimento especializado, autoridade e confiabilidade no conteúdo.

Essas são todas as coisas que a IA tem dificuldade em fornecer, especialmente de uma forma original e instigante.

Houve até mesmo exemplos de textos de IA que foram completamente plagiados de outra fonte.

As ferramentas de IA são incrivelmente úteis, mas carecem de originalidade em comparação com os seres humanos.

8. Erros de fato

Já falamos brevemente sobre as alucinações da IA e, infelizmente, elas ainda são o custo de fazer negócios com uma ferramenta de escrita com IA.

Se o ChatGPT fornecer um resultado factualmente impreciso, caberá ao usuário verificar a autenticidade e a precisão.

O próprio ChatGPT pode fornecer erros factuais sem piscar um olho.

Se você perceber que certas coisas estão flagrantemente incorretas em um texto, então há uma boa chance de que tenha sido uma ferramenta de IA ou um autor humano terrivelmente mal informado.

Como identificar a desinformação gerada pelo ChatGPT?

Infelizmente, a desinformação faz parte do território quando se usa ferramentas de IA para produzir conteúdo.

Mas como você pode identificar informações incorretas no texto que foi gerado pelo ChatGPT?

É difícil e você precisa investigar um pouco, mas, em algum momento, será capaz de reconhecer os sinais de desinformação.

Comece com frases estranhas, fatos ou frases repetidas que se destacam no texto.

Aqui está sua primeira pista: O ChatGPT e outros LLMs geralmente apresentam erros de pontuação ou gramaticais quando estão alucinando.

Outra maneira de detectar informações incorretas é o teste do bom senso humano: se algo que você ler parecer suspeito, verifique os fatos.

Quando um LLM estiver alucinando, ele dará sua resposta na mesma saída casual e de conversação.

Não há como ele saber que seu resultado é factualmente incorreto!

Quais ferramentas são usadas para detectar o ChatGPT?

Se precisar de uma ferramenta que detecte a gravação do ChatGPT, você está com sorte.

O setor de detectores de IA explodiu com dezenas de aplicativos diferentes que afirmam ser capazes de identificar textos gerados por IA.

Eles funcionam? Em graus variados. Aqui estão nossas escolhas das melhores ferramentas para detectar conteúdo criado pelo ChatGPT.

SEO.ai

Além de ter um dos URLs mais legais do setor de IA, o SEO.AI também oferece uma longa lista de ferramentas de IA gratuitas e pagas para criadores de conteúdo.

A principal oferta do site é uma plataforma que ajuda a gerar conteúdo compatível com SEO, com alta classificação na SERP e otimizado para o Google EEAT.

Mas SEO.ai também oferece uma ferramenta gratuita de detecção de IA. Essa ferramenta pode detectar as versões GPT-3.5 e GPT-4 mais recentes do ChatGPT e de outros LLMs, como o Google Bard.

A SEO.ai afirma que o detector pode sinalizar conteúdo gerado por IA com uma precisão de 98,4%.

Copyleaks

O Copyleaks é uma ferramenta de IA bem conhecida que pode ajudar a identificar conteúdo plagiado ou gerado por IA.

Um relatório de julho de 2023 de uma equipe da Universidade de Cornell mostra que o Copyleaks era a ferramenta de detecção de IA mais precisa do mercado, com uma precisão de 99,1%.

Essa ferramenta vem com uma versão gratuita e uma versão premium paga que oferece muitos recursos adicionais, como detecção de até 30 idiomas diferentes e varreduras ilimitadas.

Ele ainda vem com uma extensão do Google Chrome para que você possa usar o Copyleaks com qualquer site que esteja aberto em uma janela do Chrome.

GPTZero

GPTZerocomo o próprio nome sugere, é uma ferramenta de IA que pode ser usada para detectar se o conteúdo foi escrito pelo ChatGPT ou por qualquer outro LLM.

Ela afirma que é o padrão ouro em detecção de IA e a ferramenta de detecção de IA mais confiável do mercado.

A GPTZero fez uma parceria com a Federação Americana de Professores para garantir a honestidade acadêmica em milhões de salas de aula em todo o país.

Esse aplicativo também oferece uma versão gratuita e uma versão premium.

A versão gratuita tem um limite de 5.000 caracteres para varreduras e um limite total de 10.000 palavras por mês.

Um preço de $10/mês lhe dará até 150.000 palavras e $16/mês lhe dará até 300.000 palavras por mês.

O GPTZero também oferece varredura de arquivos e documentos em lote, varredura de plágio e uma API e extensão para o Google Chrome.

Esse aplicativo afirma ter uma precisão de 99% quando se trata de detectar conteúdo escrito por humanos e uma precisão de 85% na identificação de conteúdo gerado por IA.

Detector de saída GPT-2

O detector de saída GPT-2 é uma ferramenta de código aberto que pode detectar texto escrito por IA em comparação com texto escrito por humanos.

Essa ferramenta foi criada com o uso de uma versão ajustada do modelo RoBERTa e utilizou o modelo GPT-2 de 1,5B de parâmetros.

Esse detector de IA ostentou uma taxa de precisão de 99,8%, embora seja potencialmente limitado por não incluir os modelos GPT-3.5 e GPT-4 mais recentes.

PoemaDeCitações

O PoemOfQuotes pode não ser a ferramenta de detecção de IA mais óbvia, mas certamente funciona.

Esse site é usado como uma página de geração de poemas de IA que foi treinada com mais de 178 bilhões de parâmetros.

A ferramenta de detecção de IA é fornecida pelo site Detector de IA Pro e pode se integrar diretamente ao Microsoft Word e ao Google Docs.

Esse aplicativo fornecerá até mesmo relatórios que descrevem quais partes do seu texto provavelmente foram escritas por IA e quais foram escritas por um ser humano.

Há uma versão premium paga que custa $13,99/mês para 100 relatórios ou $24,99/mês para relatórios ilimitados.

Corretor

A ferramenta de detecção do Corrector AI é totalmente gratuito, embora tenha um limite de 800 palavras por exame.

O site afirma que seu detector de IA é 100% preciso e, ao contrário de outros detectores, pode detectar conteúdo criado por cada iteração do ChatGPT, incluindo o GPT-4.

A ferramenta de detecção de IA do Corrector pode identificar o conteúdo criado por ferramentas de IA como ChatGPT, Google Bard, Jasper AI, SurferSEO e Quillbot.

Conteúdo em escala

Conteúdo em escala é uma ferramenta de conteúdo de IA de solução completa que oferece um detector de IA como uma de suas opções.

Esse detector de IA tem uma suposta taxa de precisão de 98,3% e recentemente atualizou sua modelagem para corresponder à do GPT-4, Google Bard e Claude AI.

O Content at Scale se gaba de ter o sistema de pontuação mais simples que alerta os usuários se o conteúdo foi criado por um ser humano ou por uma ferramenta de redação de IA.

Após cada verificação, o Content at Scale também fornecerá uma análise frase a frase, sinalizando as seções que parecem ser geradas por IA.

Incluída no custo do detector de IA está a ferramenta de escrita de IA generativa do Content at Scale, que não apenas o ajudará a produzir conteúdo de alta qualidade, mas também ajudará a reescrever conteúdo antigo e conteúdo gerado por IA de uma maneira mais humana.

Para varreduras ilimitadas do detector de IA e até 25.000 palavras indetectáveis de IA, o Content at Scale cobra apenas $49/mês.

Roberta OpenAI Detector - Huggingface

A Huggingface é uma comunidade de IA on-line franco-americana que permite que os desenvolvedores colaborem e compartilhem aplicativos de aprendizado de máquina.

Não é de surpreender que a Hugginface tenha produzido algumas ferramentas de IA que se tornaram populares não apenas na comunidade de desenvolvedores, mas também no setor de conteúdo convencional.

O detector Roberta OpenAI já foi apresentado anteriormente neste artigo como a plataforma para o detector de saída GPT-2.

Roberta, ou roBERTa, como é conhecida, é um modelo de IA que foi baseado no modelo BERT do Google de 2018.

O Roberta foi treinado em um conjunto de dados muito maior do que o BERT e usa uma arquitetura de programa ligeiramente diferente.

Detector de ChatGPT - Huggingface

(Parece ser o mesmo que os outros detectores de IA Huggingface?) A página da Web que encontrei foi https://huggingface.co/spaces/Hello-SimpleAI/chatgpt-detector-single o que parece estranho, já que há erros de ortografia e metade do texto está em chinês.

GLTR

GLTR ou Sala de Teste do Modelo Gigante de Linguagem é um detector de IA que fornece uma sobreposição visual do texto que codifica por cores quais palavras ou frases foram criadas por IA.

O GLTR.io usa a plataforma GPT-2 117M como base para analisar e identificar textos gerados por IA.

Em vez de uma assinatura paga, o GLTR é um código-fonte aberto que está disponível para acesso pelos desenvolvedores no GitHub.

A demonstração gratuita também está disponível para uso em seu site para quem quiser testá-la.

O esquema de código de cores da ferramenta é ótimo para identificar diferentes padrões de linguagem, alguns dos quais são obviamente usados com mais frequência pelas ferramentas de escrita de IA.

A única desvantagem é que ele é treinado no modelo GPT-2, agora desatualizado, o que significa que pode não ser tão eficaz na sinalização de conteúdo gerado por IA das versões mais recentes do GPT.

Escritor

A ferramenta de detecção de IA do Writer é gratuito para uso em seu site e é totalmente treinado em GPT-4 e ChatGPT.

Atualmente, o limite para digitalização de conteúdo no Writer é de 1.500 caracteres, embora não haja limites para o número de vezes que você digitaliza o conteúdo.

É uma ferramenta extremamente simples de usar e fornece uma pontuação de detecção imediata após a leitura do texto.

O Writer vem com outras ferramentas, incluindo uma ferramenta de geração de conteúdo com IA e um verificador de plágio com IA.

Esses outros produtos permitem a integração de extensões diretamente em outros aplicativos, incluindo o Figma e o Google Chrome.

Aqui está um exemplo desse parágrafo digitalizado pelo Writer para detecção de IA.

O ChatGPT tem uma marca d'água?

No momento, o ChatGPT não usa marca d'água em seus textos ou imagens. Esse tem sido um tópico controverso desde que o ChatGPT foi lançado em 2022.

Com a recente pressão dos órgãos reguladores dos EUA, a Casa Branca informou que várias empresas, incluindo a OpenAI e a Meta concordaram em trabalhar para adicionar marcas d'água ao seu conteúdo gerado por IA.

O que exatamente é uma marca d'água de IA? É uma forma de incorporar indicadores digitais no próprio texto.

Na maioria das vezes, essas assinaturas não serão detectáveis pelo olho humano, mas as ferramentas de detecção e os scanners de IA poderão reconhecer a sequência como exclusiva do ChatGPT.

Acredita-se que essas marcas d'água permitirão que as pessoas identifiquem facilmente quando textos, vídeos ou imagens foram criados por IA em vez de humanos.

O Google está interessado em detectar se o ChatGPT escreve um texto?

Esse tem sido outro debate interessante no setor de conteúdo.

Como você sabe, o segredo para monetizar um site ou blog é obter uma classificação elevada nas SERPs por meio da otimização de palavras-chave e SEO.

O Google recebe mais de 90% do tráfego mundial da Internet, portanto, se há um conjunto de diretrizes que você deve seguir, são as diretrizes de SEO do Google.

Depois que o ChatGPT foi lançado, o Google revisou suas diretrizes para incluir os princípios do EEAT.

Isso significa Experiência, Expertise, Autoridade e Confiabilidade.

O Google não se importa explicitamente se você usa IA para produzir conteúdo. Ele menciona especificamente o conteúdo gerado por IA como não sendo contra suas diretrizes, desde que não seja considerado spam.

O problema com o conteúdo gerado por IA é que ele nunca fornecerá a perspectiva de um ser humano ou uma experiência em primeira mão.

De acordo com as diretrizes de EEAT do Google, isso significa que o conteúdo estritamente produzido por IA geralmente não terá uma classificação muito alta.

Para isso, é necessário que você mesmo edite manualmente o conteúdo ou use uma ferramenta como a que discutiremos na próxima seção.

Como tornar o texto do ChatGPT indetectável?

Então, se o conteúdo produzido por IA não tem uma classificação alta, como podemos fazer com que os detectores de IA e até mesmo o próprio Google não consigam detectar que você usou o ChatGPT para produzir seu conteúdo? Tornando-o indetectável.

Indetectável.AI é a principal ferramenta de codificação de IA que pega seu conteúdo humano ou gerado por IA e o humaniza com o clique de um botão.

Essa ferramenta garante que seu conteúdo humanizado não será sinalizado como gerado por IA por alguns dos melhores detectores de IA do mercado. Entre eles estão o ZeroGPT, o Writer, o Copyleaks e o Sapling.

Independentemente de você estar usando o ChatGPT para produzir seu conteúdo ou escrevê-lo por conta própria, o Undetectable.AI é indispensável para qualquer criador de conteúdo que esteja usando IA para dimensionar sua produção de conteúdo.

Por um preço tão baixo quanto $9.99/mês para até 10.000 palavras ou apenas $5.00/mês quando você paga anualmente, o Undetectable.AI é um custo mínimo para a tranquilidade de todo escritor.

Conclusão

Como as ferramentas de IA, como o ChatGPT, continuam a evoluir e melhorar, sempre haverá uma demanda por maneiras de detectar sua presença.

Há uma longa lista de ferramentas de detecção de IA que estão no mercado atualmente. Algumas são gratuitas, outras são de código aberto e outras exigem uma assinatura paga.

Mas todas elas estão trabalhando para reduzir os redatores que usam a IA como uma maneira fácil de produzir em massa conteúdo de baixa qualidade.

Embora possam ser um incômodo para os escritores, especialmente se o seu conteúdo for sinalizado como IA pelo Google, há maneiras de contornar isso.

Primeiro, você pode seguir o caminho antigo e escrever o conteúdo você mesmo ou editar manualmente o texto gerado pela IA.

O outro método é usar uma ferramenta como Indetectável.AI para concluir essa tarefa para você.

Com apenas o clique de um botão, essa ferramenta pode humanize seu conteúdo e proteger seu conteúdo de ser identificado como produzido por IA.

IA indetectável (TM)