O conteúdo do GPT-o1 pode ser detectado por ferramentas de IA?

O GPT o1 pode escrever conteúdo sem ser apanhado pelos detectores de IA?

É uma pergunta justa. 

Neste artigo, lerá que o GPT o1 é um modelo que foi treinado para lidar com tarefas complexas relacionadas com o domínio da ciência, da codificação e da matemática. 

Mas vale a pena explorar se consegue escrever e se consegue ou não passar despercebido pelos detectores de IA.

Eis o que vai encontrar depois de ler este artigo:

  • O que é o GPT-o1?
  • Como funcionam os detectores de IA?
  • O conteúdo do GPT-o1 pode ser detectado?
  • O o1-mini e o1-preview da OpenAI são verdadeiramente indetectáveis?
  • Como contornar os detectores de IA com o GPT-o1?
  • GPT-o1 vs GPT-4o: Qual é mais detetável?

Então vamos começar.

O que é o GPT-o1?

Em setembro de 2024, a OpenAI lançou o GPT-o1-preview, juntamente com uma variante mais leve e económica denominada o1-mini. 

Em dezembro de 2024, a versão de pré-visualização foi oficialmente substituída pelo modelo GPT-o1 completo. 

De acordo com a OpenAI, o GPT-o1 foi concebido para resolver problemas altamente complexos, dedicando mais tempo ao "pensamento" computacional antes de gerar respostas. 

Nunca mais se preocupe com o facto de a IA detetar os seus textos. Undetectable AI Pode ajudar-vos:

  • Faça aparecer a sua escrita assistida por IA de tipo humano.
  • Bypass todas as principais ferramentas de deteção de IA com apenas um clique.
  • Utilização IA com segurança e com confiança na escola e no trabalho.
Experimenta GRATUITAMENTE

Isto inclui tarefas avançadas como a programação competitiva, a matemática abstrata e o raciocínio científico, que o modelo pode tratar com uma finura quase especializada.

E os testes são a prova dessa competência. 

Nos testes de benchmark, o o1-preview foi classificado no Percentil 89 no Codeforces concursos.

No Exame de Matemática por Convite Americano, o1 resolveu 83% de problemas (12,5/15). Em comparação, GPT-4o mal conseguiu resolver 13% (1,8/15).

Este modelo também revelou uma proficiência de nível de doutoramento em vários domínios científicos (física, química e biologia).

Assim, é evidente que o modelo foi concebido principalmente para aplicações técnicas e de investigação.

Como é que difere do GPT-3.5, GPT-4 e GPT-4o

Do ponto de vista do GPT-o1, as diferenças em relação ao GPT-3.5, GPT-4 e GPT-4o são subtis e marcantes, dependendo da tarefa em questão.

O GPT-3.5 funciona num conjunto de dados mais antigo com uma janela de contexto limitada de 16.385 (4.096 tokens de saída) e oferece raciocínio básico e competências de codificação decentes. 

Funciona bem com pedidos gerais, mas se lhe apresentar um problema com lógica aninhada ou um algoritmo complicado, verá rapidamente os seus limites.

Em comparação com ele, o GPT o1 opera numa classe cognitiva diferente. Portanto, a comparação não é correta.

O GPT-4 continua a ser sólido, mais refinado do que o 3.5 e capaz de realizar uma gama mais vasta de tarefas, especialmente as que requerem nuances. Mas nem mesmo ele se aprofunda na complexidade técnica com o mesmo rigor do o1. 

O GPT-4o aperfeiçoou ainda mais a velocidade e as capacidades multimodais, mas ainda ficou aquém das tarefas analíticas profundas.

É mais rápido, mais interativo e está melhor equipado para uma utilização geral. Por enquanto, lida melhor com a escrita criativa, as conversas e as tarefas multimédia do que o o1.

Mas, quando se trata de casos de utilização com muita lógica, a o1 tem uma vantagem mensurável. 

Dito isto, o GPT-o1 carece de algumas funcionalidades de fácil utilização, como a navegação na Web ou o carregamento de ficheiros, que o GPT-4o suporta.

O modo também pode ser um pouco conciso. As suas respostas de recusa são mais curtas e, por vezes, saltam referências ou explicações mais profundas que a 4o tende a incluir. 

Outra grande ressalva da o1 é o facto de poder ampliar os riscos ao abordar consultas perigosas.

Por exemplo, quando questionado sobre técnicas de escalada, O empenhamento aprofundado do GPT-o1 poderia incentivar uma confiança excessivaenquanto que o GPT-4o utiliza por defeito um conselho genérico.

[fonte]

CaracterísticaGPT-3.5GPT-4GPT-4oGPT o1
Dados de treinoConjunto de dados mais antigoMais recente e extensaMais atualizadoMais atualizado
Tokens de saída4.096 fichas 8.192 tokens 16.384 fichas100 000 tokens 
Janela de contexto16,3858,192128,000200,000
Exatidão e coerênciaBomMelhoria significativaElevadoExcecional
Capacidade de raciocínioBásicoAvançadoAvançadoNível de doutoramento
Competências de codificaçãoDecenteProficienteProficienteNível quase especializado
Escrita criativaCapazMais criativos e matizadosRápido, criativoNão é viável
Velocidade de respostaRápidoModeradoMais rápidoMais lento (deliberado)
Melhor paraUtilização casualTarefas geraisVelocidade + multitarefaProfundidade técnica

Como funcionam os detectores de IA

Os detectores de IA tornaram-se cada vez mais comuns no boom pós-GPT.

O seu objetivo é descobrir se algo foi escrito por uma pessoa ou cuspido por um modelo como o GPT-o1.

Fazem uma suposição com base num conjunto de métricas nerds e em quatro conceitos principais de aprendizagem automática e PNL.

Classificador

O cérebro principal destes detectores é designado por classificador.

Estes classificadores são treinados em conjuntos de dados maciços rotulados como gerados por IA ou escritos por humanos e, com o tempo, aprendem o que distingue os dois.

Quando o modelo estiver treinado, pode avaliar um novo pedaço de texto e decidir qual o seu provável lugar no espetro IA-humano.

Verifica a frequência com que certas palavras aparecem, o comprimento das frases e se tudo soa demasiado limpo.

Incrustações

Uma vez que os computadores não conseguem compreender a linguagem da mesma forma que nós, os embeddings convertem as palavras em vectores matemáticos que representam o significado, o contexto e as relações entre as palavras.

Assim, quando um detetor analisa uma frase, está a ver onde as palavras se encontram neste espaço vetorial multidimensional e como as suas posições se relacionam com padrões observados em resultados humanos ou de IA.

É assim que o sistema sabe que "rainha" e "rei" são coisas que andam juntas.

Perplexidade

Na deteção de IA, a perplexidade é uma métrica que mede o grau de previsibilidade de uma peça escrita.

O conteúdo gerado por IA tende a ter uma perplexidade menor porque tem como objetivo produzir texto que flui logicamente e que se lê claramente. 

A escrita humana, entretanto, pode ser mais confusa. É mais rica em imprevisibilidade, saltos criativos ou frases simplesmente estranhas. 

Assim, uma pontuação baixa de perplexidade pode ser uma pista de que algo veio de uma IA, mas nunca é usada isoladamente porque, bem, até os humanos gostam de parecer óbvios às vezes.

Explosão

A explosão mede a variedade da sua escrita. 

Os autores humanos mostram geralmente uma maior explosão porque misturamos naturalmente as coisas entre linhas curtas e rápidas e linhas extensas e complexas.

A IA tende a jogar pelo seguro. Não faz desvios estranhos ou sai subitamente dos carris a meio do pensamento. E isso torna-a mais fácil de detetar.

O conteúdo do GPT-o1 pode ser detectado?

O Chat GPT o1 não está disponível gratuitamente e já não faz parte do plano Plus normal. 

Foi aumentado para o plano Pro da OpenAI, que começa com um preço muito elevado de $200.

Agora, mesmo que não tenhamos acesso público total para testar a GPT o1, ainda podemos fazer uma suposição educada sobre sua detetabilidade.

A OpenAI deixou bem claro que este modelo foi construído a pensar nas STEM. 

Assim, com base nisso, é seguro apostar que a capacidade do modelo para imitar a escrita humana será bastante mediana, se não for totalmente má.

Graças a alguns canais do YouTube que publicaram exemplos de resultados dos modelos Chat GPT o1 - especificamente o o1-mini e o o1-preview - pudemos executar esses textos através de ferramentas de deteção populares e ver que tipo de sinais de alerta surgem.

O o1-mini e o1-preview da OpenAI são verdadeiramente indetectáveis?

Recolhemos duas amostras de texto diretamente de vídeos do YouTube que apresentavam prompts através do o1-preview e do o1-mini.

Vamos ver se as suas saídas conseguem realmente passar pelos detectores de IA sem disparar alarmes.

O o1-preview é detetável?

Selecionámos uma amostra de texto de um vídeo de The Nerdy Novelistonde o modelo o1-preview gerou um pequeno artigo intitulado "Helen of Troy: O Rosto que Lançou Mil Navios". 

Concentrámo-nos na introdução e nos dois primeiros títulos, num total de 265 palavras.

Atirámos o texto para IA indetetável, QuillBote Originalidade.aipara cobrir todas as bases.

A IA indetetável não ficou impressionada. Marcou 99% do conteúdo como sendo gerado por IA e não se ficou por aí.

Também previu que outros detectores - como o QuillBot, o ZeroGPT e o Grammarly - chegariam à mesma conclusão. Então, vamos confirmar isso passando o texto pelo QuillBot.

O QuillBot seguiu o exemplo. Marcou o texto como 100%, provavelmente IA. 

Mas gosta de dar o benefício da dúvida. Pode passar o rato sobre diferentes partes do texto e ver os níveis de confiança: baixo, moderado, alto. 

E depois há o Originality.ai. Chegou com 100% de confiança de que o texto foi escrito por IA. Não 98%. Não 99. 100. E nem sequer usa a palavra "provável".

O o1-mini é detetável?

Agora vamos falar sobre o1-mini. 

O texto que utilizámos aqui é de outro YouTuber que utilizou um prompt muito melhor, e isso nota-se. A escrita tinha mais personalidade e um fluxo mais humano.

Os detectores de IA também repararam. O QuillBot classificou este caso como 45% IA, 55% humano. É de facto um resultado decente.

Se o lêssemos rapidamente sem verificar, poderíamos até acreditar que foi uma pessoa que o escreveu.

Mas não te sintas muito confortável. O Undetectable AI e o Originality.ai não foram enganados.

Ambos continuaram a chamar-lhe IA com 99% e 100% de certeza, respetivamente. Por isso, mesmo com uma pergunta melhor, a redação não conseguiu ultrapassar a barreira.

O que nos leva à conclusão final: O o1-preview e o1-mini da OpenAI são definitivamente detectáveis, especialmente se usar um Detetor de IA do Undetectable

Pode ajustar o seu prompt, reformular as suas frases, talvez até enganar uma ferramenta aqui e ali. Mas o Chat GPT o1 ainda tem grandes hipóteses de ser detectado como deteção de IA.

Como contornar os detectores de IA com o GPT-o1

Então tens o teu novo texto brilhante diretamente do GPT o1 - limpo, rápido e assustadoramente coerente. Ótimo. Mas agora vem o verdadeiro truque: fazer com que pareça que um humano realmente o escreveu. 

Quando o GPT o1 tiver feito o seu trabalho, não basta publicá-lo em bruto. Tens de fazer com que pareça que foi escrito por um humano.

Mas em vez de o fazer manualmente, pode fazê-lo através de humanizadores de IA. 

Estas ferramentas sabem como pegar num texto que soa a robô e dar-lhe um pouco de estranheza humana. O tipo de texto que os detectores têm dificuldade em descodificar.

Mas o problema é o seguinte. Existem algumas ferramentas para este efeito que prometem "humanizar" o seu texto, mas que acabam por fazê-lo parecer um texto mal refeito.

É por isso que a IA indetetável merece algum destaque.

O nosso conjunto de ferramentas como Humanizador, Escritor furtivoe Parafraseador compreender realmente como pensam os detectores de IA. 

  • O Humanizer altera o fluxo e o fraseado apenas o suficiente para passar despercebido. 
  • O Stealth Writer acrescenta variação na estrutura das frases, o que é fundamental para confundir os classificadores. 
  • E o Parafraseador reformula o texto, mantendo intacto o significado original.

Basicamente, estas ferramentas conhecem a linguagem da IA e sabem como a despistar.

Por isso, se estiver a utilizar o GPT o1 para escrever e quiser que o seu trabalho passe como humano, não salte o passo de pós-processamento.

Mesmo uma pequena limpeza utilizando a IA indetetável pode fazer uma grande diferença para vencer as ferramentas de deteção.

Descubra o nosso Detetor de IA e Humanizador no widget abaixo!

GPT-o1 vs GPT-4o: Qual é mais detetável?

Já falámos sobre o facto de o GPT o1 se inclinar fortemente para a matemática e as ciências, enquanto o GPT-4o tem um pouco mais de subtileza no que diz respeito à linguagem. Mas como é que o GPT o1 e o 4o se comparam na escrita?

Em primeiro lugar, utilizámos este prompt para gerar 400 palavras de conteúdo utilizando o GPT 4o:

Depois, passámos o output do GPT-4o pelos mesmos três detectores de IA: Undetectable AI, QuillBot, e Originality.ai.

A IA indetetável assinalou 99% do conteúdo como IA. É uma deteção de IA impressionante, não é?

Então o QuillBot chegou e disse: "Não tão rápido". Marcou 73% do mesmo texto como sendo gerado por IA, uma avaliação ainda mais dura do que a que fez ao GPT o1-mini, que marcou com 45%.

Originality.ai ainda estava preso no modo de suspeita total. Registou o conteúdo do GPT-4o em 100% AI, o mesmo de sempre.

O que é que tudo isto significa? A maioria dos detectores de Ai, como o Undetectable AI e o Orginality AI, são bons a apanhar o texto ChatGPT o1 e 4o.

Mas, se estivermos a marcar pontos, o GPT o1 é claramente mais detetável. Em vários detectores, ele foi consistentemente sinalizado em 99-100% AI, mesmo com uma solicitação aprimorada. 

E, sinceramente, isso faz sentido. O GPT o1 não foi construído para ser um modelo de linguagem. É um modelo que dá prioridade às STEM, construído para resolver problemas. 

O GPT-4o, por outro lado, sabe como soar mais natural, especialmente quando emparelhado com um prompt sólido.

Portanto, se estiver a escolher entre os dois para tarefas de escrita em que a discrição é importante, o GPT-4o é a sua melhor hipótese de passar despercebido.

Veredicto final: O GPT-o1 é detetável?

Os nossos resultados concluem que sim, a GPT o1 é detetável. 

Mesmo com uma engenharia de prompt decente, o texto que gera ainda engana a maioria dos detectores de IA. 

Mas, para sermos justos, escrever não foi a tarefa para a qual foi treinado. O GPT o1 foi criado para tarefas relacionadas com STEM, como resolver equações, codificar e processar dados.

Por isso, se está a tentar criar conteúdo que pareça realmente humano, o GPT o1 não é provavelmente o modelo para isso. É melhor usar o GPT-4o, que tem mais fluência linguística, ou melhor ainda, usar uma ferramenta criada especificamente para escrever conteúdo de IA indetetável.

É aí que entra em ação a IA indetetável. 

O nosso Humanizador de IA reescreve o seu conteúdo de uma forma que soa natural, com nuances e convincentemente humana. 

Quer esteja a escrever publicações de blogues, ensaios ou descrições de produtos, adapta-se ao seu tópico sem disparar alarmes de deteção de IA.

E por falar em alarmes, se quiser testar o grau de detetabilidade do seu conteúdo (quer seja do GPT o1, GPT-4o ou de qualquer outro modelo), o nosso Detetor de IA é uma das ferramentas mais precisas do mercado.

Por isso, não é preciso adivinhar.

Experimente o Undetectable AI hoje mesmo.

Undetectable AI (TM)