AI探知機は間違うことがあるのか?(AI検知を回避する方法を学ぼう)

2022年11月にChatGPTがスタートして以来、世界は変わったと言っていい。

AIはほぼすべての業界に浸透しており、既存技術の急速な進化に貢献している。

ChatGPTのようなAI生成ツールを使ってテキストを作成するのは、その力を活用するための一般的な方法だ。

フリーライターであれ、コンテンツ制作者であれ、あるいはアカデミックな学生であれ、AIはあなたの武器になる強力なツールだ。

パーティーを台無しにするAI探知機の登場だ。もちろん冗談だが、AIが責任を持って善意で使用されるようにチェックする必要がある。

サイト所有者、学校、そしてグーグル自身も、AI検出器を利用して、私たちが自分の仕事であるかのように装っていないことを確認している。

しかし、AI探知機は間違うことがあるのだろうか?両陣営のAI技術がまだ不完全であることは驚くことではない。

これらの検知ツールは、日常的に誤検知に悩まされている。ここでは、AI検出器を回避し、偽陽性の手間を省く方法をご紹介します。

AI探知機の仕組み

AIディテクターは、自然言語モデルと、AIと人間が作成したテキストの両方の何百万ものデータ・ポイントを使用して構築されます。コンテンツがAI検出ツールによってスクリーニングされるたびに、これらのデータセットと比較し、構文、単語の選択、およびテキストの全体的な構造における予測可能なパターンを探します。

これらの検出器は、パターンを認識し、AIと人間が生成した例の両方と比較するように訓練されている。

AI検出器の結果は、スキャンされたコンテンツがAIによって生成された可能性であり、保証するものではない。AIディテクターは、決定的な証拠なしに、確率に基づいて動作します。

AIディテクターが探しているパターンとはいったい何だろうか?AI検出器の原動力となっている2つの概念は、バースト性(burstiness)と当惑性(perplexity)と呼ばれるものだ。

バースト性とは、文章の長さと複雑さを指す。AIが作成した文章を読んだことがあれば、機械的に聞こえるだろう。多くの文章が同じような長さ、構造、句読点で構成されているからだ。

当惑度とは、その名の通り、言語がどれだけ複雑で、人間の読者がどれだけ当惑しやすいかを指す。比較のため、AIが生成するテキストは、読者が理解しやすいように、あらかじめperplexityが低くなるようにプログラムされている。

あなたのテキストが検出器を通過するかどうか、AI検出器をお試しください!

#1AIディテクターをForbesが評価

AIの検出スコアは何を意味するのか?

コンテンツをAI検出器でスキャンすると、AI検出スコアが表示されます。

ほとんどのAIディテクターは、このスコアを100点満点でパーセント表示する。1つはAIのスコア、もう1つは人間のスコアです。

AI検知スコアは何を意味するのか?ツールによって異なります。

ほとんどの場合、85%というスコアが表示されます。これは、そのテキストがAIによって生成された可能性が85%あるという意味です。85%のテキストがAIによって作成されたという意味ではありません。

同様に、デュアルAI検出スコアについては、AIによって作成された可能性と人間によって作成された可能性を比較する。その結果、AIが85%、人間が15%というスコアになる。

AI探知機は間違っているのか?

そう、そしてあなたが思っている以上に頻繁に。AIディテクターを使ったことのある人、AIディテクターにコンテンツをスキャンされたことのある人は、これらのツールが完璧にはほど遠いことを知っている。

わずかな割合の誤ったスキャンでも、学生や作家に対する冤罪につながる可能性がある。

AIディテクターがスキャンできるのは、テキスト中の認識可能なパターンだけであることを覚えておいてほしい。

人間のライターが不幸にもロボットのような文章を書いてしまった場合、フラグが立つ可能性が高い。これが偽陽性と呼ばれるものだ。

AI検知の誤検知とは?

偽陽性とは、真の結果でないにもかかわらず記録された陽性の結果と定義される。

これは科学実験や病気の医学的検査にさえ適用できる。AI検知の誤検知は、AI検知器がコンテンツをスキャンし、それが人間によって書かれたものであるにもかかわらず、AIによって書かれたと主張する場合に起こる。

このことが、フリーライターの学問的誠実さや雇用といったことになると、どれほど問題になるか想像がつくだろう。

Turnitinは、世界中の多くの大学が利用しているオンラインプログラムで、学生がデジタルでコースワークを提出することができます。

このサイトでは現在、教師が利用できるAI検出器を用意している。 98%以上の精度 で、偽陽性の割合は1%より低い。一部のユーザーは、98%の誤検出率は現実よりはるかに低いと考えている。

AIによる誤検知は、学校、雇用主、そしてSEOランキングに関してはGoogle自身からの懲罰につながる可能性がある。

このような現実が定着しつつあり、ヴァンダービルト大学のような企業や学校もある。 TurnitinのAI検出器を無効にする.

AI検知における誤検知の主な理由

では、このようなAIディテクターが誤検知をする原因は何でしょうか?コンテンツがフラグを立てられる理由はいくつかあります。

AI検知器自身は、誤検知のレポートを提供していることに気づいていません。検出器自体のトレーニングに問題があるか、コンテンツに問題があるかのどちらかです。AI検出で誤検出が頻繁に起こる理由をいくつか挙げてみましょう。

AIモデルとアルゴリズムの変化

AIディテクターやほとんどのAIソフトウェアの核心は、いかにうまくトレーニングされているかということだ。日進月歩のモデルと複雑化するアルゴリズムによって、AI検知器は古いテクノロジーと古いデータセットに捕らわれる可能性がある。

より複雑なデータセットとロバストなトレーニングによって、AI検知器は誤検知を排除できるようになるかもしれない。しかし、これはプログラムのコストと計算能力を引き上げることになる。

英語を母国語としない人への偏見

AIディテクターはフラグを立てる傾向が強い AIが生成した非ネイティブの英作文.スタンフォード大学の調査研究によると、ほとんどのAI検出器は英語を母国語としない人に対してバイアスがかかっている。

なぜか?それは人種差別ではなく、英語を母国語としない人のほとんどが、当惑の点数が低いからだ。つまり、彼らの文章や散文は一般的にとてもシンプルで理解しやすいのだ。

限られた理解

AIディテクターもまた、非常に明確に定義されたルールやパターンに従う。コンテンツをスキャンするために使用される機械学習アルゴリズムは、AIディテクターがコンテンツ自体を理解することを許さない。

AIディテクターは、事実の正確さや読みやすさを追求する代わりに、構文や構造をスキャンする。AIディテクターは、言語的なニュアンスや口調の変化、あるいは口語的で皮肉めいた文章を理解することができないため、AIが作成したものであると判断することが多い。

AIが書いたと認識されたときの対処法

AIが書いたコンテンツを自分のものとして使っていると濡れ衣を着せられるのは冗談ではない。学生にとっては懲戒処分、ライターにとっては失職につながる可能性が高い。

さらに悪いのは、スキャンされるコンテンツをコントロールできないことだ。AI検出器に対するあなたの言葉であり、残念なことに、人間よりもAI検出器を信用する人があまりにも多い。あなたのテキストがAIによって書かれたものだと認識された場合に、あなたができることをいくつか挙げてみよう。

AI検出器のエラーに関するデータを表示する

最初にできることのひとつは、AI検知器の不正確さを明るみに出すことだ。誤検知はAI検知器にとって十分に文書化された問題なので、見つけるのは難しくないはずだ。

手始めには?ChatGPTの生みの親であるOpenAIは、自社のAI検出プラットフォームを閉鎖した。

作品のオリジナリティを証明する

また、グーグル・ドックスやマイクロソフト・ワードなどのワープロで過去のバージョンを表示させれば、作品のオリジナリティを証明することもできる。

コンテンツがAI検出器にスキャンされることがわかっている場合は、コンテンツを書いている自分の姿をスクリーン録画したり、タイムスタンプ付きの写真で記録したりするなど、思い切った対策をとることもできる。

AI検知を回避するトップ3のヒント

自分の作品が自分自身のものであることを証明するのが大変だと思われるのであれば、AIによる検出を完全に回避する手段を講じる方が簡単かもしれません。AIが書いたと判定されるリスクを軽減するために、作品を提出する前にできることがある。

Undetectable.aiを使う

間違いなく、あなたの作品がAIとしてフラグを立てられるのを防ぐ最も手間のかからない方法は、次のようなツールを使うことだ。 検出不可能.ai.Undetectable.aiとは?AIスクランブルツールで、コンテンツをAI検出器を通過しても問題のないテキストに書き換えます。

このツールは、Copyleaks、GPTZero、Saplingのような一般的なAI検出器をバイパスするように設計されている。

テキストをアプリに貼り付け、使用したい音声を選択し、「Humanize」ボタンをクリックするだけです。出力は元のテキストに近くなりますが、どのAI検出器からも人間が書いたスコアを受け取れるように変更されます。

Undetectable.aiは、AIの検出を避けるために手作業で編集する時間と労力を節約します。プランは10,000ワードで月々わずか$9.99円、1年間なら$60.00円から。

独自のトーンと声を加える

Undetectable.aiのようなツールのポイントは?自分の作品やAIが作成した作品を、AIが書いたというフラグが立たないように編集するためです。Undetectable.aiに最低限のコストを払いたくなければ、自分で手作業で編集すればいい。

AI検知器を確実に回避する最も簡単な方法は、あなた独自の口調と声を使うことです。もうひとつの方法は、構文や文の構造を文章全体で変化させることです。各文章がリズミカルに同じように聞こえることほど、AIが書いたコンテンツであることを示す兆候はありません。

AI検出のために最終作品をスキャンする

もちろん、すべての編集を終えたら、AI検出のために最終作品をもう一度スキャンしたいでしょう。フラグを立てられないようにする最善の方法は、作品を提出する前に自分で事前にスキャンすることです。

別のAI検出器が別のスコアを返した場合に備えて、AI検出スコアを記録しておくようにしてください。あなたのテキストがAIであろうと人間が書いたものであろうと、AI検出のためにあなたの最終作品をスキャンするのにかかる時間はほんの数秒であり、多くの悲しみを救う可能性があります。

結論

では、AI探知機は間違っている可能性があるのだろうか?もちろんだ。AI探知機には欠陥があるのか?もちろんだ。 AI探知機は機能するか?たいていの場合はそうだ。二元論でしか考えられない人は珍しくないが、AI探知機は欠陥もあれば目的も果たすことができる。

AI検出器が適切に使用されれば、学術やコンテンツ制作における非倫理的なAIの使用に対する防御を提供することができる。しかし、AIが偽陽性を提供し始め、テキストをAIが書いたと不正確にフラグを立てるようになると、問題が発生する。

ジェネレーティブAIのロードマップの中で、私たちがまだいかに初期段階にいるかを忘れてはならない。私たちが今持っているテクノロジーは、5年後、10年後には古めかしく見えるだろう。AI技術が向上し続けるにつれて、AI検出器の精度も向上するだろう。

それまでは、これらの検出器は完璧には程遠く、その結果やAIの検出スコアを不正行為や学業不正の決定的な証拠として決して用いるべきではないという事実に対処することを学ばなければならないだろう。

検出されないAI (TM)