携帯電話 あなたが入力しようとしていることを、あなたが入力する前に知っている。 ネットフリックス 次に何に手を出すかわからない。 銀行 ローンを返済するかどうか。 スポティファイ はリピートする曲を知っている。
しかし、どうやって?誰が密かに我々全員を監視しているのか?
霊感ハト?読心術の秘密結社?それともあなたのお母さん?
違う。AIのアルゴリズムだ。
これらのシステムによって 不気味なほど正確な予測 大量のデータを読み、パターンを分析することによって。
しかし、AIアルゴリズムとは一体何なのか?どのように機能するのか?
どのような種類があり、実際の用途でどのように使われているのか?本日のブログでは、そのすべてをご紹介する。
最初から始めよう。
AIアルゴリズムとは何か?
AIアルゴリズムは日常的に使われている テクノロジー - グーグル検索、Siri、ネットフリックスのレコメンデーション - だけでなく、詐欺検知、自動運転車、医療診断にも使われている。
AIのルーツは、アラン・チューリングがある質問をした1940年代にさかのぼる、 「機械は考えることができるのか?
彼は1950年代にチューリング・マシンを開発し、後にこのマシンでテストされた。 チューリングテスト。 機械がいかに論理的なステップを踏んで問題を解決するかを示したのだ。
もうAIがあなたのテキストを検出する心配はありません。 Undetectable AI あなたを助けることができる:
- AIがアシストする文章を出現させる 人間らしい。
- バイパス ワンクリックですべての主要なAI検出ツール。
- 用途 AI 無事に そして 堂々 学校でも仕事でも。
1950年代から60年代にかけて、数学の定理を証明するプログラム(Logic Theorist)があった。
しかし、ひとつ問題があった。すべてのルールを手動でプログラムしなければならなかった。
その核心は、AIである。 ただの指示書-機械が決断を下すのを助けるアルゴリズムだ。
スパムメールのフィルタリングのような単純なものもある。また、医療記録に基づいて病気のリスクを予測するなど、より複雑なものもある。
しかし、はっきりさせておこう-AIは自分で考えるわけではない。それは 人間のプログラミング、一貫した学習 より良い仕事をするためにね
このことを理解するために の例だ、
AIはより大きな決断に役立つ。銀行が融資を承認する場合を考えてみよう。その際 デシジョンツリー (フローチャートのように機能するシンプルなAIモデル):
- 申込者に安定した収入はありますか?いいえ → ご融資をお断りします。はい → クレジットスコアを確認する。
- 信用度が高いか?いいえ → 考え直すはい → 既存のローンをチェック
- ローンが多すぎる?リスクが高い。ローンが少ない?リスクが低い。
プロセスの最後に、AIは構造化されたロジックに基づいて融資を承認するか否かを決定する。
さて、次のパートだ。
機械学習と自動化を可能にするAIアルゴリズムの仕組み
こう考えてほしい。
子供に犬の見分け方を教えることを想像してみてほしい。
教師は彼らに写真を見せ、主な特徴を指摘し、時間をかけて実際の生活の中で見分けられるようにする。
AIアルゴリズムも同じように学習する 大量のデータから学習し、予測を立て、タスクを自動化する。
1 - 予測
回帰アルゴリズムが過去の情報を調査し、リアルタイムの自動予測を行う。
例えば、こうだ、 Netflixが予測に基づいて番組を推薦。もしあなたが ストレンジャー・シングス ということだろう。 ダーク』または『アンブレラ・アカデミー というのも ストレンジャー・シングス も見ていた。
2 - 機械学習
しかし、AIは予測だけでなく、適応もする。
機械学習は、明示的にプログラムされることなく、コンピューターが経験から学び、改善することを可能にする。
例えば、こうだ、 もしあなたが「ストレンジャー・シングス」のSF要素だけが好きで、ホラーは嫌いだったら?スローなドラマより、短くてテンポの良い番組が好きだったら?Netflixのアルゴリズムは、あなたのディープレベルの行動を分析し、おすすめ番組を調整する。
3 - オートメーション
それから自動化だ。
自動化とは、人間の介入を最小限に抑えてタスクを実行するためにテクノロジーを利用するプロセスである。
例えば、こうだ、 自動運転車も似たようなもので、コンピューター・ビジョンを使って道路を "見る "ことで、一時停止標識を認識し、1マイル走るごとに学習していく。
データを処理すればするほど、彼らは賢くなる。
AIアルゴリズムの仕組み(ステップ・バイ・ステップ)
人が新しい技術を習得するように、AIもまた段階的に物事を習得していく。
グーグル検索エンジンの画像認識機能を使って分解してみよう。
ステップ# 1 - データ収集
すべてはデータから始まる。AIは学習するために何十万もの例を必要とする。画像認識では、それが含まれる:
- 何百万ものラベル付き画像(例えば、「cat」とラベル付けされた猫の写真、「dog」とラベル付けされた犬の写真)。
- 照明、アングル、クオリティのばらつき。
- 同じものでも大きさ、色、形が違う。
- エッジケース(ぼやけた画像、対象物が部分的に隠れている、コントラストが低い)。
ステップ# 2 - 前処理
生画像には、不鮮明な画像や低画質な画像、無関係なオブジェクト、乱雑な画像など、多くの不要な情報が含まれています。
AIをトレーニングする前に、データをクリーニングし、標準化する必要がある。これには以下が含まれる:
- 画像を一定のサイズにリサイズし、一貫した処理ができるようにする。
- 明るさとコントラストがAIに誤解を与えないように、グレースケールまたは色の正規化を行う。
- 物体識別に寄与しない不要な背景要素などのノイズを除去する。
ステップ# 3 - トレーニング
AIは違う "参照" 画像を人間と同じように見ることができる。 つまり、数千のピクセルを数字としてとらえ、それぞれが明るさと色を表す値を持つのだ。
これを理解するために、AIは画像認識のために構築された特殊なディープラーニングモデルであるCNN(畳み込みニューラルネットワーク)を使用する。
CNNが画像をどのように分解するかは以下の通りだ:
- 畳み込みレイヤー: AIは画像を部分的にスキャンし、最初に単純な形状(線、曲線)を検出し、後に複雑な特徴(目、耳、ひげ)を認識する。
- プーリング・レイヤー: これらは画像を縮小し、不要なピクセルを捨てて必要なディテールを維持する。
- 完全につながったレイヤー: AIは検出された特徴を結びつけて最終的な予測を行う。つまり、尖った耳とひげが見えたら猫だと判断する。
このプロセスには以下が含まれる。 時代.
鳥の種類を見分ける方法を学んでいるとしよう。初めてスズメとハトを見たとき、あなたはそれらを混同するかもしれない。
しかし、写真を見て、特徴を研究し、フィードバックを得ることで、上達する。
AIも同じように学習する。
エポックとは、AIがすべての学習データを見て、予測を行い、間違いがないかチェックし、調整する完全な1サイクルのことである。
何度も何度も繰り返し練習するのである。
ステップ# 4 - テスト
AIが実世界で使えるようになるには、テストが必要だ。これには以下が含まれる:
- 見たことのないイメージを与える。
- その正確さを測る-猫を猫として正しく表示しているか?
- AIが学習データを記憶しているにもかかわらず、新しい画像で苦労するようなオーバーフィッティングをチェックする。
もしAIがあまりに頻繁に失敗するようであれば、一度も遭遇したことのない画像を確実に識別できるようになるまで、さらにトレーニングを重ねる。
ステップ # 5 - 展開
学習とテストが終わると、AIモデルが配備される。AIに画像を与えるとそれは
- ピクセル値に分解する
- 学習したすべてのレイヤーを通す
- 可能性のあるラベルごとに確率スコアを生成する
- 最も可能性の高い分類を選ぶ
典型的な結果は次のようなものだ:
- Cat: 99.7%プロビリティー
- 犬:0.2%の確率
- その他0.1%の確率
AIアルゴリズムの種類と使われ方
人がさまざまな方法で学習するように(ある人は読むことによって、ある人は実行することによって)、AIにもさまざまなタイプのアルゴリズムがあり、それぞれが特定のタスクに適している。
1 - 教師あり学習
リンゴとオレンジの見分け方を学ぶ子供を想像してほしい。先生は絵にこうラベルを貼る:
"これはリンゴです"
「これはオレンジだ
時間をかけて、違いを見分けることを学習する。これは教師あり学習であり、AIはラベル付けされたデータで訓練され、予測を行うことを学習する。
例えば、こうだ、
のAIアルゴリズム スパムフィルター スパム "または "スパムではない "とラベル付けされた何千ものメールをスキャンし、パターンを学習する。
- メールに特定のキーワードが含まれているか?
- 不審な送り主からですか?
時間の経過とともに、受信トレイに届く前にスパムをキャッチする能力が向上する。
教師あり学習は、住宅価格のようなものを予測する回帰モデルや、メールがスパムかメインの受信箱のどちらに属するかを判断する分類モデルに力を与える。
2 - 教師なし学習
今度は、同じ子供にバスケットに入った果物を与えるが、どれがリンゴかオレンジかは教えないとしよう。
その代わりに、色や形、質感などの類似性に基づいてグループ分けをする。
教師なし学習とは、ラベルのないデータからパターンを見つけ出すことだ。
例えば、こうだ、
銀行は、取引が詐欺かどうかを即座に知ることはできない。 AIは不正行為の防止に役立つ。
何百万もの購買をスキャンし、それぞれの顧客にとって何が "普通 "で何が "普通でない "のかを学習する。
毎週食料品とガソリンを買うとしよう。そして突然、他国で$5,000の高級車を買いたくなったとする。
AIはそれを疑わしいと判断し、あなたのカードを凍結したり、あなたに簡単なメールを送るかもしれません。 「これはあなたですか? というメッセージを送った。
3 - 強化学習
リンゴを正しく選ぶたびにキャンディーをもらえる。間違った果物を選んだら、1個失う。
時間が経つにつれて、彼らは最も多くのキャンディーを手に入れる最良の方法を学んでいく。 それは 強化学習。
AIは同じことをする。さまざまな行動をテストし、失敗から学び、報酬と罰則に基づいて調整する。
例えば、こうだ、
自動運転車 最初から運転の仕方を知っているわけではない。
しかし、何百万マイルもの道路データを分析した結果、ブレーキング、渋滞への合流、障害物の回避がうまくなった。
すべての過ちは教訓である。すべての成功が彼らをより賢くする。
4 - ニューラルネットワークとディープラーニング
単純なルールでは複雑すぎる問題もある。そこでニューラルネットワークの出番となる。
人間の脳と同じように働くように設計されており、パターンを認識し、逐一指示を出さなくても意思決定ができる。
例えば、こうだ、
A トラディショナルコンピュータ アングルや照明、表情の違いで苦労するかもしれない。
しかし、ディープラーニングモデル(複数のレイヤーを持つニューラルネットワーク)なら、どんな条件下でも顔を認識することを学習できる。
人がさまざまな方法で学習するように(ある人は読むことによって、ある人は実行することによって)、AIにもさまざまなタイプのアルゴリズムがあり、それぞれが特定のタスクに適している。
実世界での応用におけるAIアルゴリズム
AI画像検出器はどのようにAIが作成した画像を見分けるためにアルゴリズムを使用するか
AIが生成した画像は、今や本物の写真と見分けがつかないほどリアルだ。
しかし、AIの画像検出器は表面以外を見るように訓練されている。
テクニック# 1 - 異常検知
このプロセスは異常検知から始まる。
画像に不自然なテクスチャ、一貫性のない照明、ぼやけたエッジがある場合。 AI画像検出器 は赤旗を掲げる。
手技 # 2 - 生成的逆数ネットワーク
AIが生成した画像を検出する方法のひとつは、画像を生成する技術が残した隠れたパターンを見ることだ。
これらのパターンはGenerative Adversarial Networks(GAN)に由来する。
すべてのアーティストが独自のスタイルを持っているように、GANは現実の写真にはないパターンを作り出す。
AI画像検出器 はこれらのパターンを認識するように訓練されており、画像が人工知能によって生成されたかどうかを判断するのに役立つ。
テクニック # 3 - メタデータ
ピクセルを見るだけでなく AI画像検出器 また、画像のデジタル指紋のような役割を果たすメタデータも調べます。
このデータには、写真がいつ、どこで撮影されたのか、どのデバイスが撮影したのかといった詳細が含まれる。
ある画像が2010年のものだと主張するが、実際には先週AIツールによって作成されたものである場合、 AI画像検出器 は疑わしいものとしてフラグを立てる。
AIアルゴリズムのバイアスとそれを減らす方法
AIは公平であるべきだが、そうでない場合もある。AIの偏りは2つの方法で起こりうる:
- データの偏り - これは、トレーニングデータにおいて特定のグループの割合が低い場合に起こります。
- モデル・バイアス - これは、AIがあるグループに対して他のグループよりも多くのミスを犯し、不公平な結果を助長する場合に発生する。
アマゾンの偏った採用ツール
2014年のことだ、 アマゾンはAI採用ツールを廃止せざるを得なかった 女性に偏っていたからだ。
このシステムは、過去の採用データから、技術職には男性の方が多く採用されていることを学習し、男性候補者を優遇し、「Women's」(「女性チェスクラブ」のような)のような単語を含む履歴書にはペナルティを課すようになった。
AIは不公平になろうとしていたわけではなく、偏ったデータから学習し、その偏りを前方に持ち出したのだ。
AIデータ収集におけるプライバシーの問題
アプリを使ったり、ウェブを閲覧したり、買い物をしたりするたびに、データは収集されている。
名前、Eメール、支払い情報など、明らかなものもある。
しかし、GPS位置情報、購入履歴、タイピング行動、閲覧習慣などのデータが隠されている。
企業はこの情報を、体験のパーソナライズ、商品の推奨、サービスの改善に利用します。
これだけ多くのデータが飛び交っていれば、リスクは避けられない:
- データ侵害 - ハッカーはユーザー情報を盗むことができる。
- 再同定 - 匿名化されたデータであっても、個人を特定することができる。
- 不正使用 - 企業は利益や影響力のためにデータを悪用するかもしれない。
企業がデータの匿名化を謳っていても、十分な情報があればパターンによってユーザーの身元が明らかになることが研究で示されている。
ユーザーのプライバシーを保護するために、各企業は
- 匿名化 - データセットから個人情報を削除します。
- フェデレーテッド・ラーニング - AIモデルは、生のデータを中央サーバーに送信することなく、あなたのデバイス上で学習します。(例:GoogleのGboard)。
- 差別化されたプライバシー - 追跡を防ぐため、収集前のデータにランダムなノイズを加える(アップルのiOSシステムなど)。
AIアルゴリズムは完全に中立になれるか?
AIは真空中で作られるものではない。
人間によって作られ、人間のデータに基づいて訓練され、人間社会で使われている。では、真に中立であることは可能なのだろうか?
短い答えだ:いいえ。 少なくとも、まだだ。
AIは実世界のデータから学習するが、そのデータには、それを作成した人間の偏見や思い込み、不完全さがすべて含まれている。
COMPASという再犯防止ツールを使う、 例えばこうだ。
どの犯罪者が再犯する可能性が高いかを予測するために作られたものだ。
簡単そうだろう?
しかし研究によると、このアルゴリズムでは、白人の被告に比べて黒人の被告に不釣り合いに高リスクのフラグが立てられていた。
偏っているのは、誰かがプログラムしたからではなく、欠陥だらけの刑事司法制度からパターンを受け継いだからだ。
では、AIを公正なものにすることはできるのだろうか?
そう考える専門家もいる。
研究者たちは、AIモデルに異なるグループをより平等に扱うよう強制する数学的手法である公平性制約を開発した。
バイアス監査と多様なトレーニングデータセットも、偏った結果を減らすのに役立つ。
しかし、これだけの安全策を講じても、真の中立性は難しい。
仮にAIを完全に作り上げることができたとしても "中立" そうだろうか?
AIはバブルの中で決断を下すわけではない。現実の人間に現実の方法で影響を与えるのだ。
現実には、AIは私たちが送り込んだ世界を反映する。
偏りのないAIを求めるなら、まずシステム内のバイアスに取り組まなければならない。
そうでなければ、私たちの欠点だけをより速く、より大規模に反映させることを機械に教えるだけになってしまう。
AIアルゴリズムに関するFAQ
最も一般的なAIアルゴリズムとは?
ニューラルネットワーク、特にディープラーニングは、今日のほとんどのAIアプリケーションの中核をなしている。
ChatGPTのようなツール、顔認識ソフトウェア、次に何を見るべきか、何を買うべきかを提案するレコメンデーション・システムを支えているのだ。
AIアルゴリズムは機械学習と同じか?
正確には違う。AIは多くの異なる技術をカバーする大きな傘であり、機械学習はその一部に過ぎない。
機械学習とは、厳密にプログラムされたルールに従うのではなく、データからパターンを学習するAIシステムを指す。
しかし、すべてのAIが機械学習に依存しているわけではない。
AIアルゴリズムは時間とともにどのように改善されるのか?
AIは経験を通じて向上する。
アルゴリズムがより多くのデータを処理すればするほど、パターンを発見し、正確な予測をすることができるようになる。
パラメーターを微調整し、強化学習のようなテクニックを使い、トレーニングデータを継続的に更新することはすべて、そのパフォーマンスを向上させるのに役立つ。
下のウィジェットでAIディテクターとヒューマナイザーをお試しください!
最後に思うこと:AIアルゴリズムの未来
では、このことは我々にとって何を意味するのだろうか?
AIは日常的に私たちの意思決定に影響を与えている。何を見るか、何を買うか、銀行口座の安全性さえもAIが決めるのだ。
しかし、ここで疑問が...。
AIが私たちから学んでいるとしたら、私たちはAIに何を教えているのだろうか?
私たちは、それが公正で偏りがなく、役に立つものであることを確認しているだろうか?それとも、人間が犯すのと同じ過ちを犯させているのだろうか?
AIがより賢くなり続けるとしたら、次はどうなるのだろうか?AIは常に私たちがコントロールする道具なのか、それともいつか私たちが理解しきれない選択をするようになるのだろうか?
最大の問題は、AIに何ができるかではなく、AIに何をさせるかということなのかもしれない。
どう思う?