メインコンテンツまでスキップ

🟢 AI の心を理解する

こんにちは、読者の皆さん。序章を読破したことをお祝いします。この非常にエキサイティングな分野で素晴らしいスタートを切っています。コースの残りの部分を読み始める前に、さまざまな AI とその仕組みについて知っておくべき簡単なことがいくつかあります。

画像から作られた音楽

さまざまな AI

何百万とは言わないまでも、何千もの AI が存在します。いくつかは他のものよりも優れています。さまざまな AI が画像音楽テキスト、さらにはビデオを作り出します。これらはすべて生成型 AI であり、基本的にはものを作る AI であることに注意してください。物事を分類する AI である識別型 AI もあります。たとえば、画像分類器を使用して、画像が猫か犬かを判断できます。このコースでは、識別型の AI は使用しません。

現在、迅速なエンジニアリングに十分に役立つほど高度な生成 AI はごくわずかです。このコースでは主に GPT-3 と ChatGPT を使用します。前のページで述べたように、ChatGPT はチャット ボットですが、GPT-3 はそうではありません。 同じ質問をされても、彼らは通常、異なる反応を示します。あなたが開発者である場合は、GPT-3 を使用することをお勧めします。GPT-3 の方が再現性が高いからです。開発者でない場合は、ChatGPT を使用することをお勧めします。このコースのほとんどのテクニックは、両方の AI に適用できます。ただし、一部は GPT-3 のみであるため、このコースのすべての手法を使用する場合は GPT-3 を使用することをお勧めします。

また、画像生成セクションで Stable DiffusionDALLE を使用します。関連する AI の詳細はこちらを参照してください。

これらの AI の仕組み

このセクションでは、一般的なテキスト生成 AI の側面について説明します。これらの AI には、何十億もの人工ニューロンで構成された脳があります。これらのニューロンが構造化される方法は、トランスフォーマーアーキテクチャと呼ばれます。これはかなり複雑なタイプのニューラル ネットワークです。理解しておくべきことは次のとおりです。

  1. これらの AI は単なる数学関数です。 f(x)=x2f(x) = x^2 のように関数を表現しますが、AI の場合は f(数千の変数) = 数千の可能な出力 と表現できるでしょう。
  2. これらの AI は、文をトークンと呼ばれる単語/サブワードに分割することで文を理解します。たとえば、AI は「I don't like」を「I」「don」「't」「like」と読む場合があります。その後、各トークンは AI が処理可能な数値のリストに変換されます。
  3. これらの AI は、前の単語/トークンに基づいて、文の次の単語/トークンを予測します。たとえば、AI は「I don't like」の後に「apples」を予測する場合があります。彼らが書き込む各トークンは、彼らが見て書き込んだ以前のトークンに基づいています。彼らは新しいトークンを書くたびに、次のトークンがどうあるべきかを考えるために一時停止します。
  4. これらの AI は、すべてのトークンを同時に調べます。人間のように左から右、または右から左に読むことはありません。

「考える」「脳」「ニューロン」という言葉は、ズーモフィズム(動物に例えること)であり、モデルが実際に行っていることを例えているに過ぎません。これらのモデルは実際には考えているわけではなく、単なる数学関数です。実際には脳ではなく、単なる人工ニューラルネットワークです。そして、実際には生物学的ニューロンではなく、単なる数字です。

これは活発な研究と哲学的思考が行われている分野です。この説明は、AI の本質に対してやや皮肉なものであり、大衆向けメディアが AI を人間のように考える/行動する存在として描写することを揶揄しています。とはいえ、AIを擬人化したいのであればどうぞ!多くの人がそうしているようで、学習に役立つかもしれません。

注釈

  • d2l.ai は、AI の仕組みを学習するための優れたリソースです。

  • 実際、著者はリンゴを楽しんでいることに注意してください。おいしいよ。