号数: #1
読了時間: 約8分
レベル: AI の予備知識は不要
AI 貢献: 本文は元々私がアイデアと方向性を提供し、Claude が英語で執筆したものです。本文は Claude が翻訳し、著者が校閲しました。
「モデル」「LLM」「AI」——私はこの三つを日常的に使い分けずにいる。周囲の人たちも同じだ。この分野に真剣に向き合っている人たちも例外ではない。会議中や LINE のやり取りでは、それでもたいてい問題にならない。だが時折、「その AI はそれを知らない」とか「モデルはこういう場合に混乱する」と口にしながら、自分が何か曖昧なものを指し示していることに気づく。言葉は出ているが、概念が着地していない。
本稿はその着地を試みるものだ。術語の正確さ自体が美徳だからではない——そうではない。LLM が実際に何であるかをより明確に把握することで、思い浮かぶ問いが変わるからだ。AI ツールを評価したり、自社のワークフローへの AI 導入を検討したりしている金融の専門家にとって、正しい問いを立てることこそが仕事の核心になる。
では、大規模言語モデルとは何か。今日人々が言う「AI」とは何を指すのか。これらは同じものなのか。短い答えは「否」だ。長い答えが、この号の残りである。
2026年の「AI」はほぼ一つのことを意味する
「人工知能」という言葉は数十年前から存在し、時代によって異なるものを指してきた——1980年代のエキスパートシステム、2000年代の機械学習による分類器、2010年代の画像認識。しかし今日「AI」と言えば、ほぼ例外なく特定のものを指す。生成 AI だ。入力(プロンプト)に応じて出力——テキスト、画像、音声、コード、動画——を生成する AI である。
これを明確にしておくことには意味がある。多くの会話が実際に何を指しているのかがはっきりするからだ。コンプライアンス部門が「AI リスク」を懸念するとき、テクノロジー部門の同僚が「AI ソリューション」を提案するとき、ベンダーが「AI 搭載の分析ツール」を売り込むとき——彼らがほぼ確実に話しているのは生成 AI だ。メモを書き、文書を要約し、質問に答え、初稿の分析を出すことができる技術。
生成 AI が興味深く、また初期の AI システムと本質的に異なるのは、生成するものの性質による。人間の言語による、制約のない出力だ。初期の AI システムは一般に分類器や最適化システムとして説明するのが正確だった——メールがスパムか否か、最速ルートはどれか、融資申請が基準を満たすか否かを判定するものだった。生成 AI は各入力に対して何か新しいものを生み出す。この変化こそが、この技術がこれほど広く公衆の目に触れるようになった理由だ。
モデルはエンジンである
あらゆる生成 AI アプリケーション——ChatGPT、Claude、Copilot、Gemini、あるいは自社で構築した内製ツール——の内部には、モデルがある。モデルが本質的な仕事をしている。
私が繰り返し思い浮かべるのは、自動車のエンジンというアナロジーだ。自動車は複雑なシステムだ。ボディ、トランスミッション、電子系統、燃料供給、ユーザーインターフェース。しかしエンジンはその中核となる部品だ。車のパフォーマンスにとって重要なあらゆる特性——出力、燃費、アクセルへの応答——は根本的にエンジンによって決まる。残りの部分も重要であり、優れたエンジンが設計の悪い車に載っていてもやはり悪い車だ。しかし、エンジンを理解せずに車を正しく評価することはできない。
AI アプリケーションも同じ構造だ。アプリケーションはソフトウェアの集合体だ。チャットインターフェース、ネットワーク接続、文書処理、メモリ管理、安全フィルタリング、その他無数のコンポーネント。これらはすべて本物のエンジニアリングであり、重要だ。しかしモデルがエンジンだ。出力の質、システムができることの範囲、障害モードと制限——これらは主にモデルによって決まる。
この区別には実際的な意味がある。ある企業が「AI をアップグレードした」と発表するとき、改善の多くは基盤となるモデルの変更から来ている——ただし常にそうとは限らない。アプリケーション層の変更が体験を大きく変えることもある。二つの製品が同じモデルを実行していると主張するなら、インターフェースの見た目がどれだけ違っても、出力はおおむね同等になる傾向がある——ただし、モデルを囲むアプリケーションが実際の体験を左右する。いずれにせよ、ツールがどのモデルを実行しているかを問う習慣を持つことは、「AI は良いか?」と問うよりも有用な出発点になりやすい。
ここでこのアナロジーをもう少し延ばしておきたい。フェラーリのハイパーカーと、父親の1996年製カムリは、どちらもエンジンを持つ自動車だ——しかしカムリを運転しても、自動車の基本原理以外に、フェラーリについて多くを知ることはできない。AI モデルも同じ構造を持っている。多くの人が最初に触れるモデルは無料版であることが多い。より軽量で、能力が低く、ピーク性能ではなくアクセシビリティのために設計されている。最前線のモデルは有料で提供されており、複雑な分析や推論タスクにおいて本当に優れた能力を持っている——金融の専門家が実際にテストしたいと思うのはまさにそういった用途だろう。無料版の体験をもとに特定の能力を否定することは、カムリだけを試乗して「車は速くない」と結論づけるようなものだ。
モデルとは実際何なのか
では、技術的にはモデルとは何か。その核心は、非常に大規模な数学的関数だ——入力を受け取り出力を生成する、複雑な方程式の集合体。
量的調査やリスク管理に携わっているなら、この基本的なアイデアはすぐに認識できるだろう。マルチファクターモデルは一組の入力——マクロ経済変数、セクターエクスポージャー、スタイルファクター——を受け取り、期待収益率やリスクの推定値を出力する。モデルは突き詰めれば、係数を持つ方程式の集合だ。各入力が出力にどれほど貢献するかを決める重みである。
大規模言語モデルはこの概念の近縁種だ。入力——プロンプト、質問、文書——を受け取り、出力を生成する。モデルが最も妥当と推定したテキストの続きだ。
核心となる直感は確率論的なものだ。あなたが誰かに何かを言えば、相手が返す可能性のある答えには一定の範囲がある。正確に何を言うかは予測できないが、あなたの発言と全く無関係な返答が来れば驚くだろう。妥当な返答の空間は、入力によって制約される。大規模言語モデルはその関係を学習している——この入力に対して、どの出力が妥当か?——そして、それに従って生成する。
ここで金融モデルとの比較が興味深くなり、言語モデルが予想と異なる方向に分岐する。
従来のマルチファクターモデルでは、ファクターはアナリストが選択する。規模、バリュー、モメンタム、クオリティが重要だと判断し、それらを正確に定義し、過去のデータから係数を推定する。モデル構造は人間が定義し、係数はデータによってフィットされる。
言語は十分に複雑であり、それを明示的なルールとして記述しようとする初期の試み——文法パーサー、手動で定義された意味構造——は大きな限界に直面した。大規模言語モデルはそのようには機能しない。内部表現——「ファクター」に相当するもの——は与えられるのではなく、学習を通じて発見される。モデルは膨大なテキストコーパスにさらされ、最適化のプロセスを通じて自らの内部構造を発展させる。文法パターン、意味関係、次に何が来るかを予測するための文脈的な依存関係だ。誰もこれらの表現を指定しなかった。モデルが自ら見つけ出したのだ。
これこそが大規模言語モデルをこれほど強力にする理由であり、同時に不透明にする理由でもある。モデルは驚くほどうまく機能する内部構造を発展させたが、それを回帰の係数を検証するように完全に検査したり記述したりすることはできない。ファクターモデルがある推定値を出す理由を知るように、モデルがある出力を生成する理由を正確に知ることはできない。この不透明性は、信頼性、監査可能性、そして金融機関において極めて重要なガバナンスの問題に対して、深刻な影響を持つ。
これはまた、AI が予測しにくいミスを犯す可能性があると言われる理由の一つでもある。モデルが誤った出力を生成したとき、それが何を言ったかは観察できるが、その出力を生み出したプロセスを完全にトレースすることはできない。出力から過程を逆算するしかないが、これはエラーを発見したり説明したりするための不完全な基盤だ。ハルシネーション——モデルが形式的には妥当に見えるが事実として誤ったテキストを生成する現象——はこの構造の直接的な帰結であり、それ自体で一つの号を割くに値するテーマだ。
用語を整理する
この背景知識があれば、用語の整理が容易になる。
生成 AI は大きなカテゴリーだ。コンテンツを生成する AI システム。テキスト、画像、音声、動画の生成はすべて生成 AI に該当する。この用語は、出力の種類を表すのであって、生成の方法を表すのではない。
モデルは生成を行う数学的なエンジンだ。すべての生成 AI アプリケーションはモデルの上で動いている。「モデル」と言うとき、それはこのコンポーネントを特指する——入力を処理して出力を生成する、学習済みのパラメータの集合。
大規模言語モデル(LLM) はモデルの特定の種類だ。テキストを大規模に学習し、言語を理解・生成するためのモデル。「大規模」は学習の規模を指す——膨大なテキストと膨大なパラメータ。「言語」は主要な媒体がテキストであることを示す。ただし、現代の大規模言語モデルは画像、音声、その他の入力も扱えるようになっている。「モデル」は上記と同じ概念だ。
三者の関係をまとめると:大規模言語モデルはモデルの一カテゴリーであり、モデルは生成 AI アプリケーション内のエンジンであり、生成 AI は2026年に人々が「AI」と言うときに通常意味するものだ。
これらの用語が混用されるのは、多くの実際の会話において、同じシステムを異なる角度から指しているからだ。「AI に要約させた」と「モデルで処理した」は、同じ基盤となるものを指しているため、通常は互換的に使える。しかし、システムのどの部分が何に責任を持つかを問い始めたとき——テクノロジー評価、ベンダー審査、リスクガバナンスの議論でまさにそうなる——この区別は重要になる。
モデルが責任を持つことと、持たないこと
エンジンのアナロジーにはもう一つ使い道がある。問題が起きたとき、それがどの層に属するかを明確にするのに役立つ。答えは単純であることはまれだ。
チャットボットが自社の内部ポリシーについて自信を持って誤った回答をしたとき、その失敗はモデルにあるかもしれない——正しそうに聞こえるが実際には誤ったコンテンツを生成したケース。あるいはアプリケーション側にあるかもしれない。モデルはそもそもポリシー文書にアクセスできていなかった。あるいは入力側にあるかもしれない。ユーザーが関連するコンテキストをシステムが知っているはずだと思い込んで提供しなかったケースだ。たとえば、昨日の NASDAQ の終値をモデルに求めるのは、構造的にモデルが知り得ない情報を求めることになる——リアルタイムの市場データには独立したデータ接続レイヤーが必要であり、ほとんどの汎用 AI アプリケーションにはそれがデフォルトで存在しない。三つの失敗は外から見ると似ているが、原因が異なり、解決策も異なる。
モデルは必要条件だが、十分条件ではない。モデルが何を決定し、何を決定しないかを理解することが、これらのシステムを明確に評価し——失敗したときに正しい問いを立てる——出発点となる。
まとめ
大規模言語モデルとは、非常に大規模な数学的関数だ。膨大なテキストで学習し、その規模ゆえに言語に関する自らの内部表現を発見でき、入力に応じて妥当なテキストを生成する。それはデータベースではなく、検索エンジンでもなく、人間の心でもない。言語のパターンを学習し、文脈に適した一貫したテキストを生成できる強力な統計モデルだ。
「AI」という言葉が今日使われる意味は、ほぼこのようなモデルの上に構築されたアプリケーションを指す。モデルはエンジンであり、アプリケーションは自動車全体だ。どちらも重要だが、それらは異なるものであり、混同すると問いの方向が狂う。
あらゆる AI ツールに対して、より有用な問い方は「AI は優秀か?」ではなく、「どのモデルを実行しているか?」「アプリケーションがその上に何を構築しているか?」「それはシステムができること、信頼できる形でできないことに対して、何を意味するか?」だ。
これらの問いには、答えを導けるものがある。そこから始める方が、もう一方の問い方より実りがある。
参考リンク
以下の資料はすべて英語です。
Introduction to Large Language Models — Google(機械学習速成コース)。Google による大規模言語モデルの解説。明確な例を用いており、一部技術的な箇所もあるが、専門外の読者にも概ね読みやすい。仕組みをさらに深く知りたい読者の入り口として。
How Large Language Models Work — Andreas Stöffelbauer(マイクロソフト、via Medium)。機械学習と深層学習から始め、大規模言語モデルへと積み上げていく解説。長文だが、現時点で入手できる技術的説明の中でも明快な部類に入る。概念だけでなくアーキテクチャを理解したい読者向け。
AI Can’t Explain How AI Works — CGP Grey(YouTube)。現在の AI ブームより数年前に制作された、AI の学習原理についての分かりやすく楽しい解説動画。明示的なルールをプログラムされることなく学習するというコアな洞察を、この制作者らしい明快さで伝えている。初めてこの概念に触れる読者の導入として。
AI Weekender は毎週発行しています。参考になったと思ったら、同僚にもシェアしていただけると嬉しいです。