【ITニュース解説】The 90/10 Rule: The Inconvenient Truth About Agentic AI — It’s All Plumbing, No Brain
2025年09月10日に「Dev.to」が公開したITニュース「The 90/10 Rule: The Inconvenient Truth About Agentic AI — It’s All Plumbing, No Brain」について初心者にもわかりやすく解説しています。
ITニュース概要
自律型AIシステムの開発は、90%がソフトウェアエンジニアリングであり、AIモデル自体は10%に過ぎない。エラー処理、状態管理、API連携、安全性確保など、地道な「配管」作業こそが成功の鍵だ。AIモデルは常に進化するため、モデルに依存しない柔軟なシステム構築が重要となる。AI企業はまずソフトウェア企業であるべきだ。
ITニュース解説
AI技術の進化が目覚ましい現代において、人工知能(AI)という言葉が持つ「知性」のイメージに魅了されがちである。しかし、実際にAIエージェントシステムを構築する現場では、その「知性」に関わる部分は全体のごく一部に過ぎず、作業のほとんどは従来のソフトウェア開発が占めるという現実がある。これは「90/10ルール」と呼ばれ、AIエージェントシステム開発の90%はソフトウェアエンジニアリングであり、AIモデルそのものに関わる部分はわずか10%であるという、開発現場からの切実な教訓である。多くの議論が最新の基盤モデルの性能やベンチマークスコアに集中する一方で、実際の開発現場ではエラー処理、状態管理、API連携といった地道な作業に多大な労力が費やされている。
まず、AIエージェントという言葉について整理する。業界では「エージェント」「エージェントワークフロー」「エージェントAI」といった用語が混同されがちだが、それぞれ異なる意味合いを持つ。「AIエージェント」とは、環境を認識し、自ら意思決定を行い、目標達成のために行動する自律的なシステムを指す。これは、まるで人間のように状況を判断し、計画を立てて実行する存在に近い。次に、「エージェントワークフロー」は、AIシステムがさまざまなステップで意思決定や行動を行うものの、事前に定義された安全策や制約の中で動作する構造化されたプロセスである。これは、賢い組み立てラインのように、各工程が受け取った情報に基づいて適応するイメージだ。そして、「エージェントAI」は、これら両方を含むより広範なカテゴリであり、単純な意思決定を伴うワークフローから完全な自律エージェントまで、エージェンシー(主体性)を示すあらゆるAIシステムを包含する。これらの主要な違いは、システムの自律性とスコープにある。例えば、ワークフローがAIにどのメールテンプレートを使用するかを決めさせるのに対し、完全なエージェントはメールを送信するかどうか、誰に送信するか、どのようなフォローアップ行動を取るかといった全てを決定する可能性がある。
このようなAIエージェントシステムを実用化するために必要な作業は、ニューラルネットワークのトレーニングといったAIモデルの構築よりも、システム間の複雑な接続、データの流れの管理、処理能力の確保、そしてシステムが負荷を受けた際に問題なく動作することを確認する作業に酷似している。特にリアルタイムのAIシステムを構築する場合、この問題はさらに複雑になる。 例えば、会議予約をこなすようなシンプルなAIエージェントを構築するだけでも、様々な「非AI」的な課題が発生する。「エラーハンドリング」では、カレンダーAPIがダウンした場合、AIがリクエストを誤解した場合、タイムゾーンの競合が発生した場合などにどう対処するかを考慮する必要がある。「状態管理」では、複数のやり取りにわたる会話の文脈をどのように追跡するか、ユーザーが接続を切断された場合にエージェントがユーザーの状況をどのように認識するかといった課題がある。「統合管理」では、異なるAPI間でのレート制限、認証、データ形式の不一致といった問題をどのように処理するかが問われる。「ユーザーエクスペリエンス」では、エージェントが考えている最中にどのようにユーザーにフィードバックを提供するか、失敗した際にいかに丁寧に対応してユーザーの信頼を損なわないようにするかといった側面がある。このように、実際に言語を理解し、応答を生成するAIモデルそのものの実装は、多くの場合、全体の中で最も簡単な部分であり、それ以外の部分を正しく機能させるために数ヶ月もの時間がかかるのが実情である。
AIエージェントシステムの開発において、真の競争優位性、つまり他社との差別化を生み出す源泉は、AIモデルの性能そのものよりも、むしろ地味に見えるソフトウェアエンジニアリングの部分に存在する。「コンテキスト管理」は、AIモデルの持つ限られた文脈ウィンドウとは異なり、実際の会話は非常に長く続くことがある。関連する文脈を長時間のやり取りを通じて維持し、過去の会話をインテリジェントに要約し、適切なタイミングで必要な情報を提示するシステムを構築することは、純粋なソフトウェアエンジニアリングの領域である。最高のAIエージェントシステムは、すべてを記憶するのではなく、適切な情報を記憶する。これには、洗練されたコンテキスト圧縮、関連性スコアリング、情報検索システムが必要となる。「記憶システム」は、人間の記憶が単なる情報の保存ではなく、再構築、関連付け、そして忘却を含むように、AIエージェントが永続的な記憶を形成し、時間を超えて関連付けを行い、さらには無関係な情報を戦略的に忘却する能力を持つためには、複雑なデータアーキテクチャ、キャッシュ戦略、情報アーキテクチャが必要となる。「ワークフロー統合」は、実際のAIエージェントが単独で動作するのではなく、既存のビジネスプロセス内で機能し、企業システムに接続し、必要に応じて人間とシームレスに連携する必要がある。これには、異なるサービス間の複雑なAPI呼び出しのシーケンスを管理するAPIオーケストレーション、異なるデータ形式やスキーマ間での変換を行うデータ変換、エージェントが企業ポリシーやコンプライアンス要件内で動作することを保証するビジネスルール適用、AIと人間のオペレーター間で制御をスムーズに移行するハンドオフプロトコルといった強固な統合レイヤーの構築が不可欠である。「セーフガードと信頼性」は、AIエージェントの自律性が高まるほど、致命的な障害が発生する可能性も増大する。実用レベルのAIエージェントを構築するには、複数の安全層を実装することが求められる。具体的には、エージェントの応答が適切で正確かつ安全であることを確認する出力検証、計画された行動がユーザーの意図やビジネスルールに合致していることを確認する行動検証、問題が発生した際にアクションを元に戻せるロールバックメカニズム、エージェントが予期せぬ挙動を示した場合を検知する監視とアラート、エラー率が急増した際にエージェントを自動的に停止させるサーキットブレーカーなどが必要だ。また、システム上の問題がある場合に、ユーザー体験を損なわないよう適切に対応することも重要となる。「ユーザーエクスペリエンスデザイン」は、ユーザーはAIモデルの技術的なスコアには関心がなく、エージェントが役立つか、信頼できるか、予測可能であるかを重視する。優れたエージェントのユーザーエクスペリエンスには、エージェントが何をしているのか、なぜそうしているのかをユーザーが理解できる透明なコミュニケーション、問題が発生した際にユーザーの信頼を維持する方法で失敗する丁寧な対応、そしてユーザーがエージェントを修正し、その修正からエージェントが学習できるようにするフィードバックループが必要となる。「配布とデプロイメント」は、どれほど優れたエージェントであっても、ユーザーが必要な場所とタイミングでアクセスできなければ無意味である。これには、ウェブ、モバイル、Teams、Slack、メールなど、複数のチャネルで機能するマルチチャネルデプロイメント、変動する負荷にも性能を落とさずに対応できるスケーラブルなインフラストラクチャ、エージェントが実際にどのように利用されているかを理解するための分析および計測システムといった配布システムを構築することが求められる。
一方で、AIモデルそのもの、すなわち10%の部分はどうであろうか。基盤モデルの状況は非常に速いペースで進化しており、今日の「最高の」モデルを選ぶことよりも、環境に適応できる柔軟性が重要となる。音声AIを例にとれば、かつてはOpenAIのWhisperが音声認識の分野を支配していたが、より優れた精度と速度を持つDeepgramのNovaが登場した。また、ElevenLabsは自然な音声合成でこの分野に革命をもたらし、多くの企業に既存の音声パイプラインの見直しを迫った。過去1年間で、ElevenLabsは主に音声合成からリアルタイム会話AIへと進化し、LiveKitも基本的なWebRTCインフラからAIを活用した音声エージェントやマルチモーダル機能を提供するまでに進化した。この急速な変化に対応するため、最も賢明なチームは、新しい選択肢が登場した際に適応できるよう、特定のモデルに依存しないシステムを構築している。今日の最先端技術が明日には標準となるため、常に新しい技術を取り入れられる基盤が重要なのである。
結論として、成功を収めているAIエージェント構築企業は、AI企業である前にソフトウェア企業である。多くの企業がベンチマークスコアを追い求め、見栄えの良いデモを構築する一方で、勝者は信頼性、ユーザーエクスペリエンス、そしてシームレスな統合に焦点を当てている。彼らはAI研究者よりも多くのソフトウェアエンジニアを雇用し、モデルへの投資よりもインフラストラクチャに予算を割き、AIの生性能ではなくシステムの品質で競争している。未来は、AIモデルという「脳」だけでなく、その土台となる複雑なシステム全体を構築・管理する技術を習得した者たちにこそ開かれているのである。