flowchart TD
A["① 目的を受け取る"] --> B["② 考える(思考)<br>次に何をすべきか判断する"]
B --> C["③ 道具を使う(行動)<br>ファイルを読む、検索する、計算する等"]
C --> D["④ 結果を確認する(観測)<br>道具の出力を読み取る"]
D --> E{"⑤ 判断する<br>目的は達成されたか?"}
E -- "Yes:終了" --> F["結果を返す"]
E -- "No:繰り返す" --> B
第2章 1つのループがエージェントを生む
2.1 導入:見えない箱の中身を推定せよ
ここに、中身の見えない箱がある。手を入れることはできない。ただし、次の3枚の「道具カード」が手元にある。
- 振る:箱を振って音を聞く
- 重さを測る:箱を秤に載せる
- 磁石を近づける:反応があるかを調べる
まず、道具カードを一切使わずに「箱の中身は何か」と聞かれたとしよう。手がかりがないから、答えようがない。答えたとしても当てずっぽうである。
次に、「道具カードを1枚だけ使ってよい」と言われたらどうか。たとえば「振る」を使って「カラカラと軽い音がした」とわかる。情報は増えるが、中身を特定するにはまだ足りない。
最後に、「道具カードを何枚でも使ってよいし、結果を見てからもう一度使ってもよい」と言われたとする。まず振る。音の感触から金属ではなさそうだと判断する。次に重さを測る。軽い。では磁石を近づけてみる。反応なし。ここまでの結果を総合して「プラスチックの小物が複数入っている」と推定する。
この3番目のやり方が、本章で学ぶ構造の原型である。道具を使い、結果を見て、次に何をするか考え、また道具を使う。この反復こそが、AI を「1回答えて終わり」の道具から「仕事を進める存在」に変える核心である。
2.2 チャットとエージェントの違い
普段使い慣れた対話型 AI(チャット)と、エージェントとして動く AI は、同じモデルを使っていても動作の構造が質的に異なる。違いを整理しよう。
| 観点 | 単発チャット | エージェント |
|---|---|---|
| やり取りの回数 | 1往復で完結 | 目的達成まで何往復もする |
| 道具の使用 | 基本的にない | ファイルを読む、検索する、計算する等 |
| 中間判断 | なし | 結果を見て次の行動を決める |
| 停止のタイミング | 1回答えたら終わり | 目的を達成したか、制限に達したら止まる |
| 失敗時の対応 | 人間が手動でやり直す | AI 自身が別のやり方を試すことがある |
ここで注意すべき点がある。エージェントは「より賢い AI」ではない。モデルの知能は同じである。違うのは、モデルの外側に「道具を渡す」「結果を返す」「繰り返しを管理する」仕組みがあるかどうかである。第1章で導入した言い方を使えば、入力と状態の設計が異なるのである。
このモデルの外側にある仕組みを、本書ではハーネス(harness)と呼ぶ(第1章で導入済み)。エージェントとは、ハーネスによってループ構造を与えられた AI のことである。
2.3 最小ループを描く
エージェントの動作を最も簡潔に表すと、次の5つのステップからなるループになる。
この5ステップの繰り返しがエージェントループ(agent loop)である。
各ステップを具体例で確認する。2.1節の箱の中身推定に当てはめると次のようになる。
| ステップ | 箱の中身推定での具体的な行動 |
|---|---|
| ① 目的を受け取る | 「箱の中身を推定せよ」 |
| ② 考える | 「まず音を確認しよう」 |
| ③ 道具を使う | 道具カード「振る」を使う |
| ④ 結果を確認する | 「カラカラと軽い音がした」 |
| ⑤ 判断する | まだ確定できない → ②に戻る |
| ② 考える(2周目) | 「重さも調べよう」 |
| ③ 道具を使う | 道具カード「重さを測る」を使う |
| ④ 結果を確認する | 「120g だった」 |
| ⑤ 判断する | まだ確定できない → ②に戻る |
| ② 考える(3周目) | 「磁石で金属か確認しよう」 |
| ③ 道具を使う | 道具カード「磁石を近づける」を使う |
| ④ 結果を確認する | 「反応なし」 |
| ⑤ 判断する | 十分な情報が揃った → 結論を出す |
ここで重要なのは、ループの各周回で AI が判断をしていることである。次にどの道具を使うかは、前の周回の結果を見て決めている。2.1節で「道具カードを1枚だけ使え」と言われた場合との違いは、この中間判断の有無にある。
2.4 物理との対応づけ
エージェントループは、物理実験で日常的に行っていることと同じ構造を持っている。
物理の実験を思い出してほしい。たとえば、ばねの伸びと力の関係を調べる実験では次のようにする。
- おもりを吊るす(操作)
- ばねの伸びを測る(観測)
- 結果を記録し、次のおもりの重さを決める(判断)
- フックの法則に合致しているか確認する(評価)
- 十分なデータが集まったら終了、でなければ1に戻る
この手順を、エージェントループと並べてみる。
| 物理実験 | エージェントループ |
|---|---|
| 実験目的の設定 | ① 目的を受け取る |
| 次の操作を計画する | ② 考える |
| 実験装置を操作する | ③ 道具を使う |
| 測定値を読み取る | ④ 結果を確認する |
| 十分か判断し、次へ | ⑤ 判断する |
どちらも、観測 → 判断 → 操作 → 再観測というフィードバックの構造を持っている。物理実験で「1回測って終わり」では信頼できる結論に至らないのと同じように、AI も1回の応答だけでは複雑な仕事を完遂できない。反復と中間判断があってはじめて、結果の質が安定する。
この対応は単なるアナロジーではない。フィードバックは物理で制御系を設計する際の基本原理であり、エージェントの設計もまた同じ原理に基づいている。条件を変えて再測定し、期待通りの結果が得られたかを確認し、必要に応じて条件を修正する——この営みは、物理実験者がすでに体得している知識そのものである。
ただし、物理法則とエージェント設計が数学的に同型であることを主張しているわけではない。実験プロセスの構造的な類似性を手がかりにして、エージェント設計の考え方を身につけることが、本書における物理比喩の目的である。
2.5 停止条件の重要性
ループには「止まる仕組み」が必要である。これは自明に聞こえるかもしれないが、エージェント設計における最も重要な論点の一つである。
なぜか。ループが止まらなければ、AI は道具を使い続ける。ファイルを読み続け、検索し続け、計算し続ける。物理でいえば、終了条件を設定せずに測定を回し続ける自動計測装置のようなものである。時間と資源を浪費するだけでなく、意図しない結果を引き起こす可能性もある。
停止条件には、次の4つのパターンがある。
パターン1:目的達成
最も自然な停止条件である。「要約を書け」と言われた AI が、要約を書き終えたら止まる。ただし「書き終えた」の判断自体に曖昧さが残りうる。
パターン2:ループ回数の上限
あらかじめ「最大10周回まで」のような上限を設ける。目的を達成できなくても、一定回数で強制停止する。乱暴に見えるが、暴走防止の安全装置として有効である。
パターン3:人間による中断
AI が各周回の結果を報告し、人間が「続行」「中断」を判断する。最も安全だが、人間が逐一確認する負担がかかる。
パターン4:エラーの検出
道具の実行に失敗した、予期しない結果が返ってきた等の場合に停止する。物理実験で異常値が出たときに測定を一時中断するのと同じ発想である。
ループがあるからこそ AI は複雑な仕事をこなせる。しかし同時に、ループがあるからこそ暴走のリスクが生まれる。エージェントを設計するとは、このループの回し方と止め方を同時に設計することである。「便利だから回す」だけでは設計になっていない。
実際のエージェントでは、上記の4パターンを組み合わせて使う。たとえば「目的達成で止まるのが基本だが、20周回を超えたら強制停止し、エラーが出たら一時中断して人間に報告する」のように、複数の停止条件を重ねることで安全性を高める。
ここに、第1章で導入した「最終的に人間が責任を持つ」原則が再び現れる。ループの設計責任——何を止める条件とするか、いつ人間に判断を返すか——は人間にある。この点は第12章の安全と倫理の議論でさらに深く扱う。
2.6 第3章への橋渡し
本章では、エージェントの核心がループ構造にあることを確認した。思考→道具使用→結果確認→判断の繰り返しが、AI を「1回答える」存在から「仕事を進める」存在に変える。
では、次の問いが立つ。ループの中で、AI にどんな道具を持たせるか。
2.1節の箱の中身推定では、「振る」「重さを測る」「磁石を近づける」の3枚の道具カードを用意した。道具が違えば得られる情報が変わり、推定の質も変わる。もし「叩く」「X線で透視する」のカードがあれば、まったく異なるアプローチが可能になる。
AI に持たせる道具の選定と設計——これが第3章の主題である。ファイルを読む、検索する、計算する、書き込む。どの道具を渡し、どの道具は渡さないか。その選択がエージェントの能力と安全性を決める。
演習:紙上でエージェントを動かすロールプレイ
形式:4人1組、25分
グループの4人が以下の役割を分担する。
| 役割 | やること |
|---|---|
| AI 役 | 「次に何をするか」を考え、道具の使用を宣言する |
| 道具係 | AI 役が宣言した道具を「実行」し、結果を紙に書いて返す |
| 記録係 | 各周回の行動と結果を時系列で記録する |
| 監査係 | 各周回で「これは適切か」「止めるべきか」を判定する |
進め方:
以下の課題から1つを選ぶ(または自分で設定してよい)。
- 「大学の図書館で、特定のテーマに関する本を3冊見つけよ」(使える道具:検索、書架を見に行く、司書に質問する)
- 「明日の天気に基づいて遠足の持ち物リストを作れ」(使える道具:天気予報を見る、過去の遠足記録を読む、リストに書き込む)
- 「実験レポートの考察で引用すべき先行研究を探せ」(使える道具:論文検索、教科書を読む、教員に質問する)
AI 役は「次にやること」を口頭で宣言する。道具係がその結果を返す。記録係が記録する。監査係は「続けてよい」「止めたほうがよい」を判定する。
5周回を目安に進め、目的を達成できたかを全員で確認する。
振り返りの問い:
- 何周回で目的を達成できたか
- 監査係が「止めるべき」と言った場面はあったか。その判断の根拠は何か
- 道具が足りないと感じた場面はあったか。あったとすれば、どんな道具があればよかったか
- AI 役が「次に何をするか」を決めにくかった場面はどこか
章末課題
課題:自分の学習に役立つ最小エージェントを設計する
自分の学生生活・専門学習に関わる仕事を1つ選び、以下の形式でまとめよ。
必須項目:
- ループ図:2.3節の形式に倣い、5ステップの流れを自分の課題に当てはめた図を描く
- 説明文(400〜600字):なぜこの仕事にループ構造が必要なのかを論じる
- 道具リスト(3つ以上):AI に持たせたい道具を列挙し、それぞれ何のために使うかを1行で書く
- 停止条件:2.5節の4パターンのうち、どれを採用するか。理由をつけて述べよ
提出形式:A4 1枚(図と文章)
評価観点:
- ループの必然性が説明されているか(「1回の応答では不十分な理由」が書かれているか)
- 道具が目的に対して妥当か(過不足がないか)
- 停止条件が具体的で、なぜその条件を選んだかの理由があるか
- 第1章の課題と整合しているか(入力・状態・出力の設計がループに発展しているか)
第2章のまとめ
本章では、AI が仕事を進めるための最小構造——エージェントループ——を導入した。
要点を整理する。
- 単発のチャットとエージェントの違いは、AI の賢さではなく、ループ構造の有無にある
- エージェントループは「目的 → 思考 → 道具使用 → 結果確認 → 判断」の5ステップからなる
- このループは、物理実験の「操作 → 観測 → 判断 → 再操作」というフィードバックと同じ構造である
- ループには停止条件が不可欠であり、停止条件の設計はエージェント設計の核心的な部分である
- ループの利点とリスクはセットであり、便利さだけで導入してはならない
次の第3章では、ループの中で AI に渡す道具(tool)を設計する。AI が外部に作用する手段——ファイルを読む、書く、検索する、計算する——をどう選び、どう制限するか。道具の設計が、エージェントの能力と安全性の両方を決定する。