14 KiB
s01: The Agent Loop (エージェントループ)
[ s01 ] s02 > s03 > s04 > s05 > s06 | s07 > s08 > s09 > s10 > s11 > s12
"One loop & Bash is all you need" -- 1つのツール + 1つのループ = エージェント。
Harness 層: ループ -- モデルと現実世界を繋ぐ最初の接点。
問題
言語モデルはコードについて推論できるが、現実世界に触れられない -- ファイルを読めず、テストを実行できず、エラーを確認できない。ループがなければ、ツール呼び出しのたびに手動で結果を貼り戻す必要がある。あなた自身がそのループになる。
解決策
+--------+ +-------+ +---------+
| User | ---> | LLM | ---> | Tool |
| prompt | | | | execute |
+--------+ +---+---+ +----+----+
^ |
| tool_result |
+----------------+
(ChatClient.call() がツール呼び出しがなくなるまで自動ループ)
1つの call() 呼び出しがフロー全体を制御する。Spring AI が自動的にループし、モデルがツール呼び出しを止めるまで続ける。
仕組み
1. ChatClient の構築:モデル注入 + ツール登録
Spring Boot の自動設定で ChatModel を注入し、ChatClient.builder() でクライアントを構築、システムプロンプトとツールを設定する。
// TIP: Python 版ではモジュールレベルで client = Anthropic() と MODEL を作成。
// Spring AI は自動設定で ChatModel を注入し、builder で ChatClient を構築する。
public S01AgentLoop(ChatModel chatModel) {
this.chatClient = ChatClient.builder(chatModel)
.defaultSystem("You are a coding agent at " + System.getProperty("user.dir")
+ ". Use bash to solve tasks. Act, don't explain.")
.defaultTools(new BashTool()) // @Tool アノテーション付きツールオブジェクト
.build();
}
2. @Tool アノテーション:宣言的ツール登録
Spring AI は @Tool アノテーションでツールを自動的に検出・登録する。起動時にフレームワークが defaultTools() に渡されたオブジェクトをスキャンし、すべての @Tool メソッドのシグネチャと説明を抽出し、LLM が必要とするツールスキーマ(名前、パラメータ、説明)を生成して、毎回の call() リクエストに自動的に含める。
// BashTool -- Python 版の run_bash() 関数に相当
public class BashTool {
@Tool(description = "Run a shell command and return stdout + stderr")
public String bash(@ToolParam(description = "The shell command to execute")
String command) {
// 危険コマンドチェック + ProcessBuilder 実行 + タイムアウト制御 + 出力切り詰め
// ...
}
}
Python の手動登録方式との比較:
- Python:
TOOLS = [{"name": "bash", "input_schema": {...}}]+TOOL_HANDLERS = {"bash": run_bash}- Java:
@Tool+@ToolParamアノテーションだけで、フレームワークがスキーマ生成とメソッドディスパッチを自動化
3. Spring AI 内部自動ループ:call() の内部実装
これが Java 版と Python 版の最も重要な違いだ。 Python 版ではツール呼び出しを駆動するために手書きの while ループが必要:
# Python 版 -- 手動ループ
def agent_loop(messages):
while True:
response = client.messages.create(model=MODEL, messages=messages, tools=TOOLS)
# assistant メッセージを収集
messages.append({"role": "assistant", "content": response.content})
if response.stop_reason != "tool_use":
return response # モデルがツールを呼ばなくなった、ループ終了
# ツールを実行して結果を返送
for block in response.content:
if block.type == "tool_use":
result = TOOL_HANDLERS[block.name](block.input)
messages.append({"role": "user", "content": [{"type": "tool_result", ...}]})
Spring AI の ChatClient.call() は完全に等価なロジックを内部にカプセル化している:
call() 内部フロー:
┌─────────────────────────────────────────────────────┐
│ 1. リクエスト組み立て: system prompt + user msg + tools │
│ 2. LLM に送信 │
│ 3. レスポンス解析 │
│ ├── tool_use あり? ──→ はい: │
│ │ a. ツール名と引数を抽出 │
│ │ b. リフレクションで対応する @Tool メソッドを呼出 │
│ │ c. tool_result をメッセージリストに追加 │
│ │ d. ステップ 2 に戻る(自動ループ) │
│ └── いいえ ──→ 最終テキストを返す │
└─────────────────────────────────────────────────────┘
キーポイント:
- ツール検出: Spring AI はレスポンスに
tool_useタイプのコンテンツブロックがあるかチェック(Python のstop_reason == "tool_use"に相当) - リフレクションディスパッチ: フレームワークが Java リフレクションで、LLM が返したツール名に対応する
@Toolメソッドを見つけて呼び出す(Python のTOOL_HANDLERS[block.name]に相当) - 結果返送: ツール実行結果は自動的に
tool_resultメッセージとして会話に追加(Python が手動でtool_resultコンテンツブロックを構築するのに相当) - ループ終了: モデルが純粋なテキスト(ツール呼び出しなし)を返すと、
call()が最終結果を返す
従って、Python 版の約15行の while ループは、Java 版では1行の .call() に凝縮される。
4. AgentRunner.interactive():REPL インタラクションループ
AgentRunner は全レッスン共通の REPL(Read-Eval-Print Loop)ユーティリティクラスで、Python の if __name__ == "__main__" 内の input() ループに相当する。
public class AgentRunner {
/**
* インタラクティブ REPL ループを開始。
* @param prefix プロンプトプレフィックス(例: "s01")
* @param handler ユーザー入力を処理し Agent レスポンスを返す関数
*/
public static void interactive(String prefix, Function<String, String> handler) {
Scanner scanner = new Scanner(System.in);
System.out.println("'q' または 'exit' で終了");
while (true) {
System.out.print("\033[36m" + prefix + " >> \033[0m"); // カラープロンプト
String input;
try {
if (!scanner.hasNextLine()) break;
input = scanner.nextLine().trim();
} catch (Exception e) {
break;
}
if (input.isEmpty() || "exit".equalsIgnoreCase(input) || "q".equalsIgnoreCase(input)) {
break;
}
try {
String response = handler.apply(input); // Agent ハンドラーを呼び出し
if (response != null && !response.isBlank()) {
System.out.println(response);
}
} catch (Exception e) {
System.err.println("Error: " + e.getMessage());
}
System.out.println();
}
System.out.println("Bye!");
}
}
ワークフロー:Scanner で入力読み取り → handler.apply() で Agent に送信 → レスポンス出力 → ループ。handler は関数型インターフェースで、各レッスンが自分の Agent 呼び出しロジックを渡す。
5. 完全な Agent クラスとして組み立て
@SpringBootApplication(scanBasePackages = "io.mybatis.learn.core")
public class S01AgentLoop implements CommandLineRunner {
private final ChatClient chatClient;
public S01AgentLoop(ChatModel chatModel) {
this.chatClient = ChatClient.builder(chatModel)
.defaultSystem("You are a coding agent at ...")
.defaultTools(new BashTool())
.build();
}
@Override
public void run(String... args) {
AgentRunner.interactive("s01", userMessage ->
chatClient.prompt()
.user(userMessage)
.call() // ← この1つの呼び出し = Python の while ループ全体
.content()
);
}
}
TIPS — Python → Java 主要な適応ポイント:
- Python の
while True+stop_reason手動ループ → Spring AIChatClient.call()内蔵自動ループ- Python の
TOOLS配列 +TOOL_HANDLERS辞書 →@Toolアノテーション +defaultTools()自動登録とリフレクションディスパッチ- Python の
client = Anthropic()→ Spring Boot 自動設定でChatModelを注入- Python の
input()インタラクション →AgentRunner.interactive()が Scanner REPL + 関数型インターフェースをカプセル化
コアコード40行未満、これがエージェント全体だ。残り11章はすべてこのループの上にメカニズムを積み重ねる -- ループ自体は決して変わらない。
変更点
| コンポーネント | 変更前 | 変更後 |
|---|---|---|
| Agent loop | (なし) | ChatClient.call() 内蔵ツールループ |
| Tools | (なし) | BashTool (単一の @Tool ツール) |
| Messages | (なし) | Spring AI が内部でメッセージリストを管理 |
| Control flow | (なし) | フレームワークが自動判定: ツール呼び出しなしで最終テキストを返す |
// コアコード -- 構築 + 呼び出し
ChatClient chatClient = ChatClient.builder(chatModel)
.defaultSystem("You are a coding agent ...")
.defaultTools(new BashTool())
.build();
AgentRunner.interactive("s01", userMessage ->
chatClient.prompt().user(userMessage).call().content()
);
試してみる
cd learn-claude-code
mvn exec:java -Dexec.mainClass=io.mybatis.learn.s01.S01AgentLoop
実行前に環境変数の設定が必要:
AI_API_KEY,AI_BASE_URL,AI_MODELデフォルトプロトコルは OpenAI(OpenAI 公式、Azure OpenAI、OpenAI 互換インターフェースを提供するサードパーティモデルサービスなど、すべての OpenAI API 形式のサービスに対応)。 Anthropic プロトコル(Claude ネイティブ API)を使用する場合は、以下のセクションを展開してください。
AI プロトコルの切り替え(OpenAI ↔ Anthropic)
このプロジェクトは Spring AI の Starter 依存 + 設定ファイル で基盤プロトコルを切り替える。Java ビジネスコード(ChatModel、ChatClient)は変更不要。
方式 1:OpenAI プロトコル(デフォルト)
pom.xml の依存:
<dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai-starter-model-openai</artifactId>
</dependency>
application.yml の設定:
spring:
ai:
openai:
api-key: ${AI_API_KEY:sk-xxx}
base-url: ${AI_BASE_URL:https://api.openai.com}
chat:
options:
model: ${AI_MODEL:gpt-4o}
環境変数の例:
export AI_API_KEY=sk-proj-xxxxxxxx
export AI_BASE_URL=https://api.openai.com # 任意の OpenAI 互換エンドポイントに変更可
export AI_MODEL=gpt-4o
TIP: 多くのサードパーティモデルサービス(DeepSeek、Mistral、Qwen など)が OpenAI 互換 API を提供している。
AI_BASE_URLとAI_MODELを変更するだけで接続でき、プロトコル切り替えは不要。
方式 2:Anthropic プロトコル(Claude ネイティブ API)
ステップ 1:pom.xml を編集 — OpenAI starter を Anthropic starter に置き換え:
<!-- OpenAI starter をコメントアウトまたは削除 -->
<!-- <dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai-starter-model-openai</artifactId>
</dependency> -->
<!-- Anthropic starter を追加 -->
<dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai-starter-model-anthropic</artifactId>
</dependency>
ステップ 2:application.yml を編集 — spring.ai.openai を spring.ai.anthropic に置き換え:
spring:
ai:
anthropic:
api-key: ${AI_API_KEY}
base-url: ${AI_BASE_URL:https://api.anthropic.com}
chat:
options:
model: ${AI_MODEL:claude-sonnet-4-20250514}
ステップ 3:環境変数を設定:
export AI_API_KEY=sk-ant-xxxxxxxx
export AI_BASE_URL=https://api.anthropic.com
export AI_MODEL=claude-sonnet-4-20250514
切り替えの仕組み
Spring AI の ChatModel は統一された抽象インターフェース。異なる Starter が異なる実装を提供する:
| Starter 依存 | 自動注入される ChatModel 実装 | 設定プレフィックス |
|---|---|---|
spring-ai-starter-model-openai |
OpenAiChatModel |
spring.ai.openai.* |
spring-ai-starter-model-anthropic |
AnthropicChatModel |
spring.ai.anthropic.* |
ビジネスコードは常に ChatModel インターフェースに対してプログラムする。プロトコル切り替えには依存と設定の変更だけが必要で、Java コードの変更は不要。
以下のプロンプトを試してみよう(英語プロンプトの方が LLM に効果的だが、日本語でも可):
Create a file called Hello.java that prints "Hello, World!"List all Java files in this directoryWhat is the current git branch?Create a directory called test_output and write 3 files in it