AIエージェントの仕組みを、有料講座なしで短時間に学べる公式教材が出揃いました。
2026年6月10日、Google Cloud Techチャンネルが「AI agents explained: Build your first agent in 8 minutes」を公開しました。動画の長さは約8分29秒で、視聴料は無料です。同じ内容を手を動かして追えるCodelabも用意されており、所要時間は約30分と案内されています。
この記事では、動画とCodelabで扱われるエージェントの考え方と、Google Agent Development Kit(ADK)を使った最小構成の作り方を整理します。
この記事でわかること
- 8分動画とCodelabで何を学べるか
- ReActと3つのエージェントパターンの違い
- agent loops・memory・harness・sub-agentsが実装でどう現れるか
- 自己修正するブログ執筆エージェントの構成
- ローカルで試すための準備と次の学習先
チャットボットとエージェントの違い
従来のチャットボットは、入力に対して1回の応答を返すのが基本です。一方、AIエージェントはリクエストを受け取ったあと、次に何をするかを判断し、API呼び出しやコード実行などの行動を取り、結果を見て次の手を選びます。
GoogleのCodelabでは、この循環の理論的背景としてReAct(Reasoning and Acting)を挙げています。言語モデルが一度に文章を吐き切るのではなく、段階的に推論し、ツールを使い、観察結果を踏まえて動きを修正する——このサイクルが現代のエージェント設計の土台です。
課題は「単発応答では複数ステップの仕事を任せられない」点にあります。旅行予約のように依存関係のある作業や、品質チェック付きの文書生成では、推論と行動のループが欠かせません。
8分動画で扱う3つのエージェントパターン
https://www.youtube.com/watch?v=Zqno_vux6d8
動画では、エージェントの振る舞いを次の3類型に分けて説明しています。
Sequential(逐次型)は、Step 1→Step 2→Step 3と決まった順で処理を進めます。流れが読みやすい反面、状況に応じた柔軟性は低くなります。
Reactive(反応型)は、その時点の状態だけを見て次の行動を選びます。動的なタスク向きですが、先を読んだ計画は持ちにくいです。
Deliberative / Planning(計画型)は、いきなり実行せず骨子を立ててから動きます。今回のハンズオンであるブログ執筆エージェントは、この計画型に当たります。まずアウトラインを作り、次に本文を書く流れです。
どの型が正解かは用途次第です。単純な定型処理なら逐次型、状況が変わる作業なら反応型、依存関係の多い目標なら計画型を選ぶ、という整理が動画とCodelabの共通メッセージです。
agent loops・sub-agents・memory・harnessの実装イメージ
X上の紹介では、動画がagent loops、memory、harnesses、sub-agentsを平易に解説しているとされています。ADKのコードに当てはめると、次のように対応します。
sub-agents(専門エージェントの分割)
Codelabのサンプルでは、BlogPlannerが構成案を、BlogWriterが本文を担当するサブエージェントとして定義されています。ルートのBloggerエージェントが、プランナー用ツールとライター用ツールを順に呼び出して全体を束ねます。
単一の巨大なプロンプトに任せるより、役割を分けた方がデバッグしやすく、品質も安定しやすい——Google Developers Blogでも、マルチエージェントはマイクロサービス的な分割として推奨されています。
agent loops(自己修正ループ)
LoopAgentは、サブエージェントの列を繰り返し実行するワークフロー用コンポーネントです。Codelabでは、アウトライン検証用のOutlineValidationCheckerと組み合わせ、robust_blog_plannerとして最大3回まで再試行する構成になっています。検証がretryを返せばプランナーが再実行され、本文側も同様にrobust_blog_writerが品質ゲート付きでループします。
ADK公式ドキュメントでも、WriterとCriticをLoopAgentに入れて反復改善する例が示されています。ループはmax_iterationsで上限を設けるか、サブエージェントが終了条件を満たしたときに抜ける設計が前提です。
memory(セッションと状態)
8分動画のサンプルでは、各エージェントがoutput_keyで共有状態に書き込む形が中心です。たとえばblog_outlineキーに構成案を保存し、ライターがそれを読んで本文を生成します。
より深い記憶の話は、Building Stateful and Personalized Agents with ADKで体系化されています。短い説明にまとめると、Sessionが会話履歴の入れ物、Stateがセッション内のキーと値のメモ帳、MemoryServiceがセッションをまたいだ長期記憶、という3層です。8分動画は入門なのでState中心ですが、「エージェントに記憶を持たせる」概念の入口にはなります。
harness(実行基盤)
ここでのharnessは、モデル単体ではなく、ツール呼び出し・ルーティング・ループ制御を包む実行枠組みを指します。ADKはGoogle Cloud公式ドキュメントで「エンタープライズ規模のAIエージェントを構築・デバッグ・デプロイするためのオープンソースのエージェント開発フレームワーク」と説明されています。
ADK Crash Courseでは、エージェント定義に加えてRunnerがクエリを受け取り、セッションとツールを束ねて応答を生成する実行エンジンだと整理されています。動画でadk webを起動してブラウザUIから試すのも、このharness上でエージェントを動かしている、と捉えると全体像がつながります。
ハンズオンで作る「自己修正ブログライター」
https://codelabs.developers.google.com/build-ai-agent-google-adk
実習のゴールは、トピックを渡すと構成案を作り、検証を通したうえで技術ブログ本文まで書き上げるマルチエージェントです。使用モデルはGeminiで、Google AI StudioのAPIキーが必要です。
環境準備の要点は次のとおりです。
- Python 3.10以上を用意する
- プロジェクトに
google-adk==2.2.0などをインストールする .envにGOOGLE_API_KEYを設定するagent.pyにプランナー・ライター・検証・ループ・ルートエージェントを定義する- 仮想環境を有効化したうえで
adk webを実行する
動画のタイムラインでは、約4分15秒でADKとUVのセットアップ、4分50秒からプランナー実装、5分40秒から検証とループ、6分50秒からライターとルートエージェント、8分20秒でADK Web UIの動作確認に入ります。Codelab側ではCloud Runへのデプロイ手順まで載っており、ローカル検証のあと公開環境へ広げる道筋も示されています。
8分のあとに進む学習パス
入門動画だけでは概念の輪郭を掴む段階です。続きとして押さえたい公式教材があります。
Google Skillsの「Introduction to Agents and Google’s Agent Ecosystem」は、エージェントの基礎からGoogleのエコシステムまでを4アクティビティで学ぶパスです。概念編のIntroduction to AI Agentsは約30分、ハンズオンのBuild Your First Agent with ADKは約1時間と案内されています。
実装を一段深くするなら、ADK Crash CourseでRunner・ツール・マルチエージェント・ParallelAgentまで一通り触れ、Build Multi-Agent Systems with ADKでSequentialAgent・LoopAgent・ParallelAgentの使い分けを固めるのが現実的です。動画の締めでも、MCPサーバー連携が次のステップとして触れられています。
学習を始める前に知っておきたい点
無料とはいえ、Gemini APIキーの取得とPython環境の準備は必要です。CodelabのCloud Runデプロイは課金が有効なGoogle Cloudプロジェクトを前提としますが、ローカルのadk webだけならAI Studioのキーがあれば始められます。
ADK Web UIは開発・デバッグ向けであり、本番運用には向きません。ADKドキュメントでも、本番はCloud RunやAgent Engineなど別の実行基盤を使うよう注意が書かれています。
最初から入れ子のループを組むより、Codelabどおり逐次の計画→執筆から入り、検証ループを1つ足す——Google Developers Blogが推す「まずシンプルなチェーンから」という方針に沿うのが安全です。
8分の動画は、エージェントが「答える」から「動く」へ進むための地図です。ReActの考え方、3パターンの使い分け、LoopAgentによる自己修正、sub-agentsによる役割分担——これらがADKのコードにどう落ちるかを一度通れば、他のフレームワークを読むときも構造の見取り図が手元に残ります。