行政の生成AI基盤が、OSSとして誰でも参照できるようになった。

デジタル庁は2026年4月24日、18万人の政府職員が実際に使っている生成AI利活用基盤「源内(GenAI)」をGitHubでOSS公開した。AWS・Google Cloud・Azureそれぞれの実装テンプレートが含まれており、RAG設計やLLMホスティングの参考実装として活用できる。

この記事でわかること

  • 「源内」が解決する行政AIの課題と全体構成
  • 公開された3つのAIアプリテンプレートの仕様
  • ライセンスと活用上の注意点

省庁ごとのAI開発コスト重複を中央基盤で解消する

各省庁が個別にAI基盤を構築すると、開発コストが重複し、品質にばらつきが生じる。源内はその問題を解消するために設計された中央共通基盤だ。デジタル庁が開発・運用を担い、各省庁の職員は源内のWebインターフェース上で業務特化のAIアプリを呼び出せる。

システムは2層に分かれている。利用者向けWebアプリ「源内 Web」(genai-web)と、業務ごとのAI処理を担うマイクロサービス群「行政実務用AIアプリ」(genai-ai-api)だ。

源内 WebはAWSのOSS「Generative AI Use Cases(GenU)」をベースに、チーム管理機能、AIアプリの追加・実行機能、デジタル庁デザインシステムへの対応などを加えた構成になっている。SAMLによる認証やCI/CD設定、カスタムドメイン設定のドキュメントも整備されており、そのまま組織内に展開できる設計だ。

公開された3つのAIアプリテンプレート

AWS:クエリ拡張RAG APIテンプレート

https://github.com/digital-go-jp/genai-ai-api/tree/main/aws/query-expansion-rag

AWS CDKを使い、Bedrock Knowledge Base上にクエリ拡張RAGをデプロイするためのテンプレートだ。クエリ拡張とはユーザーの質問を複数バリエーションに言い換えてから検索する手法で、関連文書のヒット率を高める効果がある。

処理の中心はPython製のRAG Lambdaで、Bedrock Converse APIでクエリを複数展開し、Bedrock Knowledge Baseに並列投入する。Knowledge BaseのバックエンドはOpenSearch Serverlessで、関連性評価を経て最終回答を生成する。API Gatewayのx-api-keyによる認証を挟んで外部公開する構成だ。

設定ファイルを切り替えるだけで複数のRAGアプリを同一コードベースからデプロイでき、省庁ごとに異なる文書管理要件に対応できる。データ保護のためKMS Customer Managed Keyによる暗号化が標準で組み込まれており、API(RAGインデックス)ごとに暗号化キーを分離して管理する個別CMEK方式と、複数APIで共有する共通CMEK方式の両方をサポートしている。

Google Cloud:法令AIアプリ(Lawsy)

https://github.com/digital-go-jp/genai-ai-api/tree/main/google-cloud/lawsy-custom-bq

e-Govの法令データを対象に、法律に関する質問へ回答するサーバーレスAPIだ。BigQuery MLのベクトル検索とGemini 2.5 Flashを組み合わせ、条文の特定から包括的なレポート生成までを自動化している。

処理の流れはまずWeb groundingで関連法令名を推定し、施行令・施行規則を補完して検索対象を拡張するところから始まる。続いてBigQuery MLで条文を並列検索しながら、Web検索とクエリURL取得も同時に走らせる。AIがクエリの意図を判断して6種類のレポートパターンから最適な構造を自動選択し、引用した参考情報だけを出典として整理して返す。根拠の追跡がしやすい設計になっている。

インフラはTerraformで管理されており、Google Cloud Functions・BigQuery ML・API Gatewayで構成されるサーバーレス構成だ。

Azure:vLLMセルフデプロイテンプレート

https://github.com/digital-go-jp/genai-ai-api/tree/main/azure/genai-azure

Hugging Face対応モデルをAzure上にホスティングし、APIとして提供するためのテンプレートだ。Azure API ManagementとApplication GatewayでIPアドレス制限とAPIキー認証を担い、Virtual Machine Scale Setで推論ノードをスケールアウトする構成になっている。

実装例としてPFNのPLaMo翻訳モデルが使われているが、vLLM対応モデルであれば差し替えて利用できる。Azure OpenAI直接APIとの併用もサポートしており、モデルの種類に応じて切り替えて使う設計だ。Azure Automationで定時起動・停止を設定することで、夜間の無駄なコストも抑えられる。

ライセンスと活用上の注意点

ソースコードはMITライセンスで公開されており、商用利用も可能だ。ドキュメントはCC BY 4.0(帰属表示4.0国際)での提供となる。ただし、AWSプロトタイピングプログラムで作成された一部のLambda・CDKファイルはAmazon Software License(ASL)の対象となるため、利用前に対象ファイル一覧を確認しておく必要がある。

Pull Requestは受け付けていない。Issueもデータ損失・サービス停止・法令違反に関わる問題のみを対象とする方針で、機能追加の要望や質問は受け付けていない。あくまで実装の参照が主目的のリポジトリと位置づけられている。

セキュリティ上の脆弱性を発見した場合は、第三者への開示前にデジタル庁のGitHub Securityページへ報告することが求められている。

民間のAI基盤設計に応用できる知見が詰まっている

源内の公開で、行政レベルの堅牢性を持つRAG・法令AI・LLMセルフホスティングの実装例が無償で参照できるようになった。クエリ拡張RAGにおけるKMS暗号化設計の分離方式や、Lawsyの並列検索と6パターンのレポート自動選択など、本番運用を前提とした実用的な実装が含まれている。社内AI検索基盤や業務向けRAGを設計する際の参考として使える内容だ。

2つのリポジトリはGitHubで公開されている。

https://github.com/digital-go-jp/genai-web

https://github.com/digital-go-jp/genai-ai-api