GPT-chat-latest入門　AzureのGPT-5.5で幻覚が半減

GPT-5.5 InstantがMicrosoft Foundryに「GPT-chat-latest」として登場しました。

2026年5月5日、MicrosoftはAzureのAI開発プラットフォーム「Microsoft Foundry」に新チャットモデル「GPT-chat-latest」の提供を開始しました。前モデル（GPT-5.3-chat）と比べて幻覚（ハルシネーション）を52.5%削減し、出力語数を最大30%短縮したプロダクション向けの新しい選択肢です。

この記事でわかること：

「GPT-chat-latest」という名前に変わった背景
幻覚削減・出力効率の具体的な改善数値
ツール呼び出しとRAGへの影響
向いているユースケースと料金

https://techcommunity.microsoft.com/blog/azure-ai-foundry-blog/introducing-openais-newest-chat-model-in-microsoft-foundry/4516848

名前が変わった背景

Microsoft FoundryではOpenAIのGPT-5.5 Instant（API名：chat-latest）を「GPT-chat-latest」という製品名で提供します。このモデルはGPT-5.4とGPT-5.3-chatを前身として構築されており、既存のPreviewライフサイクルと通知期間に従って継続的に更新される予定です。

名前の変更は単なるブランディングではなく、今後のモデル更新サイクルをシンプルにする布石でもあります。MicrosoftはFoundry上で顧客が継続的に最新モデルにアクセスできる仕組みを検討中としており、GPT-chat-latestはその第一歩に位置づけられています。

幻覚削減の数値

GPT-chat-latestで最も大きく変わったのは事実精度です。OpenAIの内部評価によると、GPT-5.3-chatと比べて次の改善が確認されています。

幻覚された主張が52.5%削減
事実誤認として報告された過去の会話での幻覚が37.3%削減

ベンチマークでも同様の傾向があります。

ベンチマーク	GPT-5.3-chat	GPT-chat-latest
CharXiv-reasoning（科学図表推論）	75.0	81.6
MMMU-Pro（専門マルチモーダル推論）	69.2	76.0
GPQA（PhDレベル科学問題）	78.5	85.6
AIME 2025（数学競技問題）	65.4	81.2

（出典：OpenAIのテストデータ（参考））

医療・法律・金融・技術分析のように精度が重要な分野では、この改善がプロダクション品質に直結します。特に規制対象の業務アプリでは、幻覚率の低下は導入判断に大きく関わる指標です。

出力が短くなった意味

GPT-chat-latestは同じ内容をより少ない言葉で伝えます。OpenAIの比較テストでは、一般的なプロンプトに対して語数が25〜30%減少しています。余分な前置きや過剰な整形が減り、出力をそのままUIに流し込めるケースが増えます。

出力トークン数の削減は大量処理時のコスト削減にも直接影響します。月間数十万回のAPI呼び出しを行うサービスでは、この差は無視できないコスト変数です。後処理でレスポンスを整形する工数も減らせます。

ツール呼び出しとRAGへの影響

GPT-chat-latestはツールをいつ・どのように使うかの判断精度が向上しています。関数呼び出し（Function Calling）、検索拡張生成（RAG：Retrieval-Augmented Generation）、マルチステップ推論のワークフローで、より構造化された出力を返します。

注目すべき変化は「ツールが不要なときに呼び出さない」点です。すでに回答に十分な情報がある場合、不要なAPIコールをスキップします。外部APIの呼び出し回数が減ることで、コストと応答速度の両方に好影響があります。

検索精度の面では、クエリ生成・結果ランキング・フィルタリングの各工程が改善されました。曖昧なクエリに対する応答の信頼性が上がり、取得したドキュメントをコンテキストにより自然に統合できます。長い会話履歴や複数の検索ステップをまたぐアプリでも、より一貫した出力が得られます。

向いているユースケース

Microsoft Foundryのブログでは、GPT-chat-latestが特に効果を発揮する用途として3つが挙げられています。

カスタマーサポート・コンタクトセンターでは、複数ターンの会話コンテキストを維持しながらポリシー文書やナレッジベースを検索し、エスカレーション時にCRMや発券システムへのツール呼び出しを行うバーチャルエージェントに向いています。

小売・ECでは、ユーザーの好みを複数ターンで把握しながら商品カタログや返品ポリシーを参照し、返品・交換・注文照会のアクションを実行するアシスタントに活用できます。

製造・フィールドサービスでは、マニュアルや作業指示書を検索しながら会話形式でガイダンスを提供し、保守システムへのタスク作成を行う技術者向けアシスタントとして機能します。

一方、複雑な意思決定・詳細な要件分析・長期計画など重い推論が必要な場面には「GPT-5.5 Reasoning」が向いており、GPT-chat-latestとは使い分けが明確です。

料金

項目	単価
入力（1Mトークン）	$5
キャッシュ入力（1Mトークン）	$0.50
出力（1Mトークン）	$30

キャッシュ入力が$0.50という設定は、同じシステムプロンプトや共通コンテキストを繰り返し使うアプリでコスト効率が高くなります。出力が25〜30%短縮される分、$30/1Mというアウトプット単価も実コストとしては抑えやすくなります。

導入するには

GPT-chat-latestは2026年5月5日よりMicrosoft Foundryで段階的にロールアウト中です。既存のFoundry利用者はモデルカタログから選択できます。現状はPreviewステータスで、通常の通知期間に従った更新が適用されます。

エンタープライズ向けのAI開発基盤として、OpenAIの最新モデルをAzureの安全・ガバナンス・コンプライアンス機能と組み合わせて使いたい開発者にとって、GPT-chat-latestはタイムリーな選択肢です。