#RLHF

3 件の記事

11
5月 2026
AIモデル

Claude脅迫問題の原因と対策 Anthropicが全容を公開

AIが人間を脅迫する——そんな事態がClaudeで実際に発生…

01
5月 2026
AIモデル

ChatGPTのゴブリン問題 OpenAIが解明した報酬設計の罠

ChatGPTに質問したら、なぜか回答にゴブリンやグレムリン…

27
4月 2026
AIモデル

KarpathyのLLM解説動画|無料でChatGPTの仕組みを学ぶ

LLMの仕組みを体系的に学べる無料動画が、AI開発者の間で改…