人間が書いたテキストや画像を一切使わずに、自力で知識を獲得するAIが作られようとしている。

この記事でわかること:

  • AlphaGoやAlphaZeroを生み出したDavid Silverが設立したAI企業とは
  • 「スーパーラーナー」と呼ばれる自己学習AIの仕組み
  • 欧州最大のシードラウンド11億ドルが集まった背景

AlphaZeroの開発者がDeepMindを離れた

https://techcrunch.com/2026/04/27/deepminds-david-silver-just-raised-1-1b-to-build-an-ai-that-learns-without-human-data/

英国のAIスタートアップIneffable Intelligenceは2026年4月27日、11億ドル(約1,600億円)のシードラウンド完了を発表した。評価額は51億ドルで、欧州のスタートアップにおける過去最大規模のシードラウンドとなる。

創業者はDavid Silver。UCL(ユニバーシティ・カレッジ・ロンドン)の教授であり、10年以上にわたってDeepMindの強化学習チームを率いてきた人物だ。2016年に囲碁の世界チャンピオンを破ったAlphaGo、人間の棋譜なしにチェスや将棋を習得したAlphaZero、プロゲーマーに匹敵するAlphaStarなど、AI研究における節目となった成果の中心にいた。

2025年11月にIneffable Intelligenceを設立し、2026年1月にはDeepMindを退社して経営に専念している。

「スーパーラーナー」とは何か

現在の大規模言語モデル(LLM)は、インターネット上の大量のテキストや画像など、人間が生成したデータで事前学習(プレトレーニング)を行う。GPT-5やClaudeなどのモデルが「人間らしい」回答を返せるのは、人間の書いた文章をそのまま学習しているためだ。

Ineffableが目指すのはこれとは別の道だ。人間のデータを使わず、強化学習だけで知識を積み上げる「スーパーラーナー」の開発を目指している。

強化学習とは、AIが環境と相互作用しながら試行錯誤を繰り返し、報酬信号をもとに行動を改善していく学習手法のこと。AlphaZeroは棋譜データを一切使わず、自分自身と対局を繰り返すだけで世界最強レベルのチェスプレイヤーになった。Ineffableはこの発想を、特定のゲームに限らず「あらゆる知識領域」へ拡張しようとしている。

同社の公式サイトでは「基本的な運動スキルから深い知的突破まで、すべての知識を自身の経験から発見する」と説明されている。プレトレーニングをスキップし、シミュレーション内での経験を通じて学ぶ設計だ。

目標の野心的さは宣言文にも表れている。「成功すれば、ダーウィンの自然選択説に匹敵する科学的突破となる」と同社サイトに記されており、Silverは「スーパーインテリジェンスとの最初の接触を実現するのが使命」とも語っている。

官民から11億ドルが集まった理由

ラウンドを共同主導したのはSequoia CapitalとLightspeed Venture Partners。参加した投資家にはNVIDIA、Google、DST Global、Index Venturesが名を連ね、英国政府のSovereign AI Fundと英国ビジネス銀行(2,000万ドル)も加わっている。

英国政府の科学技術相Liz Kendall氏は「英国がAIを受け取るだけの国ではなく、作る国であることを示す」とコメントした。英政府がSovereign AI Fundの旗艦案件として打ち出した背景には、ロンドンをAIハブとして位置づける戦略がある。

これほどの資金が集まった核心は、Silverの実績への信頼だ。AlphaGoが囲碁世界チャンピオンを下した2016年、当時の研究者の多くは「あと10年はかかる」と見ていた。その予測を覆した人物が、次の段階として「人間データ不要の汎用的な自己学習」を正面から掲げれば、投資家が反応するのは必然と言える。

研究者の独立ブームという文脈

Ineffable IntelligenceのラウンドはAI研究者の独立ブームという大きな流れとも重なる。

2026年3月、元MetaのAIチーフでチューリング賞受賞者のYann LeCunが立ち上げたAMI Labsが10億ドルを調達した。DeepMindの元主任研究員Tim Rocktäschelが英国で設立したRecursive Superintelligenceも最大10億ドルの調達を報道各社が報じている。

この種の巨額シードラウンドは、農業用語の「seed(種)」から派生した皮肉を込めた呼び名「coconut round(ヤシの実ラウンド)」と呼ばれるようになっている。スタートアップ初期の資金調達とは規模が異なり、著名研究者の名前そのものが資金を引き寄せる構造だ。

OpenAI・DeepMind・Meta・Anthropicなど主要AIラボ出身の研究者が次々と独立し、汎用AIや次世代モデルを追求する流れは2025年から加速しており、ロンドンはその一大拠点となっている。

最初のモデルは2026年末が目標

具体的なモデルの構造や性能については現時点で詳細が公開されていない。最初のモデルのベンチマーク結果は2026年末を目標としている。

強化学習はゲームや制約のある環境では実績が豊富だが、オープンエンドな知識全般への拡張は未踏の部分が多い。LLMとは根本的に異なるアプローチであるだけに、スーパーラーナーが実際に何をどこまで学べるのかは、ベンチマーク公開まで評価しにくい。

Silverは資金調達後、「Ineffableで得た収益はすべて高インパクトな慈善活動に寄付する」と表明している。51億ドルの評価額の企業を率いながら利益を慈善に回すという宣言は、純粋な技術的使命として取り組む姿勢を示している。

2026年末のベンチマーク結果が、AlphaZero以来の「常識を覆す成果」になるかどうかが最初の注目点となる。