4GBのChromebookでローカルLLMを動かす手順と限界

停電で通信も切れたとき、クラウドAIは使えません。低スペックのChromebookでもオフラインで文章を整理したい——そんな場面を想定し、実際にローカルLLMを動かした検証レポートを手順として整理しました。

この記事でわかること

4GB RAM・32GBストレージの旧型Chromebookで動かす現実的なルート
LM Playgroundを使った導入手順とモデル選び
実測の生成速度と、Chromebook特有の制約
Termux経由の代替ルートが残る理由

https://play.google.com/store/apps/details?id=com.druk.lmplayground

なぜChromebookでローカルLLMを試すのか

Chromebookはブラウザ作業向けに設計された軽量端末です。クラウドのClaudeやChatGPT、Geminiは通常の回線ならブラウザで問題なく使えます。ローカルLLMの価値が出るのは、停電で基地局まで落ち、モバイル回線も使えないときです。メモの整理や情報の要約を、端末内だけで完結させたい場面に向きます。

検証に使ったのは約4〜5年前のAcer製Chromebookです。RAM 4GB、32GB SSDのうち空きは約5GB。GPUはIntel UHD 600の内蔵グラフィックスで、システムメモリを共有します。パッシブ冷却のCeleron 2コアという、ローカルLLMには最悪に近い構成です。

前提条件と2つの導入ルート

ChromebookでローカルLLMを動かす方法は、大きく2つに分かれます。

ルートA: Linux開発環境（Crostini）＋Termux／Ollama／llama.cpp

llama.cppやOllamaでGGUF形式のモデルをコマンドラインから動かす方法です。モデル選択の自由度が高く、パラメータ調整も細かく行えます。一方、2コアのCeleron上でコンパイルする負荷や、ストレージ不足のリスクがあります。

ルートB: Google PlayのAndroidアプリ

ChromeOSはCrostini（Linux）とAndroidアプリを別レイヤーで同時に動かせます。Play Storeからアプリを入れるだけで始められるため、今回はこちらを先に試しました。

いずれのルートでも、小型の量子化モデル（1B〜3Bクラス）が前提です。Gemma 4 E2Bは実効パラメータ2.3Bで、スマホや低スペック端末向けに設計されたマルチモーダルモデルです（Google公式モデルカード）。

手順：LM PlaygroundでGemma 4 E2Bを動かす

1. Androidアプリをインストールする

LM Playgroundは、llama.cppをベースにしたオープンソースのAndroidアプリです。アプリ本体はモデル未込みで13MB未満と軽量で、GGUF形式のモデルを端末内で推論します（GitHubリポジトリ）。Chromebook向けには、画面幅840dp以上でセッションサイドバーが常時表示され、ウィンドウのリサイズにも対応しています。

Play StoreからLM Playgroundをインストールし、Androidアプリとして起動します。

2. 最初に試したLLM Hubはクラッシュした

別アプリのLLM HubでMinistral 3 3B InstructのGGUFをダウンロードし、チャット画面で読み込もうとしたところ、アプリがクラッシュしました。モデルが要求するRAMを端末が賄えないときに起きやすい挙動です。4GB RAMのChromebookでは、3Bクラスのモデル選びが最初の関門になります。

3. Gemma 4 E2Bに切り替える

LM Playgroundの内蔵カタログにはMinistral 3はありませんが、Gemma 4 E2Bが用意されています。検証者はスマホのPocketPalでも同モデルを使っており、モバイル向け小型モデルとして信頼していました。

読み込み時に「モデルが不安定になる可能性があります」という警告が出ました。必要RAMは約3.11GBと、4GB端末の限界に近い値です。それでもクラッシュせずにロードでき、チャットが開始できました。

4. 速度改善のための設定

生成速度を確保するため、次の設定が有効でした。

システムプロンプトで「短く答える」「思考過程を省略する」と指示する
思考モード（Thinking）をオフにする

実際の使い心地：動くが、遅い

「動く」こと自体は確認できました。ブレインストーミング、軽い調査、構造化された質問への回答は実用の範囲に入ります。回答は見出しや箇条書きを自発的に付けてくれるため、オフラインでメモを整理する用途には向いています。

速度が最大のボトルネックです。「strawberryにRはいくつ？」という定番の質問への応答は、約0.3トークン/秒でした。同じGemma 4 E2Bをスマホで動かすより明らかに遅く、実用の快適さとは言いにくい水準です。

遅さの理由はハードウェアと実行環境の組み合わせにあります。LM PlaygroundはARM向けにKleidiAIカーネルなどの最適化を備えていますが、今回のChromebookはx86チップでAndroidレイヤーを動かしています。Android-on-Linux-on-ChromeOSという多層構成のため、ARM専用の高速化は効きません。

Chromebookで使えない機能

LM Playgroundはスマホやタブレット向けに豊富な機能を持ちますが、Chromebookでは次の制限が出ました。

パラメータ調整が使えない

temperatureやmin-pなど、モデルごとの生成パラメータ画面が表示されません。細かい挙動のチューニングはできません。

ファイルアップロード非対応

テキスト入力とテキスト出力のみです。Gemma 4 E2Bは画像・音声入力に対応するマルチモーダルモデルですが、Chromebook上のLM Playgroundでは画像を渡せません。

一方で使えるツール機能

Web検索、Webページ取得、サンドボックス内JavaScript実行は、設定画面からモデルごとにオンにできます。MCPサーバーを別途立てなくても、リアルタイムの天気情報などを取得するテストに成功しています。ただし応答完了までの時間はさらに伸びます。

うまくいかないときの対処

症状	想定原因	対処
アプリがモデル読み込みでクラッシュ	RAM不足	より小さいモデル（1Bクラス）に変更する
応答が極端に遅い	CPU性能・x86での非最適化	短い回答を指示し、思考モードをオフにする
パラメータや画像入力が使えない	Chromebook上のAndroid制限	Termux＋llama.cppルートを試す
ストレージ不足	モデルファイルが数GB	不要なアプリやファイルを削除する

検証者は次のステップとして、Termux経由でllama.cppやOllamaを試す予定です。コンパイルの手間は増えますが、モデル選択の自由度とパラメータ制御が得られる可能性があります。

現実的な期待値

4GB RAM・内蔵GPUのみの旧型ChromebookでローカルLLMを動かすことは、技術的には可能です。LM PlaygroundとGemma 4 E2Bの組み合わせなら、オフラインでも文章の整理や軽い調査ができます。

日常使いの快適さを求めるなら、クラウドAIの方が圧倒的に速いです。ローカルLLMの価値は、通信が使えない緊急時や、データを端末外に出したくない場面に限定して考えるのが現実的です。速度は0.3トークン/秒程度と覚悟し、短い質問・短い回答に用途を絞ると、低スペック端末でも「動かない」ではなく「遅いが使える」ラインに乗せられます。