停電で通信も切れたとき、クラウドAIは使えません。低スペックのChromebookでもオフラインで文章を整理したい——そんな場面を想定し、実際にローカルLLMを動かした検証レポートを手順として整理しました。
この記事でわかること
- 4GB RAM・32GBストレージの旧型Chromebookで動かす現実的なルート
- LM Playgroundを使った導入手順とモデル選び
- 実測の生成速度と、Chromebook特有の制約
- Termux経由の代替ルートが残る理由
https://play.google.com/store/apps/details?id=com.druk.lmplayground
なぜChromebookでローカルLLMを試すのか
Chromebookはブラウザ作業向けに設計された軽量端末です。クラウドのClaudeやChatGPT、Geminiは通常の回線ならブラウザで問題なく使えます。ローカルLLMの価値が出るのは、停電で基地局まで落ち、モバイル回線も使えないときです。メモの整理や情報の要約を、端末内だけで完結させたい場面に向きます。
検証に使ったのは約4〜5年前のAcer製Chromebookです。RAM 4GB、32GB SSDのうち空きは約5GB。GPUはIntel UHD 600の内蔵グラフィックスで、システムメモリを共有します。パッシブ冷却のCeleron 2コアという、ローカルLLMには最悪に近い構成です。
前提条件と2つの導入ルート
ChromebookでローカルLLMを動かす方法は、大きく2つに分かれます。
ルートA: Linux開発環境(Crostini)+Termux/Ollama/llama.cpp
llama.cppやOllamaでGGUF形式のモデルをコマンドラインから動かす方法です。モデル選択の自由度が高く、パラメータ調整も細かく行えます。一方、2コアのCeleron上でコンパイルする負荷や、ストレージ不足のリスクがあります。
ルートB: Google PlayのAndroidアプリ
ChromeOSはCrostini(Linux)とAndroidアプリを別レイヤーで同時に動かせます。Play Storeからアプリを入れるだけで始められるため、今回はこちらを先に試しました。
いずれのルートでも、小型の量子化モデル(1B〜3Bクラス)が前提です。Gemma 4 E2Bは実効パラメータ2.3Bで、スマホや低スペック端末向けに設計されたマルチモーダルモデルです(Google公式モデルカード)。
手順:LM PlaygroundでGemma 4 E2Bを動かす
1. Androidアプリをインストールする
LM Playgroundは、llama.cppをベースにしたオープンソースのAndroidアプリです。アプリ本体はモデル未込みで13MB未満と軽量で、GGUF形式のモデルを端末内で推論します(GitHubリポジトリ)。Chromebook向けには、画面幅840dp以上でセッションサイドバーが常時表示され、ウィンドウのリサイズにも対応しています。
Play StoreからLM Playgroundをインストールし、Androidアプリとして起動します。
2. 最初に試したLLM Hubはクラッシュした
別アプリのLLM HubでMinistral 3 3B InstructのGGUFをダウンロードし、チャット画面で読み込もうとしたところ、アプリがクラッシュしました。モデルが要求するRAMを端末が賄えないときに起きやすい挙動です。4GB RAMのChromebookでは、3Bクラスのモデル選びが最初の関門になります。
3. Gemma 4 E2Bに切り替える
LM Playgroundの内蔵カタログにはMinistral 3はありませんが、Gemma 4 E2Bが用意されています。検証者はスマホのPocketPalでも同モデルを使っており、モバイル向け小型モデルとして信頼していました。
読み込み時に「モデルが不安定になる可能性があります」という警告が出ました。必要RAMは約3.11GBと、4GB端末の限界に近い値です。それでもクラッシュせずにロードでき、チャットが開始できました。
4. 速度改善のための設定
生成速度を確保するため、次の設定が有効でした。
- システムプロンプトで「短く答える」「思考過程を省略する」と指示する
- 思考モード(Thinking)をオフにする
実際の使い心地:動くが、遅い
「動く」こと自体は確認できました。ブレインストーミング、軽い調査、構造化された質問への回答は実用の範囲に入ります。回答は見出しや箇条書きを自発的に付けてくれるため、オフラインでメモを整理する用途には向いています。
速度が最大のボトルネックです。「strawberryにRはいくつ?」という定番の質問への応答は、約0.3トークン/秒でした。同じGemma 4 E2Bをスマホで動かすより明らかに遅く、実用の快適さとは言いにくい水準です。
遅さの理由はハードウェアと実行環境の組み合わせにあります。LM PlaygroundはARM向けにKleidiAIカーネルなどの最適化を備えていますが、今回のChromebookはx86チップでAndroidレイヤーを動かしています。Android-on-Linux-on-ChromeOSという多層構成のため、ARM専用の高速化は効きません。
Chromebookで使えない機能
LM Playgroundはスマホやタブレット向けに豊富な機能を持ちますが、Chromebookでは次の制限が出ました。
パラメータ調整が使えない
temperatureやmin-pなど、モデルごとの生成パラメータ画面が表示されません。細かい挙動のチューニングはできません。
ファイルアップロード非対応
テキスト入力とテキスト出力のみです。Gemma 4 E2Bは画像・音声入力に対応するマルチモーダルモデルですが、Chromebook上のLM Playgroundでは画像を渡せません。
一方で使えるツール機能
Web検索、Webページ取得、サンドボックス内JavaScript実行は、設定画面からモデルごとにオンにできます。MCPサーバーを別途立てなくても、リアルタイムの天気情報などを取得するテストに成功しています。ただし応答完了までの時間はさらに伸びます。
うまくいかないときの対処
| 症状 | 想定原因 | 対処 |
|---|---|---|
| アプリがモデル読み込みでクラッシュ | RAM不足 | より小さいモデル(1Bクラス)に変更する |
| 応答が極端に遅い | CPU性能・x86での非最適化 | 短い回答を指示し、思考モードをオフにする |
| パラメータや画像入力が使えない | Chromebook上のAndroid制限 | Termux+llama.cppルートを試す |
| ストレージ不足 | モデルファイルが数GB | 不要なアプリやファイルを削除する |
検証者は次のステップとして、Termux経由でllama.cppやOllamaを試す予定です。コンパイルの手間は増えますが、モデル選択の自由度とパラメータ制御が得られる可能性があります。
現実的な期待値
4GB RAM・内蔵GPUのみの旧型ChromebookでローカルLLMを動かすことは、技術的には可能です。LM PlaygroundとGemma 4 E2Bの組み合わせなら、オフラインでも文章の整理や軽い調査ができます。
日常使いの快適さを求めるなら、クラウドAIの方が圧倒的に速いです。ローカルLLMの価値は、通信が使えない緊急時や、データを端末外に出したくない場面に限定して考えるのが現実的です。速度は0.3トークン/秒程度と覚悟し、短い質問・短い回答に用途を絞ると、低スペック端末でも「動かない」ではなく「遅いが使える」ラインに乗せられます。