ローカルLLMを試したいけど、自分のPCでどのモデルが動くのかわからない。VRAM不足でダウンロードが無駄になった経験はないでしょうか。CanIRun.aiは、ブラウザを開くだけでその疑問を解決するツールです。
この記事でわかること:
- CanIRun.aiが解決する「どのモデルが動くかわからない」問題
- ハードウェア自動検出とスコアリングの仕組み
- 量子化レベルごとのVRAM必要量の見方
- Compare機能やTier List機能の活用法
CanIRun.aiとは
CanIRun.aiは、ブラウザのAPIを使ってGPU・CPU・メモリを自動検出し、手持ちのPCでどのオープンウェイトLLMが動くかを判定するWebツールです。開発者はスペインのエンジニアmidudev氏。インストール不要、ユーザー登録不要で、ハードウェア情報がサーバーに送信されることもありません。すべての処理がブラウザ内で完結します。
ゲーマーにはおなじみの「Can You Run It」のAIモデル版と考えるとわかりやすいです。
ローカルLLMの「試す前に詰む」問題
ローカルLLMを動かすには、モデルのパラメータ数と量子化レベルに応じたVRAM(GPUメモリ)が必要です。たとえば70Bパラメータのモデルを4bit量子化(Q4_K_M)で動かすには約39GBのメモリが要ります。8GBのGPUでは到底足りません。
問題は、この計算を自分でやるのが面倒な点です。モデルごとにパラメータ数が違い、量子化のフォーマットも複数あり、Apple SiliconのユニファイドメモリとディスクリートGPUのVRAMでは使えるメモリ量の計算方法も異なります。結果として、数GBのモデルファイルをダウンロードしてから「動かない」と気づくケースが起きます。
CanIRun.aiは、この判断をサイトにアクセスするだけで自動化します。
ハードウェア検出の仕組み
CanIRun.aiは3つのブラウザAPIを組み合わせてハードウェアを特定します。
まずWebGLのWEBGL_debug_renderer_info拡張でGPUの名前とベンダーを取得します。次にWebGPU APIで追加のアーキテクチャ情報を読み取ります。最後にnavigator.hardwareConcurrencyとnavigator.deviceMemoryでCPUコア数とRAM容量を取得し、短いベンチマーク(約30ミリ秒)でシングルコア性能を推定します。
検出したGPU名は、NVIDIA・AMD・Intel約40種とApple Silicon約12チップを収録した内蔵データベースと照合されます。各エントリにはVRAM容量とメモリ帯域幅(GB/s)が登録されており、この2つの数値がスコアリングの基礎になります。
スコアリングとグレード
各モデルには0〜100のスコアが付き、S〜Fの6段階でグレード表示されます。スコアは3つの要素で構成されます。
推論速度が全体の55%を占めます。メモリ帯域幅をモデルのVRAM使用量で割り、効率係数(ディスクリートGPU: 0.70、Apple Silicon: 0.65)を掛けてtok/s(1秒あたりの生成トークン数)を推定します。60tok/s以上なら快適、5tok/s未満は実用的ではありません。
メモリ余裕が35%を占めます。モデルがVRAMの何%を使うかで評価し、30%以下なら余裕あり、85%超は厳しいと判定します。残りの約10%はモデルの品質ボーナスです。パラメータ数が大きいほど出力品質が高い傾向があるため、小さな加点が入ります。
グレードの対応は次のとおりです。85〜100点が「Runs great(快適に動作)」、70〜84点が「Runs well(良好)」、55〜69点が「Decent(実用的)」、40〜54点が「Tight fit(ギリギリ)」、20〜39点が「Barely runs(かろうじて動作)」、0〜19点が「Too heavy(動作不可)」です。
量子化レベルの選び方
CanIRun.aiでは各モデルについてQ2_K・Q3_K_M・Q4_K_M・Q5_K_M・Q6_K・Q8_0・F16の7段階の量子化が表示されます。量子化とは、モデルの重みの精度を下げてファイルサイズとVRAM使用量を減らす技術です。
7Bモデルを例にすると、F16(16bit、元の精度)で約13GB、Q4_K_M(4bit)で約3.9GB、Q2_K(2bit)で約2.5GBになります。Q4_K_Mは元の品質の約88%を保ちながらサイズを大幅に削減でき、多くのユーザーにとって最もバランスが良い選択肢です。Q2_Kは品質が約60%まで落ちるため、よほどメモリが限られている場合以外は避けたほうがよいでしょう。
自分のGPUのVRAMに収まる最も高品質な量子化レベルを選ぶのが基本戦略です。CanIRun.aiではグレード表示で一目で判断できます。
Compare機能とTier List
CanIRun.aiにはCompare機能があり、2つのGPU構成を並べて全モデルの対応状況を比較できます。GPU購入を検討中の人や、デスクトップとノートPCのどちらでLLMを動かすか迷っている人に便利です。
Tier List機能では、モデルをグレード別に一覧表示できます。自分のハードウェアで快適に動くモデルだけをフィルタリングして、用途(Chat・Code・Reasoning・Vision)やプロバイダー(Meta・Google・Alibaba・Mistral AIなど)で絞り込めます。
Apple Siliconユーザーへの対応
Apple SiliconのMacはCPUとGPUがメモリを共有するユニファイドメモリアーキテクチャを採用しています。CanIRun.aiはこの特性を考慮し、総メモリの75%を使用可能領域として計算します。
たとえばM4 Max搭載のMacBook Pro(36GB)なら約27GBまでのモデルを読み込めます。メモリ帯域幅は546GB/sで、RTX 4070(504GB/s)を上回ります。一方、M4無印(16GB、120GB/s)では利用可能なモデルが限られます。CanIRun.aiはこうしたチップごとの違いを内蔵データベースで正確に反映します。
類似ツールとの違い
同じ目的のツールとしてCan I Use LLM(caniusellm.com)やllm-checker(CLIツール)があります。Can I Use LLMも同様にハードウェアとモデルの互換性を判定しますが、CanIRun.aiはWebGPU APIによる自動検出、量子化レベルごとの詳細なグレード表示、Compare機能による構成比較など、ブラウザだけで完結する手軽さと情報量の両立で差別化しています。
まとめ
CanIRun.aiは、ローカルLLMを始める前の最初の一歩として使えるツールです。ブラウザでアクセスするだけでハードウェアを検出し、動かせるモデルと推定速度を即座に表示します。大きなモデルファイルをダウンロードする前に、まずこのサイトで自分のPCの実力を確認してみてください。
