#llama.cpp

11 件の記事

09
6月 2026
オープンソース

VS Code×ローカルLLMでCursorを置き換える手順

クラウド型AIエディタの無料枠は、本気の開発には足りなくなり…

08
6月 2026
AI活用事例

8GB VRAMで26B級ローカルAIエージェントを動かす

8GB VRAMのノートPCで、26Bパラメータ級のAIエー…

11
5月 2026
テクノロジー

llama.cppのMTP対応でQwen3.6の推論速度が2倍超に

ローカルLLMの推論速度がボトルネックになっていませんか。同…

04
5月 2026
AIモデル

IBM Granite 4.1 8BモデルでMoEを超える理由

8Bのモデルが32BのMoEアーキテクチャと同等の性能を出せ…

03
5月 2026
オープンソース

vllm-studio入門 4大推論エンジンを1画面で管理するOSS

ローカルLLMを本格運用し始めると、モデルの起動・停止、GP…

01
5月 2026
アプリ・サービス

CanIRun.aiで自分のPCに合うローカルLLMを一発判定する方法

ローカルLLMを試したいけど、自分のPCでどのモデルが動くの…

29
4月 2026
AIモデル

EmbeddingGemmaとllama.cppで始めるローカル埋め込み

有料の埋め込みAPIにコストをかけ続ける必要はありません。G…

28
4月 2026
オープンソース

Shimmy:Ollamaより142倍小さいRust製AI推論サーバー

ローカルでLLMを動かすツールとして長らく定番だったOlla…

26
4月 2026
AIモデル

RTX 3090で動くHermes特化モデルCarnice-V2-27b

ローカルLLMでエージェントを組むとき、汎用チャット向けのモ…

26
4月 2026
オープンソース

Raspberry Pi 5でローカルLLMを構築 外出先からも使える

月額課金を払わずにLLMを使い続ける方法が、Raspberr…