llama.cpp | upppp

09

6月 2026

オープンソース

VS Code×ローカルLLMでCursorを置き換える手順

クラウド型AIエディタの無料枠は、本気の開発には足りなくなり…

08

6月 2026

AI活用事例

8GB VRAMで26B級ローカルAIエージェントを動かす

8GB VRAMのノートPCで、26Bパラメータ級のAIエー…

11

5月 2026

テクノロジー

llama.cppのMTP対応でQwen3.6の推論速度が2倍超に

ローカルLLMの推論速度がボトルネックになっていませんか。同…

04

5月 2026

AIモデル

IBM Granite 4.1　8BモデルでMoEを超える理由

8Bのモデルが32BのMoEアーキテクチャと同等の性能を出せ…

03

5月 2026

オープンソース

vllm-studio入門 4大推論エンジンを1画面で管理するOSS

ローカルLLMを本格運用し始めると、モデルの起動・停止、GP…

01

5月 2026

アプリ・サービス

CanIRun.aiで自分のPCに合うローカルLLMを一発判定する方法

ローカルLLMを試したいけど、自分のPCでどのモデルが動くの…

29

4月 2026

AIモデル

EmbeddingGemmaとllama.cppで始めるローカル埋め込み

有料の埋め込みAPIにコストをかけ続ける必要はありません。G…

28

4月 2026

オープンソース

Shimmy：Ollamaより142倍小さいRust製AI推論サーバー

ローカルでLLMを動かすツールとして長らく定番だったOlla…

26

4月 2026

AIモデル

RTX 3090で動くHermes特化モデルCarnice-V2-27b

ローカルLLMでエージェントを組むとき、汎用チャット向けのモ…

26

4月 2026

オープンソース

Raspberry Pi 5でローカルLLMを構築外出先からも使える

月額課金を払わずにLLMを使い続ける方法が、Raspberr…

#llama.cpp

VS Code×ローカルLLMでCursorを置き換える手順

8GB VRAMで26B級ローカルAIエージェントを動かす

llama.cppのMTP対応でQwen3.6の推論速度が2倍超に

IBM Granite 4.1 8BモデルでMoEを超える理由

vllm-studio入門 4大推論エンジンを1画面で管理するOSS

CanIRun.aiで自分のPCに合うローカルLLMを一発判定する方法

EmbeddingGemmaとllama.cppで始めるローカル埋め込み

Shimmy：Ollamaより142倍小さいRust製AI推論サーバー

RTX 3090で動くHermes特化モデルCarnice-V2-27b

Raspberry Pi 5でローカルLLMを構築 外出先からも使える

IBM Granite 4.1　8BモデルでMoEを超える理由

Raspberry Pi 5でローカルLLMを構築外出先からも使える