AIエージェントやMCPサーバーを本番環境に導入する前に、その品質を客観的に確認したい。そう考えても、標準的な評価指標がなく手をこまねいている場面は多い。
Laureum(ローリアム)は、MCPサーバーとAIエージェントを6つの軸で採点し、W3C検証資格情報として信頼性を証明するサービスだ。この記事では、Laureumの仕組み・評価指標・料金を整理する。
この記事でわかること
- MCPサーバー評価に特化した6つの品質軸
- URLを貼るだけで動く4ステップの評価フロー
- GitHubのREADMEに埋め込める信頼バッジの使い方
- 無料プランと有料プランの違い
AIエージェントの品質を証明しにくい理由
AIエージェントやMCPサーバーが急速に普及する一方、「このエージェントは信頼できるのか」を外部から確認する手段はほとんど存在しない。テストカバレッジやユニットテスト結果を公開している開発者は少なく、導入側はREADMEの記述だけを頼りに選定せざるを得ない。
プラットフォーム側で品質基準を定めようとする動きはあるものの、MCPのような新しいプロトコルには統一された評価体系がまだ整っていない。
Laureumとは — MCPサーバーの品質検証サービス
Laureum(ローリアム)は、Assisterrが開発したMCPサーバーおよびAIエージェント向けの品質評価プラットフォームだ。「AIエージェントの品質を、支払いの前に検証する」をコンセプトに掲げ、URLを貼るだけで自動評価が走り、3分以内に結果が出る。
2026年4月時点で847件の評価を実施し、52エージェントが認定を取得している。
6つの評価軸
Laureumは以下の6軸でスコアを算出する。
- accuracy(正確性): ツールの返す結果が正しいか
- safety(安全性): 悪意あるプロンプトや不正な入力に対する耐性
- reliability(信頼性): 繰り返し実行したときの安定性
- process quality(処理品質): 実行手順とエラー処理の妥当性
- latency(レイテンシ): 応答速度の水準
- schema quality(スキーマ品質): ツール定義のMCP仕様への準拠度
複数のLLMが採点に参加するマルチジャッジ合議方式を採用しており、単一モデルによるバイアスを排除している。加えて、15種類のセキュリティプローブ(テスト入力)で adversarial evaluation(敵対的評価)を実施するため、実運用に近い条件でリスクを洗い出せる。
使い方 — 4ステップで完了
- Connect: MCPサーバーのURLを貼り付ける
- Discover: LaurumがサーバーのツールとCapabilityを自動マッピング
- Evaluate: 15種のセキュリティプローブ + 6軸品質スコアリングを実行
- Attest: 評価結果に基づくトラストバッジとW3C検証資格情報を発行
無料プランで最初の5回まで評価できる。初回は会員登録なしでも試せるため、まず自分のMCPサーバーがどの水準にあるかを確認するだけでも十分に使える。
READMEに埋め込めるトラストバッジ
Laureumが発行するトラストバッジは、GitHubのREADMEやドキュメントサイトに1行のMarkdownで埋め込める。評価スコアとレベル(Expert / Proficient / Basic)が表示されるため、利用者が第三者評価を一目で確認できるようになる。
バッジの裏側にはW3C Verifiable Credentialsを使った署名付き証明書が紐づく。改ざんできない仕組みのため、スコアの偽装はできない。
主要MCPサーバーの現状スコア
Laureumのリーダーボードには、評価済みのMCPサーバーが公開スコアとともに掲載されている。
| サーバー名 | レベル | スコア |
|---|---|---|
| Sequential Thinking | Expert | 92 |
| Brave Search | Proficient | 87 |
| GitHub MCP | Proficient | 81 |
| Filesystem Server | Basic | 74 |
| Memory Server | Basic | 68 |
Sequential Thinkingが唯一のExpertレベルで92点。標準的なユーティリティ系サーバーはProficient(80点台)に集まっており、ファイルシステム系やメモリ系はBasicに留まる傾向がある。
料金
| プラン | 月額 | 評価数 | バッジ | API |
|---|---|---|---|---|
| Free | $0 | 5回 | Basic | なし |
| Builder | $29 | 50回 | Premium | あり(ウェイトリスト) |
| Team | $99 | 500回 | Premium | あり(ウェイトリスト) |
| Enterprise | 要相談 | 無制限 | カスタム | あり |
BuilderとTeamプランは現在ウェイトリスト中で、申し込み順に招待が届く形式をとっている。無料プランでもリーダーボードへの掲載とBasicバッジの取得まで対応しているため、まず公開評価だけ通しておくという使い方も成立する。
MCPエコシステムの課題への答え
MCPサーバーが乱立するなか、品質を第三者が検証する仕組みはまだ整備途上にある。Laureumが示す6軸スコアと公開リーダーボードは、その整備に向けた実用的な出発点となる。
自作のMCPサーバーを公開する前に評価を通しておくと、READMEの信頼性が上がり、導入を検討するユーザーへの訴求力が高まる。BuilderとTeamプランは現在ウェイトリスト段階だが、無料枠だけでも評価・バッジ取得・ランキング掲載を一通り体験できる。