短い質問のはずなのに、いつの間にか上限に達する——そんな経験はありませんか。Claude Proに月20ドル払っていても、利用制限にぶつかることは珍しくありません。原因は入力文の長さだけではなく、同じスレッドに残った過去の会話です。
この記事では、Claude Counterで1週間トークン消費を追跡した実践談をもとに、上限を食いつぶす仕組みと具体的な節約術を整理します。
この記事でわかること
- Claudeの利用制限がトークン単位で動く理由
- 会話スレッドとProjectsが上限を押し上げる仕組み
- Claude Counterで消費量を可視化する方法
- トークンを無駄にしないチャットの切り方
Claudeの上限は「メッセージ数」ではなくトークン
Claudeの利用制限は、送受信したトークン(おおよそ単語1個分の文字塊)の合計で決まります。無料プランでは残量を確認するUsageタブがなく、Proでも「Account Settings → Usage」と開かないと見えません。会話の途中で上限に近づいているか判断しづらく、気づいたときには制限に達している——というパターンが起きやすいです。
Anthropicの技術ドキュメントでも、チャットでは会話が進むたびに過去のやり取りがコンテキストに蓄積し、各ターンで以前の内容が丸ごと保持されると説明されています。つまり1回目の質問は軽くても、同じスレッドが長くなるほど毎回の処理コストが膨らみます。
Claude Counterで「見えない消費」を可視化する
https://github.com/she-llac/claude-counter
MakeUseOfの検証記事では、執筆者がブラウザ拡張機能Claude Counterを使い、1週間のトークン消費を追跡しました(参考)。この拡張はチャット欄の横にセッション上限と週間上限のプログレスバーを表示し、無料プランでも使えます。
GitHubのREADMEによると、Claude CounterはClaudeのAPI応答を読み取り、5時間セッションと7日間の週次上限をリアルタイムで表示します。データはブラウザ内に留まり、外部サーバーへ送らない設計です。メッセージごとのトークン数表示は現時点で動作しない場合があるものの、上限の推移を追う用途には十分役立ちます。インストールは開発者モードでの読み込みが必要で、手順はやや長めです。
上限を食うのは「今の入力」より「過去の会話」
多くの人は、トークン消費=今打ったプロンプトの長さだと考えがちです。実際には、同じスレッド内の過去メッセージ全体が毎回読み込まれます。Claudeは文脈を保った回答を返すため、スレッドが進むほど1回あたりのコストが跳ね上がります。
検証記事の執筆者は、プレゼン資料の作成に約6,000トークン、続く短い質問に約30,000トークンかかったと報告しています。資料本文がスレッドに残ったまま次の質問を送ると、新しい入力は短くても過去の出力全体を再処理するためです。10往復目に同じ文を送ると、1往復目よりはるかに多くのトークンを消費します。
スレッドを切る判断基準
会話の文脈を失いたくない気持ちは自然です。ただ、無関係な話題を1本のスレッドに詰め込むと、毎回その履歴を背負って処理されます。
実践的な切り分けは次のとおりです。
- 新しいスレッドにする:話題が変わったとき、前の成果物の文脈が不要なとき(例:別の講義用スライドを作る)
- 同じスレッドを続ける:前の回答を踏まえた修正や、議論の流れが直結しているとき
検証記事の執筆者は、以前は1スレッドに固執していましたが、文脈が本当に必要かを毎回確認する習慣に変えたと述べています。毎回新規チャットにする必要はなく、文脈の要否で意図的に分けるのがポイントです。
Projectsの添付ファイルも毎回カウントされる
Claude Projectsは、ファイル・指示文・参照資料をプロジェクト単位で共有できる機能です。プロジェクト内のすべての会話で、そのベースライン情報が毎回コンテキストに入ります。便利な反面、短い質問でも添付資料分のトークンが毎回加算されます。
検証記事では、100ページのシラバスを管理用プロジェクトに入れたところ、無料プランの上限を数回のチャットで使い切った例が紹介されています。対策はシンプルで、プロジェクトの指示文とファイルを定期的に見直し、不要な資料を外すことです。常に参照が必要な資料だけを残せば、1回あたりの消費を抑えられます。
節約のための行動チェックリスト
上限対策の目的は、Claudeを使わないことではなく、意図のない消費を減らすことです。有料プランでも無駄なトークンはコストと待ち時間の両方に効きます。
- Claude Counterなどで残量をこまめに確認する
- 話題が変わったら新しいチャットを始める
- 大きな成果物を作ったあと、無関係な質問は別スレッドへ移す
- Projectsの添付ファイルと指示文を定期的に整理する
- 長い会話が必要なときだけスレッドを維持する
Claudeの上限は設計上の不具合ではなく、文脈を丸ごと保持する仕組みの帰結です。消費の正体を把握し、スレッドとProjectsの使い分けを意識すれば、同じプランでも扱える作業量は大きく変わります。