会議の録音はクラウドに送りたくない。議事録と社内ドキュメントを横断検索したい。しかも無料で。Platypus Notesは、その3つを1つのデスクトップアプリで実現するオープンソースツールです。
この記事でわかること:
- Platypus Notesが解決する課題と主な機能
- Whisperによるローカル文字起こしの仕組み
- RAGチャットで過去のノートを検索する方法
- Granola・Otter.ai・NotebookLMとの違い
- インストール方法と初期設定
会議ツールが分散する問題をPlatypusが解決する
会議の文字起こし、ノート管理、ドキュメント検索。それぞれ別のツールを使い、データはバラバラのクラウドに散らばる。Platypus Notesはこの3機能を1つのアプリに統合し、すべてのデータをローカルに保持します。
Tauri + Rustで構築されたネイティブデスクトップアプリで、現在macOS版が公開されています。MITライセンスのオープンソースで、利用は完全に無料です。
Zoom・Teamsの通話を自動検出して文字起こし
Platypusは、ZoomやTeamsの通話開始を自動で検出します。仕組みはプロセス監視です。Zoomでは通話中にのみ起動するCptHostプロセスを、Teamsではaudio.mojom.AudioServiceサブプロセスのCPU使用率を監視しています。Zoom/TeamsのAPI連携は不要です。
文字起こしには2つのモードがあります。
デフォルトはローカルWhisperモードです。whisper.cppをRustバインディング(whisper-rs)経由で実行し、録音中にリアルタイムで文字起こしが進みます。macOSではMetal(GPU)で高速化されます。選択できるモデルは3種類で、Large v3(約3.1GB、最高品質)、Large v3 Turbo(約1.6GB)、Distil Large v3.5(約1.5GB、最速)です。初回使用時に自動ダウンロードされます。
もう1つはOpenAI APIモードです。録音後にWAVファイルをOpenAIのWhisperエンドポイントへ送信します。リアルタイム文字起こしはできませんが、古いPCでローカルモデルが遅い場合の代替手段になります。
ローカルモードではネットワーク通信が一切発生しないため、社外秘の会議でも安心して使えます。
ノートとドキュメントをプロジェクト単位で管理
エディタにはTipTapを採用しており、リッチテキストで議事録やメモを作成できます。PDF・DOCX・TXTファイルのインポートにも対応しているため、既存の社内資料をPlatypusに取り込んでプロジェクト単位でまとめられます。
AIによるノートの校正機能もあります。会議の文字起こしや下書きを、接続したLLMで整った文章に仕上げられます。
さらに、ノートや文字起こしから構造化された議事録、スライドデッキ、音声ポッドキャスト(ElevenLabs経由)を生成する機能も備えています。
過去のノートにRAGチャットで質問する
Platypusの特徴的な機能が、プロジェクト単位のRAG(Retrieval-Augmented Generation)チャットです。
ドキュメントを保存すると、テキストがチャンク分割されてベクトル化されます。ベクトルインデックスにはHNSW(hnswlib-rs)を使用しています。チャットで質問すると、関連するチャンクが検索され、LLMの回答に反映されます。
LLMはClaude、OpenAI、Gemini、Ollamaに対応しています。Ollamaを使えばLLMもローカルで動くため、ネットワーク接続なしで完結する構成が作れます。
Granola・Otter.ai・NotebookLMとの比較
既存の競合サービスと比べたPlatypusの立ち位置を整理します。
Granola(グラノーラ)は会議文字起こしとノートに強いデスクトップアプリですが、データはクラウドに保存され、LLMの選択はできません。無料プランには制限があります。
Otter.aiはクラウド型の文字起こしサービスで、精度は高いものの有料です。データのローカル保存やRAG機能はありません。
NotebookLMはGoogleのRAGツールで、ドキュメントへの質問は得意ですが、会議の文字起こし機能はなく、Webアプリのためネイティブデスクトップでは動きません。
Platypusはこれらの機能を1つにまとめ、データのローカル保持、LLMの自由な選択、オープンソース、無料という4点で差別化しています。
インストールと初期設定
macOS版は公式サイト(platypusnotes.com)またはGitHubリリースから.dmgファイルをダウンロードしてインストールします。
起動後、設定画面でLLMのAPIキーを入力します。Claude、OpenAI、Geminiのいずれか、またはローカルのOllamaを指定します。Ollamaを使う場合はAPIキー不要です。
文字起こしモードはデフォルトでローカルWhisperが選択されています。初回の録音開始時にモデル(Large v3)が自動でダウンロードされるため、追加の設定は不要です。軽量なモデルに切り替えたい場合は設定画面から変更できます。
ソースからビルドする場合は、Node 18以上、Rust、cmakeが必要です。npm install → npm run tauri devで開発サーバーが起動します。
まとめ
Platypus Notesは、会議文字起こし・ノート管理・RAGチャットを1つのローカルアプリに統合したOSSです。データを外部に送りたくない環境や、複数ツールの行き来を減らしたいチームに向いています。現時点ではmacOS版のみですが、Tauriベースのためクロスプラットフォーム展開も期待できます。