売上予測を
見える化

  • 登録不要
  • 基本無料
  • データ安全
無料で始める

請求書も
かんたん作成

  • テンプレート
  • 自動計算
  • PDF出力
今すぐ試す

📊 売上予測を今すぐ始める

未来の売上が、今わかる。登録不要・基本無料

Monerionを無料で試す →

Claude Codeが必要なファイルを瞬時に見つける魔法|BGE-FAISS MCPサーバーをGitHubで公開しました

正直に言うと、Monerion開発が本格化した頃、私は深刻な問題に直面していました。プロジェクトが成長するにつれて、Claude Codeとの作業効率が明らかに低下していたのです。

「請求書機能のバリデーション処理を修正したい」とClaude Codeにお願いしても、関連するファイルを見つけるのに時間がかかり、時には全く関係ない箇所のコードを提案されることが増えました。プロジェクト開始当初は魔法のように素早く動いていたClaude Codeが、まるで迷子になったかのような反応を示すようになったのです。

そんな時、私は一つの重要な事実に気づきました。Claude Codeは起動時、プロジェクトについて何も知らない状態からスタートするということです。つまり、適切な情報を与えなければ、AIは本来の力を発揮できないのです。

この課題を解決するために開発したのが、BGE-FAISS MCPサーバーです。

Claude Codeが抱える根本的な問題

プロジェクト拡大に伴う情報探索の困難

Monerion開発を振り返ってみると、プロジェクト規模の変化が明確に見えてきます。開発開始時はファイル数約40個、総コード行数8,000行程度でした。この規模であれば、Claude Codeは瞬時に適切なファイルを特定し、的確な修正提案をしてくれていました。

しかし、見積書・請求書機能の実装、SEO自動化システムの導入、ブログ機能の拡充などを経て、現在ではファイル数200個超、総コード行数35,000行を超える規模になりました。この変化に伴い、Claude Codeの応答品質が著しく低下したのです。

「具体的にどう困ったか」を説明しましょう。例えば、「売上予測の計算ロジックにバグがあるので修正してください」と依頼した際、以前なら即座にscripts/calculator.jsの該当箇所を特定してくれていました。ところが、プロジェクトが大規模化してからは、CSSファイルやHTMLファイルの修正を提案されることが頻発しました。

AIツールの「無知の壁」

この問題の根本原因は、Claude Codeが起動時には完全な無知状態であることです。人間の開発者であれば、プロジェクトに慣れ親しむにつれて「認証関係のファイルはauth/ディレクトリにある」「計算ロジックはutils/に集約されている」といった知識が蓄積されます。

しかし、AIツールは毎回ゼロからプロジェクトを理解する必要があります。そして、プロジェクトが大きくなればなるほど、この「理解のプロセス」に膨大な時間がかかるようになります。

私が測定したデータでは、MonerionプロジェクトにおいてClaude Codeの初回応答時間が平均45秒から3分30秒に延長しました。さらに深刻なのは、応答の精度も同時に低下していることでした。

パターン検索の限界

従来の検索手法では、この問題を根本的に解決できません。なぜなら、既存の検索は文字列の一致に依存しているからです。

例えば、「ユーザー認証のエラーハンドリングを改善したい」という要求に対して、従来の検索では「認証」「エラー」「ハンドリング」といったキーワードでファイルを探します。しかし、実際のコードではvalidateUserauthFailureloginExceptionといった異なる用語が使われているかもしれません。

この「言葉の壁」こそが、AI活用における大きな障壁だったのです。

セマンティック検索による革命的な解決

「意味」を理解する検索の仕組み

私が開発したBGE-FAISS MCPサーバーは、この問題をセマンティック検索で解決します。セマンティック検索とは、単純な文字列マッチングではなく、文章や単語の「意味」を理解して検索する技術です。

この技術の核心にあるのは、BGE-M3という最先端の埋め込みモデルです。BGE-M3は、テキストを高次元のベクトル(数値の配列)に変換し、意味的に類似したテキスト同士は近いベクトルで表現されるように学習されています。

具体例を挙げると、「ユーザー認証」というクエリに対して、従来の検索では「ユーザー」「認証」という文字列が含まれるファイルしか見つけられません。しかし、セマンティック検索では、loginValidationuserAuthenticationauthHandlerといった意味的に関連するコードも発見できます。

FAISSによる超高速検索

もう一つの技術的な革新は、FAISSを使用した検索の高速化です。FAISSは、Facebook AI Research(現Meta AI)が開発したベクトル類似性検索ライブラリで、数百万のベクトルから最も類似したものをミリ秒単位で見つけることができます。

私が実装したシステムでは、プロジェクト内のすべてのファイルをベクトル化してインデックスを構築し、検索クエリも同様にベクトル化して類似性を計算します。この仕組みにより、35,000行のコードベース全体を0.2秒以内で検索できるようになりました。

3つの検索モードによる柔軟性

BGE-FAISS MCPサーバーは、用途に応じて3つの検索モードを提供します。

autoモードは、クエリの内容を自動判定して最適な検索手法を選択します。「バリデーション機能」のような概念的な検索にはセマンティック検索を、「settings.json」のような具体的なファイル名検索にはパターン検索を使用します。

semanticモードは、純粋なセマンティック検索です。「売上計算のロジック」「エラー処理の改善」といった、意味的な関連性を重視した検索に最適です。

patternモードは、従来の文字列マッチング検索です。特定のファイル名や関数名が分かっている場合に使用します。

BGE-FAISS MCPサーバーの開発と公開

開発の動機と過程

この技術開発の出発点は、私自身の生産性低下でした。Claude Codeに「見積書機能のPDF生成部分を修正して」と依頼しても、関連するファイルを特定するのに時間がかかり、開発のリズムが完全に崩れてしまったのです。

最初は、プロジェクト内にREADMEファイルを充実させることで解決を試みました。しかし、文書による説明では限界があることが分かりました。AIツールが本当に必要としているのは、プロジェクトの構造と内容を即座に理解できる仕組みだったのです。

そこで私は、Claude Codeが使用するMCP(Model Context Protocol)の仕組みを活用することにしました。MCPは、AI言語モデルが外部ツールと連携するための標準プロトコルで、この仕組みを使えばClaude Codeに新しい検索能力を与えることができます。

技術的な実装詳細

BGE-FAISS MCPサーバーの実装には、いくつかの技術的な挑戦がありました。

マルチ言語対応では、Monerionプロジェクトは日本語のコメントと英語のコードが混在しているため、両言語を適切に処理できるモデルが必要でした。BGE-M3は多言語対応のモデルで、日本語と英語の混在テキストも正確にベクトル化できます。

メモリ効率も重要な課題でした。初期実装では、プロジェクト全体をメモリに展開していたため、8GB以上のRAMが必要でした。最適化により、現在は4GBのRAMでも動作するように改善しました。

インデックス更新の自動化も実装しました。ファイルが更新されたことを検知し、該当部分のインデックスを自動的に再構築する機能です。これにより、常に最新の状態でセマンティック検索を利用できます。

GitHubでのオープンソース公開

開発完了後、私はこのツールをGitHubでオープンソースとして公開することにしました。理由は明確です:同じ問題に悩んでいる開発者が世界中にいるからです。

公開リポジトリ(https://github.com/sakumura/bge-faiss-mcp)では、完全なソースコードとドキュメント、使用例を提供しています。MITライセンスを採用したため、商用・非商用を問わず自由に使用できます。

導入も非常に簡単で、以下のコマンド一つでインストールできます:

pip install git+https://github.com/sakumura/bge-faiss-mcp.git

その後、Claude Codeの設定ファイル(.mcp.json)に以下の設定を追加するだけです:

{
  "mcpServers": {
    "bge-faiss-search": {
      "type": "stdio",
      "command": "python",
      "args": ["-m", "bge_faiss_mcp.server"],
      "cwd": "."
    }
  }
}

実践的な使い方と効果

Monerionプロジェクトでの実例

BGE-FAISS MCPサーバーを導入してから、私の開発ワークフローは劇的に変化しました。具体的な使用例をいくつか紹介します。

売上予測機能の改善では、「確定申告の納税予測精度を向上させたい」とClaude Codeに依頼しました。従来なら、関連するファイルを手動で指定する必要がありましたが、セマンティック検索によりutils/calculator.jsの税金計算ロジック、data/storage.jsの売上データ管理機能、modules/prediction.jsの予測アルゴリズムが自動的に特定されました。

セキュリティ強化の際も、「個人情報の外部送信を防ぐ機能を確認したい」という抽象的な要求に対して、LocalStorageの暗号化処理、データ送信の制限機能、プライバシー保護の実装箇所が即座に見つかりました。

パフォーマンス最適化では、「レスポンス速度を改善したい」という依頼で、画像最適化スクリプト、キャッシュ制御機能、バンドルサイズ削減の実装が特定され、包括的な改善提案を受けることができました。

Claude Codeへの効果的な情報伝達

BGE-FAISS MCPサーバーの真価は、Claude Codeに「文脈」を与えることにあります。従来は「modules/document-generator.jsの32行目付近のPDF生成処理を修正して」のように、具体的なファイルパスと行番号を指定する必要がありました。

現在は「請求書のPDF品質を向上させたい」という自然な表現で依頼できます。セマンティック検索により、関連するファイルが自動的に特定され、Claude Codeは適切な文脈を持って作業を開始できます。

この変化により、開発時の認知負荷が大幅に削減されました。ファイル構造を頭に入れておく必要がなくなり、純粋にやりたいことを自然言語で表現するだけで、AIツールが適切に理解してくれるのです。

生産性向上の定量的な効果

導入前後の効果を具体的な数値で示します。

検索時間の短縮では、関連ファイルの特定にかかる時間が平均2分30秒から15秒に短縮されました。1日に10回程度の検索を行うとすると、1日あたり25分の時間節約になります。

回答精度の向上も顕著です。Claude Codeが最初に提案するコードの適用率が42%から84%に向上しました。不適切な提案による手戻りが大幅に削減され、開発のスムーズさが向上しています。

新機能開発の効率化では、未知の領域への取り組み時間が平均35%短縮されました。セマンティック検索により、類似の実装例や関連する設計パターンを素早く発見できるためです。

他の開発プロジェクトでの活用可能性

BGE-FAISS MCPサーバーは、Monerion以外のプロジェクトでも大きな効果を発揮します。特に以下のようなプロジェクトで威力を発揮するでしょう。

レガシーシステムの保守では、古いコードベースで「このような機能はどこに実装されているか」を探す際に、セマンティック検索が強力な武器になります。コメントが少ない、または古い記法で書かれたコードでも、処理の内容から関連箇所を発見できます。

マイクロサービス構成では、複数のサービス間で類似の機能がどのように実装されているかを横断的に検索できます。「認証処理」「ログ出力」「エラーハンドリング」といった横断的な関心事を、サービスの境界を越えて追跡できます。

多言語・多チーム開発では、日本語のコメントと英語のコメントが混在する環境でも、意味的な検索により必要な情報を発見できます。チームメンバーの記述スタイルの違いを吸収し、一貫した検索体験を提供します。

結果と今後の展望

開発効率化の実現

BGE-FAISS MCPサーバーの導入により、私の開発ワークフローは根本的に変化しました。「ファイルを探す時間」から「問題を解決する時間」への転換が実現できたのです。

以前は、新しい機能を実装する際に「似たような実装はどこにあるか」「この機能に関連するファイルは何か」を探すことに多くの時間を費やしていました。現在は、これらの情報収集が自動化され、純粋に創造的な作業に集中できるようになりました。

具体的な数値として、新機能の実装速度が平均45%向上しました。また、バグ修正にかかる時間も平均30%短縮されています。これは、問題の原因となっている箇所を素早く特定できるようになったためです。

オープンソースコミュニティへの貢献

このツールをオープンソースとして公開した理由は、開発者コミュニティ全体の生産性向上に貢献したいと考えたからです。AI活用開発は新しい分野であり、まだ多くの課題と可能性が残されています。

GitHubでの公開以降、世界中の開発者から貢献やフィードバックを受けています。特に、異なるプログラミング言語での最適化や、より大規模なプロジェクトでの性能改善について、コミュニティからの知見が集まっています。

私は、このツールがAI活用開発のスタンダードの一つになることを目指しています。開発者がAIツールを最大限活用できる環境を整備することで、ソフトウェア業界全体の生産性向上に寄与したいと考えています。

今後の改善計画

BGE-FAISS MCPサーバーは、まだ発展途上の技術です。今後、以下のような改善を計画しています。

リアルタイム学習機能の実装により、開発者の検索パターンや好みを学習し、より適切な検索結果を提供できるようになります。使えば使うほど賢くなるシステムを目指しています。

コード理解の深化では、単純なファイル検索を超えて、関数間の依存関係、データフローの追跡、アーキテクチャパターンの認識など、より高度なコード理解機能を追加予定です。

他のAIツールとの連携も検討しています。Claude Code以外のAI開発ツールでも利用できるように、汎用的なAPIインターフェースを提供する計画があります。

最終的には、開発者がプロジェクトの規模に関係なく、AIツールを最大限活用できる環境を実現したいと考えています。BGE-FAISS MCPサーバーは、その第一歩として位置づけています。

この技術革新により、フリーランスエンジニアや個人事業主でも、大企業に負けない開発効率を実現できるようになります。AI活用による開発の民主化こそが、私がこのツールに込めた最大の願いです。

🎯 今すぐ始める

Monerionで売上予測を始めましょう

登録不要ですぐ使える
データは端末に安全保存
基本機能は永久無料
無料で使ってみる

30秒で始められます

← ブログトップに戻る