プロジェクト

全般

プロフィール

バグ #248

未完了

RAGパイプライン設計と実装

Redmine Admin さんが3日前に追加.

ステータス:
新規
優先度:
高め
担当者:
-
開始日:
2025-06-04
期日:
進捗率:

0%

予定工数:

説明

作業内容

RAG (Retrieval Augmented Generation) パイプラインを設計・実装し、ベクトル検索結果を基にした LLM 応答生成機能を構築します。

詳細タスク

  1. RAG コアサービスの実装

    • /api/services/rag/index.js - メインモジュール
    • /api/services/rag/retriever.js - 検索機能
    • /api/services/rag/generator.js - 応答生成機能
    • /api/services/rag/context.js - コンテキスト管理
  2. ベクトル検索機能の実装

    • セマンティック検索(ベクトル類似度)
    • ハイブリッド検索(キーワード + ベクトル)
    • メタデータフィルタリング
    • 結果ランキング最適化
  3. コンテキスト構築機能の実装

    • 検索結果のコンテキスト組み立て
    • トークン制限内での最適化
    • 関連チャンク結合
    • 重要情報優先
  4. プロンプト生成と応答管理の実装

    • 検索結果を含むプロンプト構築
    • 複数ターン対応
    • ソース追跡・引用機能
    • フォールバック戦略
  5. パフォーマンス最適化

    • キャッシュ機構
    • 並列処理
    • バッチ処理
    • 先読み最適化

技術的指示

  • 高精度と低レイテンシのバランスを考慮した設計
  • ベクトル検索は pgvector の最適化機能を活用
  • コンテキストサイズは各 LLM の制限に応じて動的に調整
  • 関連性スコアを用いた検索結果の適切なランキング
  • デバッグ・分析用のログ機能を充実させる
  • 単体テストでエッジケースを検証

成果物

  • RAG コアサービス
  • ベクトル検索機能
  • コンテキスト構築機能
  • プロンプト生成・応答管理機能
  • パフォーマンス最適化モジュール
  • テスト・評価スクリプト

参考リソース

  • RAG システムアーキテクチャベストプラクティス
  • ベクトル検索最適化テクニック
  • LLM コンテキスト管理戦略
  • Node.js パフォーマンス最適化ガイド

表示するデータがありません

他の形式にエクスポート: Atom PDF