12/2/2024
2024/12/02
Know Your RAG: Dataset Taxonomy and Generation Strategies for Evaluating RAG Systems
- RAGシステムの評価のための質問-コンテキストペアの新しいタクソノミーと多様なデータセット生成戦略を提案する研究
- 特徴
- ラベルタクソノミーの特徴
- (コンテキスト, クエリ)ペアに基づくラベル付け
- エンタープライズシステムの特定ドメインに適応
- 検索性能の詳細な評価を可能にする
- データセット生成戦略
- マルチステップLLMクエリ
- 小規模LLMのファインチューニング
- 大規模LLMへの依存を削減
- ラベルタクソノミーの特徴
- 手法
- 質問-コンテキストペアの新しいタクソノミー
- エンタープライズRAGシステムの特定のクエリタイプを分類
- システムの狭い適用範囲に基づいたラベル付け手法
- 多様なQ&Aデータセット生成戦略
- プロンプトエンジニアリングと複数ステップのLLMクエリ
- 小規模LLMのファインチューニング
- 大規模LLMへの高コストなクエリを回避する手法
- 質問-コンテキストペアの新しいタクソノミー