11/5/2024

2024/11/05

今日の論文ピックアップ

LLM4PR: Improving Post-Ranking in Search Engine with Large Language Models
- 大規模言語モデル(LLM)を活用して検索エンジンのポストランキング段階を最適化するフレームワーク
Little Giants: Synthesizing High-Quality Embedding Data at Scale
- 小規模な言語モデル(8B)を用いて、高品質な埋め込みデータを低コストで大規模に合成するフレームワークSPEEDを提案
- Junior Generator: GPT-4から知識を蒸留し、基本的な合成データ生成能力を獲得
- Preference Optimization: GPT-4による評価信号を用いてモデルを最適化
- Data Revisor: 合成データを自己改善する仕組み