Polos: Multimodal Metric Learning from Human Feedback for Image Captioning
Loading...
Date
2024-09-20
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
慶應義塾大学理工学研究科
Abstract
Description
修士(工学), 2024, 開放環境科学専攻
Keywords
画像キャプション生成, 自動評価尺度, マルチモーダル基盤モデル, 大規模データセット, ハルシネーション, Image Captioning, Automatic Evaluation Metric, Multimodal Foundation Model, Large Dataset, Hallucination