Repository logo
 

Polos: Multimodal Metric Learning from Human Feedback for Image Captioning

Loading...
Thumbnail Image

Date

2024-09-20

Journal Title

Journal ISSN

Volume Title

Publisher

慶應義塾大学理工学研究科

Abstract

Description

修士(工学), 2024, 開放環境科学専攻

Keywords

画像キャプション生成, 自動評価尺度, マルチモーダル基盤モデル, 大規模データセット, ハルシネーション, Image Captioning, Automatic Evaluation Metric, Multimodal Foundation Model, Large Dataset, Hallucination

Citation

Collections