国产欧美日韩精品a在线观看-国产欧美日韩精品一区二区三区-国产欧美日韩精品综合-国产欧美中文字幕-一区二区三区精品国产-一区二区三区精品国产欧美

ACS880-07C
關注中國自動化產業發展的先行者!
隨著會計的發展,追蹤碳足跡
CAIAC 2025
2024
工業智能邊緣計算2024年會
2023年工業安全大會
OICT公益講堂
當前位置:首頁 >> 資訊 >> 行業資訊

資訊頻道

MM-RLHF:多模態大語言模型對齊新范式
  • 點擊數:106     發布時間:2025-02-28 13:45:52
  • 分享到:
當前,多模態大語言模型(MLLMs)在處理涉及視覺、語言和音頻的復雜任務中取得了顯著進展,但現有的先進模型仍然缺乏與人類意圖偏好的充分對齊,即無法高質量地按照人類偏好習慣理解并完成指令任務。現有的對齊研究多集中于某些特定領域(例如減少幻覺問題),而是否通過與人類偏好對齊可以全面提升多模態大語言模型的各種能力仍是一個未知數。
關鍵詞:

當前,多模態大語言模型(MLLMs)在處理涉及視覺、語言和音頻的復雜任務中取得了顯著進展,但現有的先進模型仍然缺乏與人類意圖偏好的充分對齊,即無法高質量地按照人類偏好習慣理解并完成指令任務。現有的對齊研究多集中于某些特定領域(例如減少幻覺問題),而是否通過與人類偏好對齊可以全面提升多模態大語言模型的各種能力仍是一個未知數。

為探究這一問題,中國科學院自動化研究所聯合快手、南京大學建立了MM-RLHF——一個包含12萬對精細標注的人類偏好比較數據集,并基于此數據集進行多項創新,從數據集,獎勵模型以及訓練算法三個層面入手推動多模態大語言模型對齊的發展,全面提升多模態大語言模型在視覺感知、推理、對話和可信度等多個維度的能力。

MM-RLHF數據集包含三個維度的打分、排序、文本描述的具體原因以及平局等標注。所有標注均由人類專家完成。與現有資源相比,該數據集在規模、多樣性、標注精細度和質量方面均有顯著提升。以此為基礎,本研究提出了一種基于批判的獎勵模型(Critique-Based Reward Model),該模型在評分之前先對模型輸出進行批判分析,相比傳統的標量獎勵機制,提供了更具可解釋性、信息量更豐富的反饋。此外,團隊提出動態獎勵縮放(Dynamic Reward Scaling)方法,根據獎勵信號調整每個樣本的損失權重,從而優化高質量比較數據在訓練中的使用,進一步提高了數據的使用效率。

MM-RLHF數據集

研究團隊在10個評估維度,27個基準測試上對提出的方案進行了嚴格評估。結果表明,模型性能得到了顯著且持續的提升。比較突出的是,基于提出的數據集和對齊算法對LLaVA-ov-7B模型進行微調后,其對話能力平均提升19.5%,安全性平均提升60%。

全面評估結果

本研究充分展示了高質量、細粒度數據集MM-RLHF在推動多模態大語言模型對齊工作上的巨大潛力。下一步,研究團隊將將重點利用數據集豐富的注釋粒度與先進的優化技術,結合高分辨率數據來解決特定基準的局限性,并使用半自動化策略高效地擴展數據集。這些努力不僅將推動多模態大語言模型對齊到新的高度,還將為更廣泛、更具普適性的多模態學習框架奠定基礎。

MM-RLHF數據集、訓練算法、模型以及評估pipeline均已全面開源。

項目主頁:https://mm-rlhf.github.io


來源:中國科學院自動化研究所


熱點新聞

推薦產品

x
  • 在線反饋
1.我有以下需求:



2.詳細的需求:
姓名:
單位:
電話:
郵件:
主站蜘蛛池模板: 国产免费人成在线看视频 | 久久88香港三级台湾三级中文 | 日本三级在线观看中文字 | 美女福利视频国产片 | 自拍偷拍亚洲视频 | 欧美老熟妇bbbb毛片 | 97在线观看完整免费 | 亚洲一级片在线播放 | 亚洲欧美日韩在线播放 | 久久精品欧美日韩精品 | 一区二区三区在线 | 欧 | 欧美一区二区三区高清视频 | 成人亲子乱子伦视频 | 免费一级大片 | 萝控精品福利视频一区 | 亚洲在线视频播放 | 国产成人ay手机在线观看 | 国产成人综合网在线播放 | 欧美特级一级毛片 | 国产欧美日韩精品在线 | 成年人在线观看免费 | 日韩中文字幕在线亚洲一区 | 黄a 大片a v 永久免费 | 久久w5ww成w人免费不卡 | 国产免费一级视频 | 精品极品三级久久久久 | 国产综合成人亚洲区 | 久久久久久毛片免费观看 | 亚洲视频在线免费播放 | 人久热欧美在线观看量量 | 欧美成人免费tv在线播放 | 91年精品国产福利线观看久久 | 免费一级淫片aaa片毛片a级 | 国产精品午夜性视频网站 | 亚洲精品天堂一区 | 成年人视频在线免费看 | 久久一本 | 久久久99精品免费观看精品 | 国内精品久久久久影院不卡 | 男女男精品视频网站在线观看 | 欧美成人看片一区二区三区 |