为视觉语言多模态模型进行偏好优化

2025-01-10 分类：未分类阅读(16) 评论(0)

偏好优化已经在大语言模型中广泛使用了，但现在，它也可以用在视觉语言模型 (VLM) 上。得益于
TRL 的开发，现在我们可以
使用 TRL 对 VLM 进行直接偏好优化 (Direct Preference Optimization)。本文将会介绍使用 TRL 和 DPO 对视觉语言模型进行训练的全过程。

未经允许不得转载：小健博客 » 为视觉语言多模态模型进行偏好优化

大前端WP主题更专业更方便

联系我们联系我们

QQ咨询
QQ咨询
回顶
回顶部

相关推荐

大前端WP主题 更专业 更方便

QQ咨询

回顶部

大前端WP主题更专业更方便