强化学期文档_强化学期模板_高质量强化学期文库,第1页-报告厅

微信扫一扫联系客服

微信扫描二维码

进入报告厅H5

关注报告厅公众号

报告厅

有用的资料都在这

开通VIP

登录

注册

107

RRHF：无需强化学习进行人类偏好对齐的训练语言模型方法
佛系万事屋
 # 强化学期 # RRHF # 大语言模型 2023-08-07 31页 2.37M
收藏

分享

5 积分