Reinforcement learning is a learning paradigm concerned with learning to control a system so as to maximize a numerical performance measure that expresses a long-term objective.What distinguishes reinforcement learning from supervised learning is that only partial feedback is given to the learner about the learner's predictions. Further, the predictions may have long term effects through influencing the future state of the controlled system. Thus, time plays a special role.
强化学习是一种学习范式,涉及学习如何控制系统,以最大限度地提高表示长期目标的数值性能指标。强化学习与监督学习的区别在于,仅向学习者提供关于学习者预测的部分反馈。此外,预测可能通过影响受控系统的未来状态而产生长期影响。因此,时间扮演着特殊的角色。
相关文库
斯坦福新书《决策算法》Algorithms for Decision Making
3032
类型:电子书
上传时间:2021-02
标签:算法、斯坦福、代码编程)
语言:英文
金额:5积分
《接近(几乎)任何机器学习问题》Approaching (Almost) Any Machine Learning Problem
2664
类型:电子书
上传时间:2021-05
标签:算法、机器学习、智能化)
语言:英文
金额:5积分
《面向初学者的机器学习》Machine Learning For Absolute Beginners
1196
类型:电子书
上传时间:2021-05
标签:机器学习、计算机、算法)
语言:英文
金额:5积分
GPU深度学习基础介绍
1103
类型:学习教育
上传时间:2021-08
标签:深度学习、GPU、算法)
语言:英文
金额:5积分
欧洲E级超算架构及量子计算研究进展
911
类型:经管职场
上传时间:2021-01
标签:欧洲E级、量子计算、算法)
语言:英文
金额:5积分
电子书-面板数据计量经济学(计量经济学高级教材)(英)
859
类型:电子书
上传时间:2021-09
标签:计算机、算法、计量经济学)
语言:英文
金额:5积分
电子书-Python基础:数据结构(英)
779
类型:电子书
上传时间:2021-09
标签:计算机、算法、PYTHON)
语言:英文
金额:5积分
电子书-掌握Python科学计算(英)
703
类型:电子书
上传时间:2021-10
标签:计算机、算法、Python)
语言:英文
金额:5积分
电子书-编码理论、算法、架构和应用(英)
693
类型:电子书
上传时间:2021-06
标签:编码、算法、架构)
语言:英文
金额:5积分
电子书-数据仓库ETL工具包:提取、清理、整合和交付数据的实用技术(英)
623
类型:电子书
上传时间:2021-09
标签:计算机 、算法、数据仓库)
语言:英文
金额:5积分
积分充值
30积分
6.00元
90积分
18.00元
150+8积分
30.00元
340+20积分
68.00元
640+50积分
128.00元
990+70积分
198.00元
1640+140积分
328.00元
微信支付
余额支付
积分充值
应付金额:
0 元
请登录,再发表你的看法
登录/注册