本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
书名: | 强化学习(微课版) |
出版社: | 清华大学出版社 |
出版日期 | 2021 |
ISBN号: | 9787302587941 |
本书构建了一个完整的强化学习入门路径,深入浅出地介绍了强化学习算法的基本原理和实现方法。本书 首先回顾了相关预备知识,包括数学基础和机器学习基础,然后先介绍强化学习的基本概念,给出强化学习的 数学框架(马尔可夫决策过程),随后介绍强化学习的求解算法,包括表格求解法(动态规划法、蒙特卡洛法 和时序差分法),以及近似求解法(值函数近似法、策略梯度法和深度强化学习)。本书后一部分为实践与前 沿,实践部分基于一个相同的例子实现了强化学习领域的主流基础算法,前沿部分介绍了强化学习领域的新 研究进展。本书配有相当数量的习题供练习,配套代码基于 Python 实现,源代码均已开源,可开放获取。
本书可作为理工科本科生、研究生的“强化学习”课程的教材,也可作为相关从业者掌握强化学习的入门
参考书。
袁莎,清华大学计算机系博士后,合作导师为唐杰教授,主持一项国家自然科学基金青年基金项目和一项博士后科学基金面上项目。唐杰 IEEE Fellow,清华大学计算机系教授、系副主任,获国家杰出青年科学基金、王选杰青奖。研究人工智能、认知图谱、数据挖掘、社交网络和机器学习。发表论文300余篇,获ACM SIGKDD Test-of-Time Award(十年佳论文)。主持研发了大规模预训练模型“悟道”,参数规模过1.75万亿。之前还研发了研究者社会网络挖掘系统AMiner,吸引全球220个国家/地区2000多万用户。担任国际期刊IEEE T. on Big Data、AI OPEN主编以及WWW’23大会。获国家科技进步二等奖、北京市科技进步一等奖、北京市专利奖一等奖、人工智能学会科技进步一等奖、KDD杰出贡献奖。