| 图书 | 强化学习(原理与Python实战)/智能系统与技术丛书 |
| 内容 | 内容推荐 全书分为三个部分:?第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。?第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,对于深度强化学习算法还给出了基于TensorFlow 2和PyTorch 1的对照实现。?第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型,半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。 导语 携七大优势,带你一书学透强化学习,掌握ChatGPT背后的关键技术。1)内容完备:完整地介绍了主流强化学习理论,全面覆盖主流强化学习算法,包括了资格迹等经典算法和MuZero等深度强化学习算法,且给出主要定理的证明过程。让你参透ChatGPT背后的关键技术。2)表述一致:全书采用统一的数学符号,并兼容主流强化学习教程。3)配套丰富:每章都配有知识点总结、代码和习题。4)环境全面:既有Gym的内置环境,也有在Gym基础上进一步扩展的第三方环境,还带领读者一起实现了自定义的环境。5)兼容广泛:所有代码均可在Windows、macOS、Linux上运行,提供安装和配置方法。同时,为深度强化学习相关算法提供了TensorFlow和PyTorch的对照实现,学习方案任你选择。6)硬件要求低:所有代码均可在没有GPU的个人计算机上运行,也可以在线查阅运行结果。7)版权输出:本书内容受到国际知名出版社Springer和评审专家认可,英文版同步输出,以飨读者。 |
| 标签 | |
| 缩略图 | ![]() |
| 书名 | 强化学习(原理与Python实战)/智能系统与技术丛书 |
| 副书名 | |
| 原作名 | |
| 作者 | 肖智清 |
| 译者 | |
| 编者 | |
| 绘者 | |
| 出版社 | 机械工业出版社 |
| 商品编码(ISBN) | 9787111728917 |
| 开本 | 16开 |
| 页数 | 490 |
| 版次 | 1 |
| 装订 | 平装 |
| 字数 | 666 |
| 出版时间 | 2023-07-01 |
| 首版时间 | 2023-07-01 |
| 印刷时间 | 2023-07-01 |
| 正文语种 | 汉 |
| 读者对象 | |
| 适用范围 | |
| 发行范围 | 公开发行 |
| 发行模式 | 实体书 |
| 首发网站 | |
| 连载网址 | |
| 图书大类 | |
| 图书小类 | |
| 重量 | 782 |
| CIP核字 | 2023051299 |
| 中图分类号 | TP311.561 |
| 丛书名 | |
| 印张 | 31.5 |
| 印次 | 1 |
| 出版地 | 北京 |
| 长 | |
| 宽 | |
| 高 | |
| 整理 | |
| 媒质 | |
| 用纸 | |
| 是否注音 | |
| 影印版本 | |
| 出版商国别 | |
| 是否套装 | |
| 著作权合同登记号 | |
| 版权提供者 | |
| 定价 | |
| 印数 | |
| 出品方 | |
| 作品荣誉 | |
| 主角 | |
| 配角 | |
| 其他角色 | |
| 一句话简介 | |
| 立意 | |
| 作品视角 | |
| 所属系列 | |
| 文章进度 | |
| 内容简介 | |
| 作者简介 | |
| 目录 | |
| 文摘 | |
| 安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
| 随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。