阅读背景：

【David Silver强化学习公开课】-6：Value Function Approximation

发表于:2021-03-14

一、介绍

找到一种适应真实情况（很大的状态空间）的RL方法，之前的价值函数表示是通过一个S×A的表（Table）来表示Q(s,a)。状态空间很大时，这种表示内存占用过大，而且单独学习每个state的价值函数太慢了。而且在遇到没有见过的状态时，表现会很差（缺少泛化能力）。找到一种适应真实情况（很大的状态空间）的RL方法，之前的价值函数表示是通过一个S

分享到：

非常感谢你花费了来阅读本文,如果你在本站获取到了新知识,那就请点击分享按钮将本站分享出去吧。

你可能喜欢:

人工智能-波士顿房价

WIA常量和值的Intellisense /文档

虚拟机里面安装JDK和tomcat服务器（启动和测试）

[LeetCode] First Unique Character in a String 寻找第一个不重复出现的字符

OCP-052考试题库汇总（38）-CUUG内部解答版

JMeter 测试WebService协议

我今天竟然发现关于IntraWeb 在 EXE 和 DLL 模式下使用ADO的一个重大问题，希望和大家分享

ExtractExistingFileAction.OverwriteSilently不会覆盖给定目录中的文件

使用response实现文件下载

在expressjs渲染中干掉布局本地

相关阅读:

java高级基础之相关概念00

Android 百分比布局库(percent-support-lib) 解析与扩展

拓数派加入 OpenCloudOS 操作系统开源社区，作为成员单位参与社区共建

[置顶] （二十六）unity4.6学习Ugui中文文档-------UGUI的开源Tween工具轻量而强大

docker停机扩容pool空间

zset类型以及其操作

云计算 - 以阿里云为例，企业上云策略全览与最佳实践

P2V Windows 2000 到ESXI 5.5

Android Bitmap那些事之如何优化内存

UI控件之菜单(Menu)

随便看看:

【DTCC 2022】云原生数据库PieCloudDB全新eMPP架构是如何炼成的

JS string 00 .00

q友问题之删除外加双引号表一点小想法--dump--ascii--to_number

一站式获取 PieCloudDB Database 产品、社区及数据库行业全动态

Maven需改仓库地址为阿里云&修改本地仓库地址

SQL SERVER数据库表记录只保留N天图文教程

微信小程序抓包与逆向+微信小程序反编译教程+解包教程+解包工具

“AI 程序员”席卷而来，吴恩达四步设计让 Agent 提前超越 GPT-5

Android桌面快捷方式那些事与那些坑

q友问题之删除外加双引号表一点小想法--dump--ascii--to_number