非线性函数逼近的收敛强化学习 - SCI论文网

首页 > 热门标签 > 非线性函数逼近的收敛强化学习

共找到关于《非线性函数逼近的收敛强化学习》的文章 2 篇

SBEED: Convergent Reinforcement Learning with Nonlinear Function Approximation（附
2018年07月16日

当采用函数逼近时，求解具有稳定性保证的Bellman最优方程一直是强化学习中的一个重要问题。基本艰难 Ty是Bellman算子在一般情况下的扩展，导致Q-学习等流行算法的振荡甚至发散行为。在本文...

Tags： ICML贡献论文 ,蚂蚁金服人工智能论文 ,蚂蚁金服论文 ,人工智能论文 ,人工智能 ,非线性函数逼近的收敛强化学习 ,非线性函数逼近 ,收敛强化学习

SCI热点排行

成仿吾与马克思主义论文

成仿吾与马克思主义论

　成仿吾，无产阶级革命家、忠诚的共产主义战士...　详细>>

SCI论文范文

中国地方政府环境治理的政策效应——基于“河长制”演进的研究（附全文PDF版下载）

中国地方政府环境治理

　如何设计有效的环境治理政策, 是学术界和政策...　详细>>

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml