91一级特黄大片|婷婷中文字幕在线|av成人无码国产|日韩无码一二三区|久久不射强奸视频|九九九久久久精品|国产免费浮力限制

深度強(qiáng)化學(xué)習(xí)導(dǎo)論課程開放
來源: 趙衛(wèi)東/
復(fù)旦大學(xué)
52
4
0
2025-08-09

 

課程網(wǎng)址:https://www.xuetangx.com/course/fdu0809bt2074/26291019?channel=i.area.manual_search 

課程介紹

課程從強(qiáng)化學(xué)習(xí)的基本概念談起,介紹了重要的Bellman方程。然后介紹經(jīng)典的時(shí)序差分、SARSA、Q-Learning、深度Q網(wǎng)絡(luò)、Double DQN、Actor-critic、Policy Gradient、A2C以及A3C、TRPO、PPO等常用的深度強(qiáng)化學(xué)習(xí)算法。此外,還通過典型的案例分析,以及騰訊開悟平臺(tái)對(duì)上述算法進(jìn)行實(shí)驗(yàn),方便理解,動(dòng)手實(shí)踐。

 

 


登錄用戶可以查看和發(fā)表評(píng)論, 請(qǐng)前往  登錄 或  注冊(cè)。
SCHOLAT.com 學(xué)者網(wǎng)
免責(zé)聲明 | 關(guān)于我們 | 聯(lián)系我們
聯(lián)系我們: