判斷題

強(qiáng)化學(xué)習(xí)中的Actor-Critic架構(gòu)結(jié)合了基于值和基于策略的方法,其中Actor負(fù)責(zé)選擇動(dòng)作,Critic負(fù)責(zé)評(píng)估動(dòng)作的價(jià)值。

答案: 正確
微信掃碼免費(fèi)搜題