單項(xiàng)選擇題在強(qiáng)化學(xué)習(xí)中,什么是“動態(tài)規(guī)劃”(DynamicProgramming)()?

A.一種用于優(yōu)化策略的方法
B.一種用于計(jì)算狀態(tài)值的方法
C.一種用于選擇動作的規(guī)則
D.一種用于表示環(huán)境模型的數(shù)據(jù)結(jié)構(gòu)


您可能感興趣的試卷

你可能感興趣的試題

1.單項(xiàng)選擇題在強(qiáng)化學(xué)習(xí)中,什么是“馬爾可夫性質(zhì)”()?

A.智能體可以隨時(shí)選擇任何動作
B.環(huán)境的動態(tài)會隨時(shí)間改變
C.下一個(gè)狀態(tài)只取決于當(dāng)前狀態(tài)和采取的動作
D.智能體可以看到完整的狀態(tài)空間

2.單項(xiàng)選擇題Mixup 數(shù)據(jù)增廣的關(guān)鍵點(diǎn)是什么()?

A.圖像與圖像疊加
B.樣本與樣本疊加
C.特征與特征疊加
D.標(biāo)簽與標(biāo)簽疊加

3.單項(xiàng)選擇題強(qiáng)化學(xué)習(xí)算法中,用于優(yōu)化策略的一種方法是:()。

A.監(jiān)督學(xué)習(xí)
B.無監(jiān)督學(xué)習(xí)
C.半監(jiān)督學(xué)習(xí)
D.策略梯度

5.單項(xiàng)選擇題PyTorch 中的torchnnfunctional 模塊主要用于提供什么()?

A.損失函數(shù)
B.神經(jīng)網(wǎng)絡(luò)層
C.優(yōu)化器
D.激活函數(shù)和其他非層操作

最新試題

在深度學(xué)習(xí)中,哪些方法可以用于優(yōu)化模型訓(xùn)練過程并提高模型在特定任務(wù)上的表現(xiàn)()?

題型:多項(xiàng)選擇題

模型微調(diào)中的提示學(xué)習(xí)是指:()。

題型:單項(xiàng)選擇題

反向傳播算法和梯度下降算法在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的關(guān)系是什么()?

題型:多項(xiàng)選擇題

相對化學(xué)沉淀等傳統(tǒng)工藝而言,萃取工藝的主要優(yōu)點(diǎn)是()。

題型:多項(xiàng)選擇題

在自然語言處理任務(wù)中,哪些技術(shù)適用于提升文本分類的性能()?

題型:多項(xiàng)選擇題

在深度學(xué)習(xí)模型訓(xùn)練中,哪些技術(shù)可以用于加速模型收斂和提高穩(wěn)定性()?

題型:多項(xiàng)選擇題

在深度學(xué)習(xí)模型中,用于提高模型訓(xùn)練穩(wěn)定性的技術(shù)是:()。

題型:單項(xiàng)選擇題

在自然語言處理中,哪些技術(shù)可以用于改善實(shí)體識別和文本生成任務(wù)的性能()?

題型:多項(xiàng)選擇題

集成學(xué)習(xí)在強(qiáng)化學(xué)習(xí)中的一個(gè)常見應(yīng)用是什么()?

題型:單項(xiàng)選擇題

人工智能中的“序列到序列”模型主要用于處理什么類型的數(shù)據(jù)()?

題型:單項(xiàng)選擇題