單項(xiàng)選擇題強(qiáng)化學(xué)習(xí)中近端策略?xún)?yōu)化(ProximalPolicyOptimization-PPO)的目的是:()。

A.減少學(xué)習(xí)過(guò)程中的方差
B.加速模型的收斂速度
C.優(yōu)化策略的穩(wěn)定性
D.提高策略的探索能力


您可能感興趣的試卷

你可能感興趣的試題

1.單項(xiàng)選擇題層次聚類(lèi)方法中,凝聚的層次聚類(lèi)是從什么開(kāi)始()?

A.將每個(gè)數(shù)據(jù)點(diǎn)視為一個(gè)單獨(dú)的簇
B.將所有數(shù)據(jù)點(diǎn)視為一個(gè)簇
C.隨機(jī)選擇數(shù)據(jù)點(diǎn)作為簇
D.根據(jù)數(shù)據(jù)的分布選擇簇

2.單項(xiàng)選擇題下列不屬于Keras 的核心模塊的是()。

A.有激活函數(shù)
B.損失函數(shù)
C.濾波器
D.正則化器

4.單項(xiàng)選擇題在機(jī)器學(xué)習(xí)中,提升方法(Boosting)的主要目的是什么()?

A.降低模型的偏差。
B.減少模型的方差。
C.增加模型的復(fù)雜度。
D.提高模型的泛化能力。

5.單項(xiàng)選擇題目標(biāo)檢測(cè)中的FPN(FeaturePyramidNetwork)用于:()。

A.生成候選目標(biāo)框
B.預(yù)測(cè)目標(biāo)的類(lèi)別
C.定位目標(biāo)的精確位置
D.提高目標(biāo)分辨率

最新試題

在深度學(xué)習(xí)模型訓(xùn)練中,哪些技術(shù)可以用于加速模型收斂和提高穩(wěn)定性()?

題型:多項(xiàng)選擇題

人工智能中的“序列到序列”模型主要用于處理什么類(lèi)型的數(shù)據(jù)()?

題型:?jiǎn)雾?xiàng)選擇題

屬性值約束主要有()。

題型:多項(xiàng)選擇題

在深度學(xué)習(xí)模型中,用于提高模型訓(xùn)練穩(wěn)定性的技術(shù)是:()。

題型:?jiǎn)雾?xiàng)選擇題

進(jìn)行模型訓(xùn)練之前,需要先把標(biāo)注好的數(shù)據(jù)進(jìn)行分類(lèi)。訓(xùn)練有監(jiān)督學(xué)習(xí)模型時(shí)會(huì)將數(shù)據(jù)集劃分為()。

題型:多項(xiàng)選擇題

度量泛化能力的好壞,最直觀(guān)的表現(xiàn)就是模型的()。

題型:多項(xiàng)選擇題

在自然語(yǔ)言處理任務(wù)中,哪些技術(shù)適用于提升實(shí)體識(shí)別和文本理解的準(zhǔn)確性和效率()?

題型:多項(xiàng)選擇題

反向傳播算法的基本原理是基于什么()?

題型:多項(xiàng)選擇題

在自然語(yǔ)言處理中,哪些方法可以用于提升自動(dòng)文本摘要的生成效果()?

題型:多項(xiàng)選擇題

反向傳播算法和梯度下降算法在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的主要區(qū)別是什么()?

題型:多項(xiàng)選擇題