A.反向傳播算法用于計(jì)算梯度,梯度下降算法用于更新參數(shù)B.反向傳播算法用于更新參數(shù),梯度下降算法用于計(jì)算梯度C.兩者都用于計(jì)算梯度,但梯度下降算法用于更新參數(shù)D.兩者可以獨(dú)立運(yùn)行,互不影響
A.序列到序列模型B.注意力機(jī)制C.引入預(yù)訓(xùn)練模型D.數(shù)據(jù)增強(qiáng)
A.名稱B.位置C.屬性D.內(nèi)容