判斷題Transformer模型相比于RNN模型,在處理長序列時不會遇到梯度消失或梯度爆炸問題。

您可能感興趣的試卷