單項選擇題Q-learning算法中的Q表(Q-table)的row表示什么?()

A.獎勵(reward)
B.環(huán)境(environment)
C.代理人(agent)
D.行動(action)
E.狀態(tài)(state)


您可能感興趣的試卷

你可能感興趣的試題

2.單項選擇題投擲兩個骰子所形成的數(shù)字空間為何?()

A.{0,1,2,3,4,5,6,7,8,9,10,11}
B.{1,2,3,4,5,6,7,8,9,10,11}
C.{2,3,4,5,6,7,8,9,10,11,12}
D.{2,4,,6,8,10,12}
E.{1,3,5,7,9,11}

3.單項選擇題序列樣式探勘篩選代表性夠高的型樣的準則為何?()

A.具有該型樣的顧客總數(shù)
B.有多少比例的顧客具有該型樣
C.該型樣出現(xiàn)的時間
D.該型樣出現(xiàn)的密集程度
E.該型樣的最小信賴度(minimumconfidence)

4.單項選擇題想知道顧客的行為趨勢可以使用哪個知識發(fā)現(xiàn)技術?()

A.序列樣式探勘
B.關聯(lián)規(guī)則探勘
C.隱藏式馬可夫模型
D.分類模型
E.聚類

5.單項選擇題

關聯(lián)規(guī)則中如何探勘出一條規(guī)則?()
1信賴度
2最小信賴度
3前項出現(xiàn)的次數(shù)
4前項與后項共同出現(xiàn)的次數(shù)

A.2=4/3,且1>2時
B.1=3/4,且2>1時
C.2=4/3,且2>1時
D.1=3/4,且1>2時
E.1=4/3,且1>2時