問答題
假定用于分析的數(shù)據(jù)包含屬性age。數(shù)據(jù)元組的age值(以遞增序) 是:13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70。
(1)使用分箱均值光滑對(duì)以上數(shù)據(jù)進(jìn)行光滑,箱的深度為3。解釋你的步驟。評(píng)述對(duì)于給定的數(shù)據(jù),該技術(shù)的效果。
(2)如何確定數(shù)據(jù)中的離群點(diǎn)?
(3)對(duì)于數(shù)據(jù)光滑,還有哪些其他方法?
您可能感興趣的試卷
最新試題
互聯(lián)網(wǎng)本身具有()的特征,這種屬性特征給數(shù)據(jù)搜集、整理、研究帶來了革命性的突破。
題型:多項(xiàng)選擇題
下列屬于數(shù)據(jù)歸納方法的是()
題型:多項(xiàng)選擇題
數(shù)據(jù)挖掘系統(tǒng)可以根據(jù)什么標(biāo)準(zhǔn)進(jìn)行分類()
題型:多項(xiàng)選擇題
AprioriAll算法存在的問題包括()。
題型:多項(xiàng)選擇題
滿意度分析建模數(shù)據(jù)來源于()
題型:多項(xiàng)選擇題
不屬于數(shù)據(jù)挖掘的功能是()
題型:?jiǎn)雾?xiàng)選擇題
高鐵用戶識(shí)別基于以下哪些信息()
題型:多項(xiàng)選擇題
大數(shù)據(jù)領(lǐng)域的主要開源生態(tài)體系包括()
題型:多項(xiàng)選擇題
隨機(jī)森林利用隨機(jī)的方式將許多決策樹組合成一個(gè)森林,每個(gè)決策樹在分類的時(shí)候決定測(cè)試樣本的最終類別。它的優(yōu)點(diǎn)是()
題型:多項(xiàng)選擇題
關(guān)聯(lián)規(guī)則挖掘最為著名的是Agrawal等人提出的()及其改進(jìn)算法。
題型:?jiǎn)雾?xiàng)選擇題