多項選擇題在現(xiàn)實世界的數(shù)據(jù)中,元組在某些屬性上缺少值是常有的。描述處理該問題的各種方法有:()。

A.忽略元組
B.使用屬性的平均值填充空缺值
C.使用一個全局常量填充空缺值
D.使用與給定元組屬同一類的所有樣本的平均值
E.使用最可能的值填充空缺值


您可能感興趣的試卷

你可能感興趣的試題

1.多項選擇題以下哪些學(xué)科和數(shù)據(jù)挖掘有密切聯(lián)系?()

A.統(tǒng)計
B.計算機組成原理
C.礦產(chǎn)挖掘
D.人工智能

2.多項選擇題數(shù)據(jù)挖掘的預(yù)測建模任務(wù)主要包括哪幾大類問題?()

A.分類
B.回歸
C.模式發(fā)現(xiàn)
D.模式匹配

3.多項選擇題尋找數(shù)據(jù)集中的關(guān)系是為了尋找精確、方便并且有價值地總結(jié)了數(shù)據(jù)的某一特征的表示,這個過程包括了以下哪些步驟?()

A.決定要使用的表示的特征和結(jié)構(gòu)
B.決定如何量化和比較不同表示擬合數(shù)據(jù)的好壞
C.選擇一個算法過程使評分函數(shù)最優(yōu)
D.決定用什么樣的數(shù)據(jù)管理原則以高效地實現(xiàn)算法

5.單項選擇題下面關(guān)于Jarvis-Patrick(JP)聚類算法的說法不正確的是()。

A.JP聚類擅長處理噪聲和離群點,并且能夠處理不同大小、形狀和密度的簇
B.JP算法對高維數(shù)據(jù)效果良好,尤其擅長發(fā)現(xiàn)強相關(guān)對象的緊致簇
C.JP聚類是基于SNN相似度的概念
D.JP聚類的基本時間復(fù)雜度為O(m)

最新試題

由于決策樹學(xué)會了對離散值輸出而不是實值函數(shù)進行分類,因此它們不可能過度擬合。

題型:判斷題

數(shù)據(jù)壓縮與解壓縮可以使得數(shù)據(jù)處理的速度加快。

題型:判斷題

使用正則表達式可以找到一個文本文件中所有可能出現(xiàn)的手機號碼。

題型:判斷題

通常,當(dāng)試圖從大量觀察中學(xué)習(xí)具有少量狀態(tài)的HMM時,我們幾乎總是可以通過允許更多隱藏狀態(tài)來增加訓(xùn)練數(shù)據(jù)的可能性。

題型:判斷題

數(shù)據(jù)收集中的拉模式需要通過定時的方式不斷地觸發(fā),才能源源不斷地獲取對應(yīng)的數(shù)據(jù)。

題型:判斷題

任務(wù)調(diào)度系統(tǒng)的設(shè)計與實現(xiàn)才能使得數(shù)據(jù)收集工作可以不間斷地按照既定的目標(biāo)從目標(biāo)源獲取數(shù)據(jù)。

題型:判斷題

隨機梯度下降每次更新執(zhí)行的計算量少于批梯度下降。

題型:判斷題

數(shù)據(jù)復(fù)制或者備份均是為了從提高數(shù)據(jù)并發(fā)這個角度來設(shè)計和實現(xiàn)的。

題型:判斷題

當(dāng)數(shù)據(jù)集標(biāo)簽錯誤的數(shù)據(jù)點時,隨機森林通常比AdaBoost更好。

題型:判斷題

要將工作申請分為兩類,并使用密度估計來檢測離職申請人,我們可以使用生成分類器。

題型:判斷題