問答題
一個數(shù)據(jù)庫有5個事務,如表所示。設min_sup=60%,min_conf=80%。
(a)分別用Apriori算法和FP-growth算法找出所有頻繁項集。比較兩種挖掘方法的效率。
(b)比較窮舉法和Apriori算法生成的候選項集的數(shù)量。
(c)利用(1)所找出的頻繁項集,生成所有的強關聯(lián)規(guī)則和對應的支持度和置信度。
您可能感興趣的試卷
最新試題
數(shù)據(jù)復制或者備份均是為了從提高數(shù)據(jù)并發(fā)這個角度來設計和實現(xiàn)的。
題型:判斷題
支持向量機不適合大規(guī)模數(shù)據(jù)。
題型:判斷題
隨機梯度下降每次更新執(zhí)行的計算量少于批梯度下降。
題型:判斷題
通過統(tǒng)計學可以推測擲兩個撒子同時選中3點的幾率。
題型:判斷題
當MAP中使用的先驗是參數(shù)空間上的統(tǒng)一先驗時,MAP估計等于ML估計。
題型:判斷題
由于決策樹學會了對離散值輸出而不是實值函數(shù)進行分類,因此它們不可能過度擬合。
題型:判斷題
無論質(zhì)心的初始化如何,K-Means始終會給出相同的結果。
題型:判斷題
公司內(nèi)部收集的數(shù)據(jù)不存在需要考慮數(shù)據(jù)隱私的環(huán)節(jié)。
題型:判斷題
通常,當試圖從大量觀察中學習具有少量狀態(tài)的HMM時,我們幾乎總是可以通過允許更多隱藏狀態(tài)來增加訓練數(shù)據(jù)的可能性。
題型:判斷題
完整性,一致性,時效性,唯一性,有效性,準確性是衡量數(shù)據(jù)質(zhì)量的六個維度指標。
題型:判斷題