下表所示的相依表匯總了超級市場的事務(wù)數(shù)據(jù)。其中hot dogs指包含熱狗的事務(wù),指不包含熱狗的事務(wù)。hamburgers指包含漢堡的事務(wù),指不包含漢堡的事務(wù)。
假設(shè)挖掘出的關(guān)聯(lián)規(guī)則是“hot dogs=>hamburgers”。給定最小支持度閾值25%和最小置信度閾值50%,這個關(guān)聯(lián)規(guī)則是強(qiáng)規(guī)則嗎?
計算關(guān)聯(lián)規(guī)則“hot dogs=>hamburgers”的提升度,能夠說明什么問題?購買熱狗和購買漢堡是獨(dú)立的嗎?如果不是,兩者間存在哪種相關(guān)關(guān)系?
您可能感興趣的試卷
你可能感興趣的試題
最新試題
完整性,一致性,時效性,唯一性,有效性,準(zhǔn)確性是衡量數(shù)據(jù)質(zhì)量的六個維度指標(biāo)。
使用正則表達(dá)式可以找到一個文本文件中所有可能出現(xiàn)的手機(jī)號碼。
數(shù)據(jù)收集中的拉模式需要通過定時的方式不斷地觸發(fā),才能源源不斷地獲取對應(yīng)的數(shù)據(jù)。
支持向量機(jī)不適合大規(guī)模數(shù)據(jù)。
數(shù)據(jù)索引是保證數(shù)據(jù)處理高性能的軟件角度的一種手段,不做數(shù)據(jù)索引的數(shù)據(jù)訪問是線性訪問,但是做了索引的數(shù)據(jù)訪問會成倍的降低訪問時間。
小數(shù)據(jù)集的數(shù)據(jù)處理最好也由計算機(jī)手段來完成。
最大似然估計的一個缺點(diǎn)是,在某些情況下(例如,多項(xiàng)式分布),它可能會返回零的概率估計。
訓(xùn)練神經(jīng)網(wǎng)絡(luò)具有過度擬合訓(xùn)練數(shù)據(jù)的潛在問題。
由于分類是回歸的一種特殊情況,因此邏輯回歸是線性回歸的一種特殊情況。
給定用于2類分類問題的線性可分離數(shù)據(jù)集,線性SVM優(yōu)于感知器,因?yàn)镾VM通常能夠在訓(xùn)練集上實(shí)現(xiàn)更好的分類精度。