?如下圖所示,樣本中有三個類別C1、C2、C3,采用KNN分類算法,圖中給出了被測數(shù)據(jù)對象X和Y在特征空間中的映射點,以X、Y為中心的圓表示對應(yīng)K個與X、Y最相近點的分布情況。依據(jù)KNN的多數(shù)表決規(guī)則,X歸為C3類,Y歸為C2類,但感覺這個分類結(jié)果與圖示有些偏差,直觀上X和Y都比較接近C1。你覺得可以采取哪些措施來改進算法以避免這種情況發(fā)生?()
A.X的問題是K值選擇太小,可以適當(dāng)增大K值,Y的問題是K值過大,可以適當(dāng)減小K值
B.Y的分類問題可能是由于樣本數(shù)不平衡造成,可以考慮壓縮C2類別的樣本數(shù)量
C.Y的問題可以考慮用加權(quán)多數(shù)表決法解決
D.X的問題可能是C3類含比較異常的樣本,去除異常樣本數(shù)據(jù)可以提高分類準(zhǔn)確度
您可能感興趣的試卷
你可能感興趣的試題
采用KNN分類,表中列出了與被測對象距離最近的5個結(jié)果,采用歐式距離,有2個類別“0”、“1”。請選擇以下正確的選項()。
A.采用多數(shù)表決法,K=3時,結(jié)果為“0”類,K=5時為“1”類
B.用加權(quán)多數(shù)表決法,直接用距離倒數(shù)作為權(quán)值。結(jié)果與A一致
C.用加權(quán)多數(shù)表決法,直接用距離倒數(shù)作為權(quán)值。K=3和K=5時,結(jié)果均為“0”類
D.采用加權(quán)表決規(guī)則后,K值越大,準(zhǔn)確性越高
?假設(shè)一門課將一部分內(nèi)容安排成了線上內(nèi)容,包括課程相關(guān)的視頻和集中討論兩部分。對于線上內(nèi)容學(xué)生可以自愿選擇是否參加,不影響總成績。學(xué)期結(jié)束時,老師希望對學(xué)生在線上的學(xué)習(xí)情況用KNN進行分析,老師能夠統(tǒng)計到每個學(xué)生線上收看視頻的時間,以及參與集中討論的時間?,F(xiàn)在老師希望做兩個分類工作:
(1)根據(jù)學(xué)生看視頻和參與討論的時間,將學(xué)生分成“自主學(xué)習(xí)型”(看視頻較多)和“集中學(xué)習(xí)型”(參與討論較多)兩類。
(2)根據(jù)學(xué)生參與線上內(nèi)容的程度,將學(xué)生分成“課堂學(xué)習(xí)型”和“課堂+線上學(xué)習(xí)型”。
?試問對于上述兩個分類工作,如果考慮歐式距離和余弦相似度,應(yīng)該選擇哪種距離函數(shù)比較合適?()
A.(1)和(2)都選擇余弦相似度
B.(1)選擇歐式距離,(2)選擇余弦相似度
C.(1)選擇余弦相似度,(2)選歐式距離
D.(1)和(2)都選歐式距離
A.根據(jù)初始中心,最開始1,2,5,11,15同屬第一類,但后來15屬于第二類了
B.聚類結(jié)束時,第二類最大,有7個數(shù)
C.聚類結(jié)束時,第三類的中心大于35
D.聚類結(jié)束時,11也屬于第二類了
A.如果把人們的受教育程度分為“受過高等教育”和“沒有受過高等教育”兩類,張三剛從大學(xué)畢業(yè)了,因此他應(yīng)該屬于“受過高等教育”類別的
B.幼兒園舉辦親子活動,午餐的時候,為了便于交流,特意安排家長們聚在一起,小朋友們聚在一起
C.產(chǎn)品經(jīng)過自動檢測的流水線,就被分成了次品和正品兩類
D.經(jīng)過長期的觀察研究,發(fā)現(xiàn)小學(xué)生在課堂上的表現(xiàn)可以分為“積極踴躍”“沉靜寡言”和“心里有數(shù)”三種類別
A.13是滿足ax+by=gcd(a,b),x絕對值最小的整數(shù)
B.21是滿足ax+by=gcd(a,b),y絕對值最小的整數(shù)
C.x的絕對值還可以減小,會引發(fā)y的絕對值發(fā)生變化
D.y的絕對值還可以減小,會引發(fā)x的絕對值發(fā)生變化
最新試題
使用偽代碼描述算法具有()等優(yōu)點。
在求解部分背包問題時采用的貪心策略是()。
在解決活動安排問題時應(yīng)首先對活動進行排序,排序的依據(jù)是()。
下面哪個問題不是NPC問題?()
有一個問題的蒙特卡洛算法,給定一個實例,已知運行一次其答案是錯誤的概率是1/8,現(xiàn)運行k次該算法,其答案一直不變,問該答案的正確率是()。
?在分治法中講到快速排序,如果每次使用partion函數(shù)導(dǎo)致分組出現(xiàn)嚴(yán)重不平衡情況下,算法效率不高,最壞情況下的時間復(fù)雜度為O(n2),通過改造partition函數(shù),也就是每次隨機選擇一個元素作為劃分基準(zhǔn),這樣會很好地改善算法的性能,這種算法思想是()。
輸入數(shù)組(-1,0,1,-2,3),它的最大子段和是()。
pollard算法找到一個整數(shù)因子的時間復(fù)雜性是()。
應(yīng)用分支限界法的三個關(guān)鍵問題包括()。
下列關(guān)于貪心算法與動態(tài)規(guī)劃算法說法正確的是()。