free性xxxxx欧美hd,欧美乱妇高清免费96欧美乱妇高

單項(xiàng)選擇題反映一個(gè)詞語對(duì)于一篇文檔的重要性的兩個(gè)指標(biāo)分別是？（）

A.停止詞、低頻詞
B.主題模型、詞袋模型
C.文分詞、英文分詞
D.詞頻率、逆文文件頻率
E.詞頻率向量、逆頻率向量

點(diǎn)擊查看答案

您可能感興趣的試卷

你可能感興趣的試題

1.單項(xiàng)選擇題下列哪個(gè)屬于無監(jiān)督學(xué)習(xí)算法？（）

A.判定樹
B.支持向量機(jī)
C.K均值聚類
D.樸素貝葉斯
E.二叉樹

點(diǎn)擊查看答案

2.單項(xiàng)選擇題針對(duì)文本挖掘，下列敘述何者為非？（）

A.詞頻統(tǒng)計(jì)的方法中，對(duì)于要將單一主題的文文件從海量的語料庫中發(fā)掘出來是很輕易的，不需要借助額外的技術(shù)來獲取詞頻向量
B.主題模型（topicmodel）是描述語料庫及其中潛在的一類數(shù)字模型，首先考慮到的是如何用數(shù)學(xué)語言去描述一個(gè)主題
C.詞頻向量是由所有的詞頻組合在一起，同時(shí)，詞頻為該字詞在文本出現(xiàn)的總數(shù)除以文檔中的總詞語數(shù)
D.文黨的詞頻、主題的比重、主題的詞頻三者之間的關(guān)系為D（文檔詞頻）=W（主題比重）*T（主題詞頻）
E.文本挖掘技術(shù)基本上屬于無監(jiān)督學(xué)習(xí)方法

點(diǎn)擊查看答案

3.單項(xiàng)選擇題下列關(guān)于文本分析的敘述中何者為非？（）

A.詞袋模型（bag-of-wordsmodel）適用于描述文本的一個(gè)簡(jiǎn)單的數(shù)學(xué)模型，也是常用的一種文本特征提取方式
B.詞袋模型對(duì)文文件進(jìn)行了很大程度的簡(jiǎn)化，但一定程度上仍然保留了文文件的主題信息
C.對(duì)文本建構(gòu)詞袋之前，需要先借著額外的手段將文本中的詞語分開，這項(xiàng)技術(shù)稱之為分詞（word-segment）
D.在文檔中，例如『的』、『也』這樣構(gòu)成一個(gè)句子的基本字詞對(duì)文文件的主題區(qū)分并無幫助，且不攜帶任何主題信息的高頻詞稱為停止詞（Stopword），在構(gòu)建詞典時(shí)必須去除
E.一個(gè)詞在文文件中出現(xiàn)的頻率稱為詞頻率（termfrequency）其定義為該詞語在文本中出現(xiàn)的次數(shù)與這段文本中詞語的總數(shù)的商

點(diǎn)擊查看答案

4.單項(xiàng)選擇題在進(jìn)行K均值聚類之前，我們首先需要確定聚類數(shù)量K的大小，而在相冊(cè)的人臉聚類中，我們往往不知數(shù)據(jù)需要分成幾類，請(qǐng)問，用什么方法可以確定K的大小呢？（）

A.手肘法
B.刪除法
C.分類樹
D.矩陣乘法
E.層次聚類算法

點(diǎn)擊查看答案

5.單項(xiàng)選擇題下列關(guān)于生成對(duì)抗網(wǎng)絡(luò)（GenerativeAdversarialNetwork）的選項(xiàng)何者錯(cuò)誤？（）

A.分成「生成網(wǎng)絡(luò)」及「判別網(wǎng)絡(luò)」兩部份
B.通過生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)之間的相互「對(duì)抗」來學(xué)習(xí)
C.在生成圖片的模型中，判別網(wǎng)絡(luò)的輸出代表「該圖片為真實(shí)圖片」的概率
D.在多次迭代后，判別網(wǎng)絡(luò)的輸出總是會(huì)趨近于1，達(dá)到均衡狀態(tài)
E.生成網(wǎng)絡(luò)其實(shí)就是利用復(fù)雜的函數(shù)映像來實(shí)現(xiàn)輸入和輸出的變換

點(diǎn)擊查看答案