單項選擇題針對文本挖掘,下列敘述何者為非?()

A.詞頻統(tǒng)計的方法中,對于要將單一主題的文文件從海量的語料庫中發(fā)掘出來是很輕易的,不需要借助額外的技術來獲取詞頻向量
B.主題模型(topicmodel)是描述語料庫及其中潛在的一類數字模型,首先考慮到的是如何用數學語言去描述一個主題
C.詞頻向量是由所有的詞頻組合在一起,同時,詞頻為該字詞在文本出現的總數除以文檔中的總詞語數
D.文黨的詞頻、主題的比重、主題的詞頻三者之間的關系為D(文檔詞頻)=W(主題比重)*T(主題詞頻)
E.文本挖掘技術基本上屬于無監(jiān)督學習方法


您可能感興趣的試卷

你可能感興趣的試題

1.單項選擇題下列關于文本分析的敘述中何者為非?()

A.詞袋模型(bag-of-wordsmodel)適用于描述文本的一個簡單的數學模型,也是常用的一種文本特征提取方式
B.詞袋模型對文文件進行了很大程度的簡化,但一定程度上仍然保留了文文件的主題信息
C.對文本建構詞袋之前,需要先借著額外的手段將文本中的詞語分開,這項技術稱之為分詞(word-segment)
D.在文檔中,例如『的』、『也』這樣構成一個句子的基本字詞對文文件的主題區(qū)分并無幫助,且不攜帶任何主題信息的高頻詞稱為停止詞(Stopword),在構建詞典時必須去除
E.一個詞在文文件中出現的頻率稱為詞頻率(termfrequency)其定義為該詞語在文本中出現的次數與這段文本中詞語的總數的商

3.單項選擇題下列關于生成對抗網絡(GenerativeAdversarialNetwork)的選項何者錯誤?()

A.分成「生成網絡」及「判別網絡」兩部份
B.通過生成網絡和判別網絡之間的相互「對抗」來學習
C.在生成圖片的模型中,判別網絡的輸出代表「該圖片為真實圖片」的概率
D.在多次迭代后,判別網絡的輸出總是會趨近于1,達到均衡狀態(tài)
E.生成網絡其實就是利用復雜的函數映像來實現輸入和輸出的變換

4.單項選擇題下列哪個是生成對抗網絡(GenerativeAdversarialNetwork)可能的應用()

A.輸入一個人的側臉照片,生成同一個人的正臉照片
B.以大量的真實明星照片訓練模型,生成新的明星照片
C.輸入一個人的照片,生成不同年齡的照片
D.以大量特定明星的視頻訓練模型,此模型可將新輸入的視頻中的人臉換成特定明星的臉孔
E.以上皆是

5.單項選擇題在基于深度學習的視頻行為識別中,下列敘述何者錯誤?()

A.視頻的信息分為動態(tài)和靜態(tài)兩種,靜態(tài)信息指圖像的外觀,動態(tài)信息指的是是頻率序列中的運動信息
B.雙流卷積神經網絡(two-streamCNN)是利用兩種不同的網絡實現同時處理靜態(tài)和動態(tài)信息
C.隨機抽取的的單個彩色圖像幀作為輸入的網絡稱為空間流卷積神經網絡(spatialstreamCNN)
D.把多幀(Frame)的光流圖像作為輸入的網絡稱為時間流卷積神經網絡(temporalstreamCNN)
E.時序分段網絡(temporalsegmentnetworks)是為了解決短視頻行為識別的而產生的