A.預(yù)先給定的初始抓取種子樣本
B.預(yù)先給定的網(wǎng)頁(yè)分類目錄和與分類目錄對(duì)應(yīng)的種子樣本
C.通過(guò)用戶行為確定的抓取目標(biāo)樣例
D.自行編寫(xiě)種子樣本
您可能感興趣的試卷
你可能感興趣的試題
A.目標(biāo)網(wǎng)頁(yè)特征
B.目標(biāo)數(shù)據(jù)量
C.目標(biāo)數(shù)據(jù)模式
D.領(lǐng)域概念
A.數(shù)量巨大
B.范圍較大
C.精準(zhǔn)篩選
D.選定URL種子
A.數(shù)量巨大
B.范圍較大
C.精準(zhǔn)篩選
D.爬行速度慢
A.無(wú)用網(wǎng)頁(yè)較多
B.對(duì)非結(jié)構(gòu)化數(shù)據(jù)獲取相對(duì)容易
C.難以支持基于語(yǔ)義信息的查詢
D.有限的網(wǎng)絡(luò)爬蟲(chóng)服務(wù)器資源與無(wú)限的網(wǎng)絡(luò)數(shù)據(jù)資源之間的沖突
A.深度優(yōu)先搜索策略
B.精確選擇搜索策略
C.廣度優(yōu)先搜索策略
D.最佳優(yōu)先搜索策略
最新試題
Python 中的列表可以包含不同類型的數(shù)據(jù)。
數(shù)據(jù)缺失類型可以分為三類,不包括以下哪類?()
關(guān)于數(shù)據(jù)三范式描述正確的是()
下面哪些選項(xiàng)是Python 中的控制流語(yǔ)句?()
監(jiān)督學(xué)習(xí)中主要包含兩種學(xué)習(xí)方法,回歸和()。
Kafka中,每個(gè)Consumer都屬于一個(gè)Consumer Group,每條消息只能被Consumer Group中的一個(gè)Consumer消費(fèi),但可以被多個(gè)Consumer Group 消費(fèi)。
Python 中的虛擬環(huán)境是什么?()
Java 中,所有的類都默認(rèn)繼承自O(shè)bject 類。
下面哪些數(shù)據(jù)類型是Python 中的可變數(shù)據(jù)類型?()
下列哪些是Linux 文件權(quán)限相關(guān)命令?()