A.支持分布式和流式采集
B.借助MapReduce任務(wù)并行采集
C.只能采集結(jié)構(gòu)化數(shù)據(jù)
D.借助外部定時任務(wù)來觸發(fā)數(shù)據(jù)采集
您可能感興趣的試卷
你可能感興趣的試題
A.(1)數(shù)據(jù)從source到channel;(2)sink從channel取數(shù)據(jù)
B.(1)數(shù)據(jù)從channle到source;(2)sink從source取數(shù)據(jù)
C.(1)數(shù)據(jù)從sink到channle;(2)source從channel取數(shù)據(jù)
A.流數(shù)據(jù)監(jiān)控
B.網(wǎng)站的實時訪問統(tǒng)計
C.離線日志分析
D.交通流量分析
A.要求Python版本不低于2.6.6,不高于2.7.0
B.客戶端必須裝有setuptools,且版本不低于5.0
C.hive_python_client腳本ᨀ供了直接執(zhí)行SQL的功能,如hive_python_client’showtables
D.Python二次開發(fā)不支持安全集群
A.在集群1上創(chuàng)建本應(yīng)用所需的賬號,并設(shè)置此賬號能訪問本集群的HBase服務(wù)
B.在集群2上創(chuàng)建A選項中的同名賬號,并設(shè)置此賬號能訪問本集群的Hive服務(wù)
C.A選項和B選項所創(chuàng)建的賬號都必須屬于supergroup組
D.集群1和集群2完成互信操作
A.海量數(shù)據(jù)存儲
B.大量小文件存儲
C.大文件存儲
D.流式文件存儲
最新試題
關(guān)于Fusionlnsight HD的Spark,以下哪些編程語言可以用來開發(fā)Spark應(yīng)用?()
Fusionlnsight HD系統(tǒng)中,Solr示例工程solr-example\confisolr-confisolr.properties中ZK_URL和ZOOKEEPER_DEFAULT_SERVER_PRINCIPAL的值可以從下面哪個選項獲?。浚ǎ?/p>
Fusionlnsigt HD的Hive組件可以運行在哪些分布式計算機框架上?()
關(guān)于Kafka的Producer,如下說法正確的是?()
Fusionlnsight HD中,一個部署在Tomcat上的應(yīng)用,需訪問HBase服務(wù),這種場景下推薦使用機機賬號。()
Spark Streaming可以從Kafka接收數(shù)據(jù)并進(jìn)行計算,計算結(jié)果只能存入HDFS,不能再寫回Kafka。()
由于Spark是基于內(nèi)存的計算引擎,因此,一個Spark應(yīng)用可以處理的數(shù)據(jù)量不能超過分給這個Spark應(yīng)用的內(nèi)存總和。()
用戶要開發(fā)一個應(yīng)用去訪問HBase服務(wù),先申請了一個機機賬號teste1,并給它設(shè)置訪問HBase服務(wù)的權(quán)限:然后下載該賬戶的keytab文件,并使用該賬號運行應(yīng)用。后續(xù)此應(yīng)用增加業(yè)務(wù)需求,需訪問Hive服務(wù),那么在給tested用戶補充授予了訪問Hive組件權(quán)限后,需重新下載該用戶的keytab文件。()
在HBase表設(shè)計中,對于多項業(yè)務(wù)共用rowkey,導(dǎo)致數(shù)據(jù)訪問矛盾的情況,可以有哪些應(yīng)對策略?()
在Spark應(yīng)用開發(fā)中,以下哪項的代碼能正確進(jìn)行單詞統(tǒng)計?()