A.獲取數(shù)據(jù),并將原始數(shù)據(jù)轉(zhuǎn)化成自己處理的數(shù)據(jù)對象
B.緩存數(shù)據(jù),根據(jù)不同的可靠性策略,將數(shù)據(jù)保存在內(nèi)存或文件上
C.輸出數(shù)據(jù)到目的地,支持多種輸出協(xié)議
D.拆分數(shù)據(jù),根據(jù)數(shù)據(jù)的特性,將數(shù)據(jù)發(fā)送到不同的目的地
您可能感興趣的試卷
你可能感興趣的試題
A.分區(qū)字段要在創(chuàng)建表時定義
B.分區(qū)字段只能有一個,不可以創(chuàng)建多級分區(qū)
C.使用分區(qū),可以減少某些查詢的數(shù)據(jù)掃᧿范圍,進而ᨀ高查詢效率
D.分區(qū)字段可以作為where字句的條件
A.優(yōu)先從最近的DataNode下載數(shù)據(jù)
B.文件數(shù)據(jù)先從DataNode返回至NameNode,然后從NameNode下致到客戶端
C.如果客戶端和所連接的DataNode在讀取時出現(xiàn)故障,那么客戶端會放棄這其他副本所在的節(jié)點
D.支持多個客戶端同時從DataNode上讀取同一個文件數(shù)據(jù)
最新試題
在Kafka中,關(guān)于Consumer說法正確的是()。
Fiume支持實時采集數(shù)據(jù)的source類型是哪項?()
Fusionlnsight HD中,一個部署在Tomcat上的應(yīng)用,需訪問HBase服務(wù),這種場景下推薦使用機機賬號。()
Oozie的workflow.xml文件是工作流配置文件。()
FusionLnsigt HD用戶想通過HBase shell操作來查詢某個HBase表中的內(nèi)容,這中場景下推薦管理員給這個用戶分配一個機機賬號。()
Fusionlnsight HD中,關(guān)于Hive的數(shù)據(jù)加載功能(通過Hivede LOAD命令導(dǎo)入數(shù)據(jù)),以下敘述錯誤的是?()
存在如下業(yè)務(wù)場景:用戶上網(wǎng)日志文件已經(jīng)存放在HDFS上,日志文件內(nèi)容格式是:每條上網(wǎng)記錄三個字段,分別是姓名,性別,上網(wǎng)時間,字段之間用“,”護分隔;要求打印輸出所有上網(wǎng)總時間大于兩小時的女性網(wǎng)友。請問如下哪些代碼片段能實現(xiàn)上述業(yè)務(wù)場景?()
以下業(yè)務(wù)應(yīng)用中,哪個不是Hive適用的場景?()
在通過Fusionlnsight manager界面創(chuàng)建用戶時,想要該用戶對所有Topic具有讀寫權(quán)限,但不具有常見Topic的權(quán)限,應(yīng)該加入Kafka服務(wù)的那個組?()
在HBase表設(shè)計中,對于多項業(yè)務(wù)共用rowkey,導(dǎo)致數(shù)據(jù)訪問矛盾的情況,可以有哪些應(yīng)對策略?()