單項選擇題關(guān)于Hive數(shù)據(jù)傾斜問題描述正確的是()

A.不需要了解業(yè)務(wù),對業(yè)務(wù)進(jìn)行數(shù)據(jù)探查無法解決數(shù)據(jù)傾斜
B.每一個數(shù)據(jù)傾斜的作業(yè)都需要優(yōu)化
C.小文件合并不會解決數(shù)據(jù)傾斜的問題
D.可以適當(dāng)?shù)耐ㄟ^控制mapper和reducer來控制數(shù)據(jù)傾斜的問題


您可能感興趣的試卷

你可能感興趣的試題

1.單項選擇題關(guān)于Hive查詢通常延遲較高的原因描述錯誤的是()

A.由于沒有索引,需要掃描整個表,因此延遲較高
B.由于MapReduce本身具有較高的響應(yīng)延遲,因此在利用MapReduce執(zhí)行Hive查詢時,也會有較高的延遲響應(yīng)
C.關(guān)系型數(shù)據(jù)庫較于Hive底層的文件系統(tǒng)實現(xiàn),執(zhí)行延遲較低
D.Hive查詢延遲較于關(guān)系型數(shù)據(jù)庫,延遲響一直都是很高的

2.單項選擇題關(guān)于Hive的SequenceFile格式描述正確的是()

A.SequenceFile是二進(jìn)制文件格式,以list的形式序列化到文件中
B.SequenceFile存儲方式為列存儲
C.SequenceFile不可分割、壓縮
D.SequenceFile優(yōu)勢是文件和Hadoopapi中的MapFile是相互兼容的

3.單項選擇題關(guān)于Hivemetastore的三種模式的描述錯誤的是()

A.Derby方式是內(nèi)嵌的方式,也是默認(rèn)的啟動方式,一般用于單元測試
B.local模式中,使用MySQL本地部署實現(xiàn)metastore
C.remote模式為遠(yuǎn)程MySQL
D.Derby方式在同一時間只能有多個進(jìn)程連接使用數(shù)據(jù)庫

4.單項選擇題Flume的Kafka源類型是什么()

A.KafkaSource
B.KafkaSpout
C.KafkaAvroSource
D.KafkaEventSource

5.單項選擇題Flume的事件傳輸方式是什么()

A.pull-based
B.push-based
C.stream-based
D.event-based