A.map
B.reduce
C.partitionBy
D.key by
您可能感興趣的試卷
你可能感興趣的試題
A.jobmanager
B.TaskManager
C.master
D.StandaloneSessionClusterEntrypoint
A.Tumbling Window(滾動窗口)
B.Sliding Window(滑動窗口)
C.Session Window(會話窗口)
D.Local Window(局部窗口)
A.local
B.standalone
C.yarn
D.mesos
A.RDD(Resilient distributed dataset)叫做彈性分布式數(shù)據(jù)集,是spark中最基本的數(shù)據(jù)抽象
B.Resilient:表示彈性的,彈性表示
C.Destributed:分布式,可以并行在集群計算
D.Dataset:就是一個集合,用于存放數(shù)據(jù)的
A.mapPartitions
B.lookup
C.mapPartitionsWithIndex
D.count
最新試題
下列代碼的運(yùn)行結(jié)果是()。
zookeeper的特點(diǎn)有()。
在DOS中一個java類的編譯命令是()。
scala中在REPL命令行運(yùn)行以下操作:下列選項正確的是()。
下面關(guān)于java中包的說法錯誤的是()。
配置Hadoop時,修改namenode進(jìn)程所在節(jié)點(diǎn)的配置包含在哪一個配置文件中()。
如果我們現(xiàn)有一個安裝2.6.5版本的hadoop集群,在不修改默認(rèn)配置的情況下存儲200個每個200M的文本文件,請問最終會在集群中產(chǎn)生多少個數(shù)據(jù)塊(包括副本)?()
Scala中如何定義常量()。
Linux crontab中* * * * * /usr/local/run.sh這句話5個*號分別代表什么?()
關(guān)于HDFS中WEBUI的端口是什么?()