大數(shù)據(jù)工程師面試 - 字節(jié)跳動(dòng) Spark 面試考點(diǎn)!
我是大數(shù)據(jù)歐老師,曾在互聯(lián)網(wǎng)某大廠任大數(shù)據(jù)負(fù)責(zé)人,從業(yè)大數(shù)據(jù)領(lǐng)域近 10 年,全網(wǎng)粉絲 5000+,從很多候選人的面試和咨詢中復(fù)盤了大數(shù)據(jù)工程師的面試全流程,如果你有求職大數(shù)據(jù)工程師的計(jì)劃,歡迎找我聊一聊!
直接拿走去復(fù)習(xí)?。?!
Spark 知識(shí)點(diǎn)(上)- 原理題
- RDD 的概念?RDD 的常見(jiàn)算子?
- Spark 和其他框架的比較?和 Hadoop 的比較?Spark Streaming 和 Flink 的比較?
- Client 提交 vs Cluster 提交模式的區(qū)別?
- RDD 持久化等級(jí)和含義?
- 廣播變量實(shí)現(xiàn)原理?
- Accumulator 累加器的實(shí)現(xiàn)原理?
- repartition vs coalesce ?
- RDD 的寬窄依賴?
- Shuffle 分類和原理?
- Spark 的內(nèi)存模型?Execution Mem vs Storage Mem? 如果 Mem 不足怎么處理?
Spark 知識(shí)點(diǎn)(下)- 調(diào)優(yōu)題
- 內(nèi)存如何調(diào)優(yōu)?
- 序列化對(duì)性能的影響?場(chǎng)景?例子?
- 并行度調(diào)優(yōu),如何合理設(shè)置并行度?
- 數(shù)據(jù) Locality?存算一體和存算分離的好處?
- Spark Shuffle 的常見(jiàn)優(yōu)化手段?
- 數(shù)據(jù)傾斜場(chǎng)景和常見(jiàn)優(yōu)化手段?
大數(shù)據(jù)歐老師 - 面試真題分享 文章被收錄于專欄
解決職場(chǎng)真實(shí)面試問(wèn)題,分享同學(xué)真實(shí)成功案例,歡迎訂閱關(guān)注!