一面 50分鐘自我介紹數(shù)倉的數(shù)據(jù)怎么采集的,采集平臺包括哪些組件以及組件具體都做什么為什么flume要把數(shù)據(jù)放到kafka中數(shù)倉分層設(shè)計從ODS到DWD都做了哪些ETL零點漂移問題你怎么解決的按照你的解決方案,如果數(shù)據(jù)漂移的時間很長,你需要計算的時候會出現(xiàn)誤差怎么辦你的數(shù)倉都包含了哪些維度為什么沒有訂單維度(維度退化)Spark 了解多少spark web UI 都了解哪些如果數(shù)據(jù)傾斜你怎么定位stage是怎么劃分的寬窄依賴怎么區(qū)分?jǐn)?shù)據(jù)傾斜的解決方案平時寫代碼用什么語言Java 的 hashmap 底層是怎么存儲的,如果多線程并發(fā)訪問 HashMap 怎么辦HashTable 和 ConcurrentHashMap 為什么 ConcurrentHashMap 性能高一些SQL:TopN 問題,如果允許排序相同怎么做二面 30分鐘自我介紹介紹一下你怎么設(shè)計的業(yè)務(wù)總線矩陣數(shù)倉怎么分層的事實表的設(shè)計過程,都包含了哪些類型的事實表四道SQL:a 表中存在 b 表中不存在的 id row_number 排序行轉(zhuǎn)列(1,2,3,4 變成 1;2;3;4)記不住題目了,就是一個簡單的聚合加開窗聊了一下實習(xí)相關(guān)的內(nèi)容以及后續(xù)流程hr 面hr約面試的時候說是hr面但是進(jìn)面試間的面試官應(yīng)該是一個主管,一直拷打項目,然后就寄了