雙非鼠鼠太難了, 投了差不多兩個月了就一兩個面試還寄了,還是回家擺攤賣手打檸檬茶吧具體時間線忘了,三面后兩周沒消息后掛了。## 一面1. 自我介紹2. 實習經(jīng)歷和項目介紹 遇到最大的難點等3. sql優(yōu)化細說4. 如果給你個全新的需求,你完全不了解,你會怎么做?5. 如果你是數(shù)據(jù)團隊負責人,你會怎么讓實習生快速上手項目6. 數(shù)倉模型分層介紹(數(shù)倉理論)7. 瀏覽器打開網(wǎng)頁涉及哪些流程8. 你知道B站吧,B站主頁有個搜索框、請問你怎么設計?9. sql題 最大連續(xù)登錄天數(shù) 再細問開窗函數(shù)如果換sum 開窗范圍是否有變化(考察開窗范圍)## 二面自我介紹項目和實習經(jīng)歷介紹和深挖八股Hadoop主要主件有哪些Hdfs讀寫流程Spark和hadoop的區(qū)別Spark rdd算子有哪些union all會shuffue嗎?寬窄依賴劃分Scala 科里化參數(shù)能是函數(shù)嗎?Flink了解嗎介紹一下時間語義有哪些有哪些窗口水位線的理解任務卡住了如何解決Sql任務優(yōu)化數(shù)據(jù)傾斜如何做空值如何處理熱key如何處理數(shù)倉理論分層的好處給你一個新需求你怎么開發(fā)為什么選做大數(shù)據(jù)開發(fā)sql最后做一題最大同時在線人數(shù)感覺面試官思維比較發(fā)散一下子問下八股一下子問下實習經(jīng)歷,但聊的趕緊挺愉快的## 三面經(jīng)典環(huán)節(jié) 自我介紹、實習、項目和科研中遇到的難點挖挖實習過程,具體怎么做的數(shù)據(jù)比對是怎么個流程sql優(yōu)化有哪些方法flink是否有用過sql 兩張表 一張訪客表 一張訂單表 求每個門店的top3商品率商品 商品率=商品購買數(shù)/商品訪客數(shù)主要就是開窗和group by后面還補了個熱key數(shù)據(jù)傾斜問題還有商品率是否會大于1面試官最后補了句感謝您的參與,我其實知道大概率涼了總結還是太菜了#數(shù)據(jù)倉庫#