莉莉絲 | ETL開發(fā)日常一面涼經(jīng)
整體面了50min,面試官很溫柔
可惜我太菜了,昨天下午面,今天早上秒掛
感覺莉莉絲這個崗偏數(shù)倉底層的一些數(shù)據(jù)開發(fā),或者說是數(shù)據(jù)模型的設(shè)計
- 自我介紹
- 拷打項目(擺了一段時間突然收到面試,沒怎么準備被狠狠拷打了)
- 講一講維度建模整體過程,如何設(shè)計(我答了個數(shù)倉分層,被蠢哭了,后面被提醒說了說星型模型)
- 維度建模理論這里的冗余是指什么,如果維度變了怎么辦(緩慢變化維)
- 說說做了哪些指標,做了哪些標簽
- DQC里面具體校驗了什么東西
- 如何保證數(shù)據(jù)質(zhì)量的規(guī)范
- 30min之后說來做兩道sql吧(口述完第一道,做完就沒時間了,場景很有意思不愧為游戲公司)
- sql題:現(xiàn)在有一輛小車在二維平面上,然后每一秒上報一次它的坐標(x, y),表的結(jié)構(gòu)類似(time, x, y),然后這樣一分鐘下來的話,它就會上報60個坐標,因為小車的行駛方向是任意的,所以它可能是一個折線圖,求他連續(xù)行駛的最大直線距離(不用考慮一些特殊情況,說說大概思路)
- 先lag或lead開窗,求相鄰兩行的斜率k:(y2-y1)/(x2-x1)
- 再group by k,對相同k的這幾行數(shù)據(jù)參考連續(xù)登錄思路
- row_number()再開窗,算出最大直線距離
- 面試官的另一種解法:考慮轉(zhuǎn)彎的這個關(guān)鍵點就好了。只要你斜率不一樣的話,你就相當于如果你下一條,你每個數(shù)據(jù)比一下,如果斜率相同的賦0,如果斜率不同的賦1,然后只要你每變一次,那個標記就是1。然后你用一個累計求和的開窗函數(shù),你把前面的這個標記加起來就可以了
- 反問