科拉奧數(shù)據(jù)開(kāi)發(fā)一面
說(shuō)一下數(shù)倉(cāng)項(xiàng)目的架構(gòu)(離線(xiàn)和實(shí)時(shí)都問(wèn)了)
說(shuō)一下數(shù)倉(cāng)分層及其作用
DWD層和DWS層的區(qū)別
事實(shí)表有哪些,為什么要設(shè)置周期快照事實(shí)表
說(shuō)一下ADS層完成的比較難的需求及其實(shí)現(xiàn)(離線(xiàn)數(shù)倉(cāng)的)
說(shuō)一下為什么在實(shí)時(shí)項(xiàng)目中加入Redis作為緩存
說(shuō)一下為什么使用LookUpJoin
MapReduce的工作原理
Hive怎么調(diào)優(yōu)
Flink水位線(xiàn)機(jī)制
一道HiveSQL:假設(shè)有一張用戶(hù)登錄表,如何求出連續(xù)三天登錄的用戶(hù)
反問(wèn):
入職主要干啥
簡(jiǎn)歷中哪點(diǎn)吸引了你
回答的怎么樣
個(gè)人感覺(jué)答的不是很好的:
說(shuō)一下ADS層完成的比較難的需求(這里我倒是說(shuō)了一個(gè),但是感覺(jué)面試官好像聽(tīng)得不是很懂的樣子QWQ)
Hive怎么調(diào)優(yōu)(這個(gè)主要說(shuō)了分組和Join如何調(diào)優(yōu),其他參數(shù)實(shí)在不會(huì))
Flink水位線(xiàn)機(jī)制,這個(gè)答完面試官說(shuō)水位線(xiàn)主要處理亂序數(shù)據(jù),但是我答的方向是可以使用事件時(shí)間,提高準(zhǔn)確性
一開(kāi)始宿舍比較吵,然后上天臺(tái)開(kāi)流量面試的,后來(lái)面完面試官說(shuō)聲音不是很連續(xù),以后長(zhǎng)記性了得找個(gè)網(wǎng)好點(diǎn)的地方
感覺(jué)要寄