滴滴大數(shù)據(jù)研發(fā)實習(xí)(已OC)
3.31 一面 27min
自我介紹
聊了會兒天,確認(rèn)我的實習(xí)時間
職業(yè)規(guī)劃是什么
項目介紹,為數(shù)不多讓我把兩個項目都介紹一下的
數(shù)倉分層的好處
項目中如何保證數(shù)據(jù)可靠性的?
項目中任務(wù)如何調(diào)度的?(crontab 定時腳本)
這樣的任務(wù)調(diào)度有問題嗎?該如何優(yōu)化
spark的優(yōu)化
sql:給定一個學(xué)生成績表
- 列轉(zhuǎn)行
- 求課程成績的排序
反問:
部門業(yè)務(wù)和技術(shù)棧
對實習(xí)生的要求是什么
多久出結(jié)果
下午2點(diǎn)面,下午5點(diǎn)通知一面通過,約4.1二面
4.1 二面 30min
自我介紹
談?wù)勛约合胱龅囊粋€方向(面試官詳細(xì)的給我介紹了數(shù)據(jù)相關(guān)的一個體系)
掌握的技術(shù),做過實時的項目嗎?(回答沒有,但了解一點(diǎn))
了解實時相關(guān)技術(shù)的程度?
項目中數(shù)據(jù)可靠性怎么驗證的?
項目中有遇到什么問題嗎?如何排查解決的
目任務(wù)調(diào)度?
場景題:真實線上可能有很多任務(wù),若有任務(wù)未按時間產(chǎn)出如何排查解決?
使用過調(diào)度工具嗎?
你覺得如何來對數(shù)據(jù)產(chǎn)出進(jìn)行評估(大致是這個意思,我可能描述不是很準(zhǔn)確)
sql
給定一張表 event_id,user_id,timestamp
- 若相鄰時間差在10分鐘之內(nèi),則屬于同一個session,求每條數(shù)據(jù)的session_id
- 基于1,求路徑。例如,001,2,2025-09-08,1;002,2,2025-09-09,1;
需要輸出001,2,2025-09-08,1,001;002,2,2025-09-09,1,001:002;
第二題沒撕出來,但是跟面試官說了一個思路,后面搜了下思路是對的。但是面試官讓我再想一種辦法,沒想出來
反問:
部門業(yè)務(wù)的開發(fā)流程
面試表現(xiàn)有哪些不足的(面試官又幫我分析了下,還教我如何去學(xué)習(xí)相關(guān)知識)
面試官都很好,二面面試官還幫我梳理學(xué)習(xí)路線,未來的職業(yè)規(guī)劃等
面完可能一小時左右,通知面試通過,問是否接受offer
4.2 下午發(fā)offer
無實習(xí)四非能有offer已經(jīng)很滿足了,順便問一下有沒有也是4.8號入職的朋友