欧美1区2区3区激情无套,两个女人互添下身视频在线观看,久久av无码精品人妻系列,久久精品噜噜噜成人,末发育娇小性色xxxx

作業(yè)幫+閱文筆試~數(shù)倉/數(shù)據(jù)開發(fā)

#數(shù)據(jù)人的面試交流地##實習進度記錄##數(shù)據(jù)人的面試交流地#作業(yè)幫時間是隨機的,今天下午測的。作業(yè)幫是10道選擇題加2到算法題:
選擇題:考了數(shù)據(jù)結(jié)構(gòu)排序二叉樹,linux命令:awk '$NF' test 這里的test是一個有多行數(shù)據(jù)的文件,這命令是輸出該文件末行的內(nèi)容。還考了mapreduce優(yōu)化數(shù)據(jù)傾斜的辦法這里我好像選錯了有兩個選項一個是把count(distinct ) 替換為sum()group by 還有是將小文件先保存到內(nèi)存中這兩個好像是對的都可以優(yōu)化數(shù)據(jù)傾斜此問題。還考了Flink的一些特性不過我還沒學過flink,還考了kafka的高性能和低性能的一些問題,這我也是一臉懵。還考了六個盤的漢洛塔要移動幾次才通過。然后是算法題,第一個是簡單的二分查找,不過我只通過了94%,后面看估計是我對左右指針移動還是有點問題。第二個是leetcode32題,最長有效括號,可惜了我兩個月前還寫過但是還是沒寫對,只通過了63%。也不知道能不能過。
閱文(寄了,以為是8.30考沒想到是8.30結(jié)束結(jié)果只寫了20分鐘):
這好像是前面是單選題,中間是不定項,后面是問答題
單選題:考了hive內(nèi)置函數(shù),考了hive與spark的對比,hadoop節(jié)點默認備份是多少~(還考了斗破蒼穹的主角是誰雖然我沒看過印像中好像叫蕭炎)
不定項:有mysql中delete,drop和truncate這三者的區(qū)別特點(我對truncate完全沒印象),還考了flink的一些知識。
問答題:第一個是mapredce工作流程這個還好,第二個是如何解決spark數(shù)據(jù)傾斜的方法。這里時間不夠了我一點沒寫,也沒多少印象。這里我現(xiàn)在寫一下加深點印象
1.可以增加隨機前綴或后綴:來打散數(shù)據(jù)分布,在后繼計算中去除前后綴從而負載均衡
2.廣播小表,如果是原因是小表與大表join可以將小表廣播到每個節(jié)點,避免產(chǎn)生數(shù)據(jù)傾斜。
3.salting方法:為傾斜數(shù)據(jù)填加鹽值,打散傾斜數(shù)據(jù)
4.分區(qū)策略調(diào)整:通過自定義分區(qū)器或者合理選擇內(nèi)置分區(qū)器來均勻分布數(shù)據(jù)
5.增大并行度:針對只有少量數(shù)據(jù)造成的傾斜任務,增加并行度可以更快地處理這些小任務
6.數(shù)據(jù)預處理:合并一些小文件,fliter操作等
第三四個就是寫sql語句,第三個挺簡單的就是第四題來不及看了。ok就是這些了,預祝大家都能找到自己想要的工作實現(xiàn),我還是繼續(xù)去沉淀去了,這一個月也不知道自己在忙些啥好像就是一直在刷算法題和sql題,八股都沒怎么看,對組件的掌握還是太淺了。#實習##數(shù)據(jù)開發(fā)工程師實習##暑期實習加油##牛客AI配圖神器#
全部評論

相關(guān)推薦

1. 基本情況方向:數(shù)據(jù)工程,時間:40分鐘結(jié)束、16:00開始,無手撕,多場景2. 自我介紹3. 一些能夠回憶起來的(或許有不正確的地方):(1)提問R:你這個項目是課程作業(yè)還是什么?R:那你說說Hive和ClickHouseR:你談到了OLAP,那和OLTP有啥區(qū)別?R:沒了?ClickHouse適合那種場景?R:可以用作實時數(shù)倉嗎?R:課程中有數(shù)據(jù)庫相關(guān)的嗎?只有數(shù)據(jù)結(jié)構(gòu)與算法?R:MySQL系統(tǒng)學習過嗎?R:數(shù)據(jù)怎么導入到ClickHouse的?R:直接到ClickHouse?R:數(shù)倉分層?四層講講。R:那為什么要分層呢?DWS已經(jīng)差不多了為什么還需要ADS呢?R:場景題:在你的表上新...
牛客861513826號:A場景題:數(shù)量統(tǒng)計不說了;退貨平均時間:先溝通清楚,月平均退貨時間算不算上不退貨的用戶,不算的話,就只計算退貨用戶;一個用戶的退貨時間減去到貨時間拿到這件商品的退貨時間,然后計算每個退貨用戶的退貨時間,AVG開窗partition by月份,計算出每個月的平均退貨時間。如果要算上不退貨的用戶,也就是讓這個用戶的退貨時間是0,然后對所有用戶計算AVG同上。 B場景題:結(jié)合下面他提示你再想想數(shù)據(jù)傾斜,其實這道題是想靠你數(shù)據(jù)傾斜怎么解決;本來是一個商品購買信息表,記錄商品信息和購買者信息,如果給購買者信息加上性別,要求算出每個商品不同性別的購買人數(shù)。百分之八十女性用戶,所以如果單純對表進行分組聚合,會產(chǎn)生數(shù)據(jù)傾斜問題,由分組聚合產(chǎn)生。五種辦法可以解決,兩種hive參數(shù),三種SQL,往SQL方向聊,以防他追問參數(shù)底層,參數(shù)這種東西最難聊了,別給自己挖坑
點贊 評論 收藏
分享
評論
點贊
2
分享

創(chuàng)作者周榜

更多
牛客網(wǎng)
??推髽I(yè)服務