欧美1区2区3区激情无套,两个女人互添下身视频在线观看,久久av无码精品人妻系列,久久精品噜噜噜成人,末发育娇小性色xxxx

大佬好強(qiáng),這個sql題好有意思啊,我有些自己的理解:給每個k分組,然后對每個組求出距離。難點在于怎么把k分組,所以可以用打斷點的方式計算(面試官的思路),拐點打斷點,后面累加就完成了分組,然后對每個分組求距離,比大小。 但是大佬你這里用排名函數(shù)的思路我覺得有點漏洞,group by之后會去重,這樣只能算出哪一組k最多,雖然這一組k最多,但是不一定這組k的距離就是最大啊。比如k1有4條,k2有5條,group by之后把k2拿了出來進(jìn)行計算距離,但是如果k1這四條走的都是對角線斜邊,而k2這5條走的都是x直角邊,這個大小是不是就不好判斷了,k1的4條斜邊走的距離可能比k2的5條直角邊還長。所以是不是要對每一組都進(jìn)行距離計算,而不是group by把最多那個k拿出來單獨算?
1 1

相關(guān)推薦

1. 基本情況方向:數(shù)據(jù)工程,時間:40分鐘結(jié)束、16:00開始,無手撕,多場景2. 自我介紹3. 一些能夠回憶起來的(或許有不正確的地方):(1)提問R:你這個項目是課程作業(yè)還是什么?R:那你說說Hive和ClickHouseR:你談到了OLAP,那和OLTP有啥區(qū)別?R:沒了?ClickHouse適合那種場景?R:可以用作實時數(shù)倉嗎?R:課程中有數(shù)據(jù)庫相關(guān)的嗎?只有數(shù)據(jù)結(jié)構(gòu)與算法?R:MySQL系統(tǒng)學(xué)習(xí)過嗎?R:數(shù)據(jù)怎么導(dǎo)入到ClickHouse的?R:直接到ClickHouse?R:數(shù)倉分層?四層講講。R:那為什么要分層呢?DWS已經(jīng)差不多了為什么還需要ADS呢?R:場景題:在你的表上新...
牛客861513826號:A場景題:數(shù)量統(tǒng)計不說了;退貨平均時間:先溝通清楚,月平均退貨時間算不算上不退貨的用戶,不算的話,就只計算退貨用戶;一個用戶的退貨時間減去到貨時間拿到這件商品的退貨時間,然后計算每個退貨用戶的退貨時間,AVG開窗partition by月份,計算出每個月的平均退貨時間。如果要算上不退貨的用戶,也就是讓這個用戶的退貨時間是0,然后對所有用戶計算AVG同上。 B場景題:結(jié)合下面他提示你再想想數(shù)據(jù)傾斜,其實這道題是想靠你數(shù)據(jù)傾斜怎么解決;本來是一個商品購買信息表,記錄商品信息和購買者信息,如果給購買者信息加上性別,要求算出每個商品不同性別的購買人數(shù)。百分之八十女性用戶,所以如果單純對表進(jìn)行分組聚合,會產(chǎn)生數(shù)據(jù)傾斜問題,由分組聚合產(chǎn)生。五種辦法可以解決,兩種hive參數(shù),三種SQL,往SQL方向聊,以防他追問參數(shù)底層,參數(shù)這種東西最難聊了,別給自己挖坑
點贊 評論 收藏
分享
#數(shù)據(jù)人的面試交流地##實習(xí)進(jìn)度記錄##數(shù)據(jù)人的面試交流地#作業(yè)幫時間是隨機(jī)的,今天下午測的。作業(yè)幫是10道選擇題加2到算法題:選擇題:考了數(shù)據(jù)結(jié)構(gòu)排序二叉樹,linux命令:awk '$NF' test 這里的test是一個有多行數(shù)據(jù)的文件,這命令是輸出該文件末行的內(nèi)容。還考了mapreduce優(yōu)化數(shù)據(jù)傾斜的辦法這里我好像選錯了有兩個選項一個是把count(distinct ) 替換為sum()group by 還有是將小文件先保存到內(nèi)存中這兩個好像是對的都可以優(yōu)化數(shù)據(jù)傾斜此問題。還考了Flink的一些特性不過我還沒學(xué)過flink,還考了kafka的高性能和低性能的一些問題,這我也是一臉懵。還考了六個盤的漢洛塔要移動幾次才通過。然后是算法題,第一個是簡單的二分查找,不過我只通過了94%,后面看估計是我對左右指針移動還是有點問題。第二個是leetcode32題,最長有效括號,可惜了我兩個月前還寫過但是還是沒寫對,只通過了63%。也不知道能不能過。閱文(寄了,以為是8.30考沒想到是8.30結(jié)束結(jié)果只寫了20分鐘):這好像是前面是單選題,中間是不定項,后面是問答題單選題:考了hive內(nèi)置函數(shù),考了hive與spark的對比,hadoop節(jié)點默認(rèn)備份是多少~(還考了斗破蒼穹的主角是誰雖然我沒看過印像中好像叫蕭炎)不定項:有mysql中delete,drop和truncate這三者的區(qū)別特點(我對truncate完全沒印象),還考了flink的一些知識。問答題:第一個是mapredce工作流程這個還好,第二個是如何解決spark數(shù)據(jù)傾斜的方法。這里時間不夠了我一點沒寫,也沒多少印象。這里我現(xiàn)在寫一下加深點印象1.可以增加隨機(jī)前綴或后綴:來打散數(shù)據(jù)分布,在后繼計算中去除前后綴從而負(fù)載均衡2.廣播小表,如果是原因是小表與大表join可以將小表廣播到每個節(jié)點,避免產(chǎn)生數(shù)據(jù)傾斜。3.salting方法:為傾斜數(shù)據(jù)填加鹽值,打散傾斜數(shù)據(jù)4.分區(qū)策略調(diào)整:通過自定義分區(qū)器或者合理選擇內(nèi)置分區(qū)器來均勻分布數(shù)據(jù)5.增大并行度:針對只有少量數(shù)據(jù)造成的傾斜任務(wù),增加并行度可以更快地處理這些小任務(wù)6.數(shù)據(jù)預(yù)處理:合并一些小文件,fliter操作等第三四個就是寫sql語句,第三個挺簡單的就是第四題來不及看了。ok就是這些了,預(yù)祝大家都能找到自己想要的工作實現(xiàn),我還是繼續(xù)去沉淀去了,這一個月也不知道自己在忙些啥好像就是一直在刷算法題和sql題,八股都沒怎么看,對組件的掌握還是太淺了。#實習(xí)##數(shù)據(jù)開發(fā)工程師實習(xí)##暑期實習(xí)加油##??虯I配圖神器#
查看14道真題和解析 投遞閱文集團(tuán)等公司6個崗位 數(shù)據(jù)人的面試交流地
點贊 評論 收藏
分享
??途W(wǎng)
??推髽I(yè)服務(wù)