欧美1区2区3区激情无套,两个女人互添下身视频在线观看,久久av无码精品人妻系列,久久精品噜噜噜成人,末发育娇小性色xxxx

騰訊/百度/minimax 大模型算法面經(jīng)總結(jié)帖

騰訊NLP
1.跨模態(tài)對(duì)齊有哪些方式?為何逐漸不使用Q-Former?
2. Baichuan2 - 7B模型架構(gòu)是怎樣的?其位置編碼如何實(shí)現(xiàn)?與Qwen家的位置編碼實(shí)現(xiàn)有何不同?
3. 了解Qwen - VL嗎?其架構(gòu)如何?有何獨(dú)特之處?
4. Adapter、P - tuning和Lora之間的區(qū)別與聯(lián)系是什么?
5. 數(shù)據(jù)集如何構(gòu)建與評(píng)測(cè)?
6. 數(shù)據(jù)集評(píng)估過(guò)程中遇到哪些困難?如何解決?
7. RAG檢索內(nèi)容是否相關(guān)?有無(wú)進(jìn)行Rerank或其他操作?
8. 對(duì)Agent有何看法?
9. 了解強(qiáng)化學(xué)習(xí)DPO嗎?與PPO有何區(qū)別?有什么好處?
10. 談一談大模型完整訓(xùn)練過(guò)程及每一階段的作用。

混元大模型團(tuán)隊(duì)
1.Qwen 和 DeepSeek 有什么區(qū)別?
2.為何大家都開(kāi)始探索 MoE 架構(gòu)?MoE 相比 Dense 有什么好處?
3.用 LoRA 微調(diào)過(guò) Qwen,是否全量微調(diào)過(guò)??jī)烧咝阅鼙憩F(xiàn)有何對(duì)比?
4.用 DeepSpeed 微調(diào)過(guò) Qwen2 - 72B,ZeRO - 1、ZeRO - 2、ZeRO - 3 三個(gè)模式的區(qū)別是什么?用 DeepSpeed ZeRO - 3 微調(diào) Qwen2 - 72B 時(shí),每一張卡占用顯存大概是多少?為什么?
5.除了 DeepSpeed,還用過(guò)哪些優(yōu)化方法?
6.知道 LoRA 的原理嗎?A 和 B 兩個(gè)矩陣怎么初始化?了解過(guò)其他初始化方法嗎?
7.講一下大模型訓(xùn)練和推理的流程,SFT 和 RLHF 的作用分別是什么?
8.在 RLHF 中,目前主流的強(qiáng)化學(xué)習(xí)算法有哪幾個(gè)?寫出損失函數(shù)的表達(dá)式。
9.對(duì) RLHF 了解多少?講一下 RLHF 的流程。之前有用 RLHF 做過(guò)模型對(duì)齊嗎?在做對(duì)齊時(shí),為什么 SFT 之后還要做 RLHF?只用 SFT 可以嗎?
10.知道哪些強(qiáng)化學(xué)習(xí)算法?除了 PPO 和 DPO,DeepSeek 用的 GRPO 相比于 GPT 的 PPO 做了哪些改進(jìn)?
11.微調(diào) Qwen 時(shí),數(shù)據(jù)是怎么構(gòu)造的?有用到什么數(shù)據(jù)清洗方法?數(shù)據(jù)配比是怎么做的?

CSIG騰訊地圖
1. 進(jìn)行自我介紹,聊簡(jiǎn)歷上和大模型相關(guān)的項(xiàng)目(約5分鐘)。
2. 講一下LORA的基本原理。
3. 了解主流的開(kāi)源大模型嗎?如Llama、Qwen、deepseek。
4. 對(duì)Python的熟悉程度如何,能用pytorch寫一下多頭注意力機(jī)制嗎?
5. C++的代碼能力情況(較隨意聊) 。
6. 手撕代碼:反轉(zhuǎn)鏈表和合并有序鏈表。
7. 反問(wèn)問(wèn)題:
    - 騰訊地圖做的大模型應(yīng)用是什么?
    - 對(duì)Manus的看法是什么? 

百度文心一言
1. PPO 與 GRPO 的區(qū)別,分別介紹它們的優(yōu)勢(shì)與缺點(diǎn)。
2.DPO 對(duì)齊訓(xùn)練的曲線是怎么樣的,正例的概率會(huì)提升嗎?參考這個(gè)知乎回答。
3.Deepseek - R1 里面不僅推理能力很好,而且文采能力也很好,這是個(gè)開(kāi)放問(wèn)題,如何讓模型的文采能力也很好呢?
4.deepseed 介紹。
5.deepspeed 的每一段的通信比較,zero3 分別是 0 和 2 的多少倍,1.5 倍。
6.DPO 如何解決回答過(guò)長(zhǎng)的問(wèn)題,除了正則。
7.開(kāi)放問(wèn)題:為什么現(xiàn)在大家都在關(guān)注于大模型的推理能力 reasoning。
8.對(duì)于一個(gè) base model 如何增強(qiáng)大模型的 reasoning 能力。
9.DPO 除了長(zhǎng)度問(wèn)題還有其他的問(wèn)題嗎?與問(wèn)題 2 對(duì)應(yīng),reward hacking?都沒(méi)有獎(jiǎng)勵(lì)模型了。
10.說(shuō)一下 simpo 的原理,它是怎么解決 dpo 微調(diào)序列過(guò)長(zhǎng)的問(wèn)題的。

minimax
1.大模型算法中模型參數(shù)量每個(gè)部分有多少?
2.你了解哪些評(píng)估 minimax 大模型算法的手段?
3.如何評(píng)估 minimax 大模型算法中多模態(tài)模型的輸出質(zhì)量?
4.對(duì)于 minimax 大模型算法的數(shù)據(jù)集,如何提高質(zhì)量?如何利用 gpt 輔助提升數(shù)據(jù)集質(zhì)量?
5.有哪些方法可以提升 minimax 大模型算法中預(yù)訓(xùn)練模型的質(zhì)量?
全部評(píng)論
mark一下大佬
點(diǎn)贊 回復(fù) 分享
發(fā)布于 04-08 20:50 北京
mark一下大佬
點(diǎn)贊 回復(fù) 分享
發(fā)布于 03-27 14:11 天津
8.在 RLHF 中,寫出損失函數(shù)的表達(dá)式。 在紙上寫??
點(diǎn)贊 回復(fù) 分享
發(fā)布于 03-27 11:23 遼寧
4.用 DeepSpeed 微調(diào)過(guò) Qwen2 - 72B,ZeRO - 1、ZeRO - 2、ZeRO - 3 三個(gè)模式的區(qū)別是什么?用 DeepSpeed ZeRO - 3 微調(diào) Qwen2 - 72B 時(shí),每一張卡占用顯存大概是多少?為什么? 這個(gè)問(wèn)題怎么答?。扛杏X(jué)一直都搞不懂
點(diǎn)贊 回復(fù) 分享
發(fā)布于 03-22 14:20 北京
有難度的,感謝分享!
點(diǎn)贊 回復(fù) 分享
發(fā)布于 03-22 10:21 美國(guó)
mark一下大佬
點(diǎn)贊 回復(fù) 分享
發(fā)布于 03-21 23:20 廣東

相關(guān)推薦

補(bǔ)發(fā)一下之前面試騰訊的面經(jīng),具體timeline可以參考前面的帖子。一面(約30mins):自我介紹,挑一個(gè)簡(jiǎn)歷里最好的一個(gè)項(xiàng)目詳細(xì)介紹下項(xiàng)目中遇到了什么挑戰(zhàn),怎么解決的了解DeepSeek嗎,為什么DeepSeek現(xiàn)在這么火?說(shuō)一下DeepSeek里的MLA和GRPOGRPO和DPO,PPO,RLHF的區(qū)別看你之前有LoRA微調(diào)DeepSeek的項(xiàng)目,簡(jiǎn)單說(shuō)說(shuō)微調(diào)經(jīng)驗(yàn),效果如何RAG在檢索階段能有哪些優(yōu)化?(sub-query,HyDE等)二面(約1h10mins):自我介紹,拷打簡(jiǎn)歷。寫一下GRPO的公式先屏幕共享從頭到尾walk through講一下DeepSeek技術(shù)報(bào)告論文。面試官中間會(huì)穿插提問(wèn)DeepSeek-v3/r1/r1-zero有什么區(qū)別DeepSeek-r1-zero的冷啟動(dòng)數(shù)據(jù)是怎么組成的DeepSeek-r1-zero解決了DeepSeek-r1的哪些問(wèn)題如何解決大模型的幻覺(jué)Embedding如何微調(diào)(講了對(duì)比學(xué)習(xí)啥的)RAG的評(píng)測(cè)指標(biāo)有哪些業(yè)界現(xiàn)在function call的做法和水平場(chǎng)景題:大致是RAG中檢索結(jié)果遇到張冠李戴的問(wèn)題該如何解決舉幾個(gè)例子能夠體現(xiàn)你的研究能力三面(約30mins)拷打LoRA微調(diào)項(xiàng)目,問(wèn)了實(shí)驗(yàn)的數(shù)據(jù)集,參數(shù)設(shè)置,結(jié)果如何等等你目前的研究方向主要是什么?講一下ReRanker的目的,做法有哪些場(chǎng)景題:我現(xiàn)在運(yùn)用RAG來(lái)檢索回答,目標(biāo)是檢索四個(gè)季度的表格數(shù)據(jù),但是經(jīng)過(guò)檢索+ReRanker后只出現(xiàn)了三個(gè)季度的數(shù)據(jù),該如何解決hr面(約15mins)比較常規(guī),大致如下:用三個(gè)詞語(yǔ)描述下你為何能勝任這份工作你的優(yōu)缺點(diǎn)都說(shuō)一下你過(guò)往實(shí)習(xí)項(xiàng)目中遇到過(guò)的最大困難是什么,怎么解決的最早實(shí)習(xí)時(shí)間,實(shí)習(xí)時(shí)常引流:騰訊字節(jié)阿里淘天美團(tuán)拼多多#暑期實(shí)習(xí)##騰訊##大模型#
Rafae1:接好運(yùn)
查看27道真題和解析
點(diǎn)贊 評(píng)論 收藏
分享
結(jié)合最近輔助修改的簡(jiǎn)歷及項(xiàng)目,老師總結(jié)了部分大模型微調(diào)簡(jiǎn)歷的踩雷點(diǎn)。???♂?錯(cuò)誤示范:在 x任務(wù)中,獲取 xxx 條數(shù)據(jù),通過(guò)規(guī)則 or 腳本清洗出 x 條數(shù)據(jù),然后微調(diào) y 大模型,在業(yè)務(wù)上提升 x 個(gè)點(diǎn)。???原因:大模型微調(diào)的平臺(tái)是現(xiàn)成的,基模是現(xiàn)成的,體現(xiàn)不出核心能力。?應(yīng)該怎么寫?首先介紹業(yè)務(wù)背景:業(yè)務(wù)是一個(gè)銷售對(duì)話業(yè)務(wù),機(jī)器人是銷售,代替真人,直接面對(duì)用戶。我們會(huì)給模型設(shè)定任務(wù),任務(wù)是 prompt 。步驟1??.提取訓(xùn)練數(shù)據(jù)問(wèn)題:1.真人通話每通電話任務(wù)是未知的,我們訓(xùn)練數(shù)據(jù)是任務(wù)+通話的 pair 對(duì)。2.真人通話很亂,與客戶的對(duì)話是各種交叉的,導(dǎo)致 asr 后并不是一人一輪。解決方案:1.首先通過(guò)大模型 prompt 對(duì)該通電話提取任務(wù),得到任務(wù)+ pair 對(duì)。需要用到 cot + reflection +多 Ilm 一致性+ debating 的模式。2.使用大模型根據(jù)以上任務(wù)和真人對(duì)話,讓大模型編寫出通話內(nèi)容。提問(wèn),為什么要編寫而不是直接用?步驟2??.制定訓(xùn)練數(shù)據(jù)集問(wèn)題:1、正常的對(duì)話內(nèi)容,前面幾句和后面幾句基本上一致的。都是問(wèn)候和拜拜,但是也有一些差異。2、因?yàn)槎际窍嗨茍?chǎng)景,雖然任務(wù)不同,但是很多場(chǎng)景語(yǔ)義很相似。解決方案:1、基于輪次的權(quán)重采樣:通過(guò)輪次設(shè)定權(quán)重進(jìn)行 weighting sample 。解決問(wèn)候和拜拜的高占比問(wèn)題。2、基于語(yǔ)義的采樣:使用 bert 對(duì)對(duì)話內(nèi)容進(jìn)行 embedding ,然后使用層次聚類通過(guò)調(diào)節(jié)閾值聚類出相似語(yǔ)義的類。對(duì)一個(gè)類里的樣本進(jìn)行隨機(jī)采樣,提問(wèn),為什么要對(duì)重復(fù)語(yǔ)義的數(shù)據(jù)進(jìn)行下采樣?3、基于客戶類型和產(chǎn)品的采樣,因?yàn)楹芏喈a(chǎn)品是熱品,導(dǎo)致對(duì)話內(nèi)容有偏,用戶類型一樣,需按照類型調(diào)整整體比例采樣。提問(wèn),為什么要這么采樣?步驟3??.制定訓(xùn)練數(shù)據(jù)集我們直接把輸出當(dāng)作 target 進(jìn)行訓(xùn)練。使用的 lora 訓(xùn)練,但是 lora alpha 設(shè)定成為4倍的時(shí)候達(dá)到了比較好的效果,經(jīng)驗(yàn)值不同任務(wù)不一樣,提問(wèn),在各種情況下要怎么調(diào)?步驟4??.dpo訓(xùn)練問(wèn)題:v1版本訓(xùn)練時(shí),很多輸出內(nèi)容是對(duì)的,但是輸出的語(yǔ)氣不太像真人,機(jī)器人味還是很嚴(yán)重。解決方案:由于訓(xùn)練本身是有 ground truth 的,因此使用v1訓(xùn)練的模型,預(yù)測(cè)訓(xùn)練集,使用大模型對(duì)比兩者語(yǔ)氣不符合訓(xùn)練集的拿出來(lái),使用訓(xùn)練集的 ground truth 和模型的預(yù)測(cè)數(shù)據(jù)作為 dpo 訓(xùn)練對(duì),對(duì)v1版本模型重新訓(xùn)練。??這里老師只是簡(jiǎn)要進(jìn)行概括解答,具體情況和詳細(xì)解答可以咨詢輔導(dǎo),如果想了解項(xiàng)目輔導(dǎo),提升面試能力,歡迎后臺(tái)聯(lián)系。#算法# #簡(jiǎn)歷中的項(xiàng)目經(jīng)歷要怎么寫# #算法崗面試# #互聯(lián)網(wǎng)大廠招聘#
點(diǎn)贊 評(píng)論 收藏
分享
評(píng)論
13
106
分享

創(chuàng)作者周榜

更多
牛客網(wǎng)
??推髽I(yè)服務(wù)