NLP算法面經(jīng)16
10.17 螞蟻 NLP (2+1)
1. 項(xiàng)目+實(shí)習(xí)
2. 強(qiáng)化學(xué)習(xí)的發(fā)展歷程
3. 多頭注意力書寫
4. Lora的優(yōu)勢(shì)
5. 對(duì)話的掩碼方式,其次是整體計(jì)算?
6. deepspeed zero123區(qū)別,有沒有看過顯存占用
7. grpo比dpo和ppo優(yōu)勢(shì)在哪?
8. MLA相比GQA的優(yōu)勢(shì)?
9. Agent的看法?
10. 跨模態(tài)處理的有效方法?
11. Qwen2-VL的框架介紹?
#大模型# #算法# #互聯(lián)網(wǎng)大廠# 面經(jīng) #nlp# 螞蟻 #阿里# #互聯(lián)網(wǎng)大廠實(shí)習(xí)#
1. 項(xiàng)目+實(shí)習(xí)
2. 強(qiáng)化學(xué)習(xí)的發(fā)展歷程
3. 多頭注意力書寫
4. Lora的優(yōu)勢(shì)
5. 對(duì)話的掩碼方式,其次是整體計(jì)算?
6. deepspeed zero123區(qū)別,有沒有看過顯存占用
7. grpo比dpo和ppo優(yōu)勢(shì)在哪?
8. MLA相比GQA的優(yōu)勢(shì)?
9. Agent的看法?
10. 跨模態(tài)處理的有效方法?
11. Qwen2-VL的框架介紹?
#大模型# #算法# #互聯(lián)網(wǎng)大廠# 面經(jīng) #nlp# 螞蟻 #阿里# #互聯(lián)網(wǎng)大廠實(shí)習(xí)#
全部評(píng)論
相關(guān)推薦

點(diǎn)贊 評(píng)論 收藏
分享