幾周速通大模型實(shí)習(xí),你需要做什么?
我通過??唾嵙艘话砥?,整整5塊,然后一直沒到賬,然后發(fā)現(xiàn)人家放假了,今天到了之后買了吃掉,已經(jīng)變成葡萄糖了。
那么我也是順利收下幾家offer了,沒學(xué)多久,今天給一下具體路線,求別私信我(真想問問題,直接把問題寫上去留個(gè)微信,動(dòng)不動(dòng)彈出來紅點(diǎn)點(diǎn),你總會(huì)去點(diǎn)他的。。),然后東西都是你感興趣才能去做,你肯定難以接受一天爽學(xué)10幾個(gè)小時(shí)。同時(shí)五一假期還不出門,連續(xù)5天高強(qiáng)度琢磨新玩意,所謂欲戴王冠,必承其重你知道的,光是走馬觀花肯定很困難。我給出你具體思路還是比較重要的。
首先確定走這一行,我的話有兩年開發(fā)經(jīng)驗(yàn),有實(shí)習(xí)經(jīng)驗(yàn),然后直接轉(zhuǎn)行,本身就有基礎(chǔ),計(jì)算機(jī)的知識(shí)是有遷移性質(zhì)的。
我先講講大模型ai應(yīng)用開發(fā)學(xué)什么吧,首選python語(yǔ)言->python框架(langchain,langgraph),這個(gè)東西就算比較新的了,然后flask框架搞搞,fastapi搞搞,差不多了,大膽沖,現(xiàn)在就是10年前的互聯(lián)網(wǎng),大模型接入應(yīng)用層搞就對(duì)了。
大模型NLP,LLM微調(diào),要學(xué)什么,這個(gè)魚書,花書你看看,強(qiáng)化學(xué)習(xí)你看看,然后我先前寫了怎么跑模型,你去試試,
裝個(gè)cuda,用GPU,跑跑PT,SFT,混合損失函數(shù),RL,DPO,差不多了,來加上個(gè)RAG,RAG調(diào)優(yōu),MCP來一個(gè),數(shù)據(jù)集下載人家的這會(huì)大概率不夠用了,怎么辦,學(xué)一下數(shù)據(jù)清洗,召回,檢索,怎么強(qiáng)制過濾,之類的那么微調(diào)的學(xué)的差不多了,搞兩個(gè)開源模型開源項(xiàng)目,然后pytorch,transformer架構(gòu)一寫就直接沖,
然后是論文復(fù)現(xiàn),量化模型,這個(gè)東西首先學(xué)歷少說你來個(gè)9嘛,不是9那怎么著也得有個(gè)QS100,這種公司比如九坤,幻方之類的,人少,里面我可以說沒一個(gè)差的,基本上都是大佬,有了學(xué)歷不夠,CCF-A之類的頂會(huì)的一二作,你整一手,那么大概有去面試的資格,里面會(huì)涉及到數(shù)學(xué)公式了,類似這樣:貝爾曼方程(具體的不解釋,因?yàn)槟憧炊藳]什么屁用,快去刷抖音),
有幸面過一個(gè)公司,(四位面試官,同時(shí)面試,來自哈工大,加利福尼亞大學(xué),港科技大學(xué),清華大學(xué),很友好,但是技術(shù)不夠,直接被打傻了,問些聽都沒聽過),這種進(jìn)去的話,工資挺不錯(cuò),大概是60w-300w不等,幻方也就這個(gè)價(jià),除了字節(jié)頭部高管,基本上鮮有年薪千萬(wàn)的,很感謝你看到這里,但是我推薦各位去試試,有詳細(xì)的資料后面看看會(huì)不會(huì)發(fā),上一期才100觀看,打字都打了兩小時(shí),一度以為被限流了,后面琢磨人家是出去玩了,后面回來再emo??
最后放些圖給各位增加些信心吧,如果有人看,我就接著寫,后面我的agent會(huì)全平臺(tái)發(fā)布,你在那個(gè)平臺(tái)上都能看到我寫的教程。