幾周速通大模型實習,你需要做什么?
我通過??唾嵙艘话砥?,整整5塊,然后一直沒到賬,然后發(fā)現(xiàn)人家放假了,今天到了之后買了吃掉,已經變成葡萄糖了。
那么我也是順利收下幾家offer了,沒學多久,今天給一下具體路線,求別私信我(真想問問題,直接把問題寫上去留個微信,動不動彈出來紅點點,你總會去點他的。。),然后東西都是你感興趣才能去做,你肯定難以接受一天爽學10幾個小時。同時五一假期還不出門,連續(xù)5天高強度琢磨新玩意,所謂欲戴王冠,必承其重你知道的,光是走馬觀花肯定很困難。我給出你具體思路還是比較重要的。
首先確定走這一行,我的話有兩年開發(fā)經驗,有實習經驗,然后直接轉行,本身就有基礎,計算機的知識是有遷移性質的。
我先講講大模型ai應用開發(fā)學什么吧,首選python語言->python框架(langchain,langgraph),這個東西就算比較新的了,然后flask框架搞搞,fastapi搞搞,差不多了,大膽沖,現(xiàn)在就是10年前的互聯(lián)網,大模型接入應用層搞就對了。
大模型NLP,LLM微調,要學什么,這個魚書,花書你看看,強化學習你看看,然后我先前寫了怎么跑模型,你去試試,
裝個cuda,用GPU,跑跑PT,SFT,混合損失函數(shù),RL,DPO,差不多了,來加上個RAG,RAG調優(yōu),MCP來一個,數(shù)據(jù)集下載人家的這會大概率不夠用了,怎么辦,學一下數(shù)據(jù)清洗,召回,檢索,怎么強制過濾,之類的那么微調的學的差不多了,搞兩個開源模型開源項目,然后pytorch,transformer架構一寫就直接沖,
然后是論文復現(xiàn),量化模型,這個東西首先學歷少說你來個9嘛,不是9那怎么著也得有個QS100,這種公司比如九坤,幻方之類的,人少,里面我可以說沒一個差的,基本上都是大佬,有了學歷不夠,CCF-A之類的頂會的一二作,你整一手,那么大概有去面試的資格,里面會涉及到數(shù)學公式了,類似這樣:貝爾曼方程(具體的不解釋,因為你看懂了沒什么屁用,快去刷抖音),
有幸面過一個公司,(四位面試官,同時面試,來自哈工大,加利福尼亞大學,港科技大學,清華大學,很友好,但是技術不夠,直接被打傻了,問些聽都沒聽過),這種進去的話,工資挺不錯,大概是60w-300w不等,幻方也就這個價,除了字節(jié)頭部高管,基本上鮮有年薪千萬的,很感謝你看到這里,但是我推薦各位去試試,有詳細的資料后面看看會不會發(fā),上一期才100觀看,打字都打了兩小時,一度以為被限流了,后面琢磨人家是出去玩了,后面回來再emo??
最后放些圖給各位增加些信心吧,如果有人看,我就接著寫,后面我的agent會全平臺發(fā)布,你在那個平臺上都能看到我寫的教程。