timeline:2月10日一面2月13日二面(leader面)2月14日三面2月24日四面(hr面)2月25日談薪,口頭offer(跟hr提了幾天時間考慮要不要接)面試提問的一些大概問題(針對項目的問題略過。。。):能說一下reduce類算子有哪些優(yōu)化方案嗎?對于reduce類算子,考慮shape為[M, N],對于M非常大怎么優(yōu)化?對于N非常大怎么優(yōu)化?了解sglang和vllm嗎?vllm采用了哪些優(yōu)化方案?PageAttention的實現(xiàn)思路是怎樣的?vllm你覺得哪些方面可以進(jìn)一步優(yōu)化?說說flashattention的原理openMP外層循環(huán)開了四個線程,在內(nèi)層循環(huán)可以開大于四個線...