職位描述
該職位已進行加V認證,請放心投遞
1. 參與滴滴機器學習訓練框架、推理框架的設計與研發(fā),服務于內(nèi)部各個產(chǎn)品線;
2. 參與機器學習分布式訓練,多卡推理框架等底層組件的抽象與設計,包括訓練框架優(yōu)化,分布式網(wǎng)絡優(yōu)化等;
3. 支持大模型在滴滴內(nèi)部場景的業(yè)務落地。
任職資格:
1. 熟練掌握linux環(huán)境下的c/c++與python語言;
2. 熟練掌握至少一種機器學習框架(tensorflow / pytorch / mxnet 或其他自研框架)并熟悉設計思路及工作原理;
3. 有以下至少一項的背景知識與經(jīng)驗:cuda編程,nccl,編譯器,高性能網(wǎng)絡,并行計算,集群調(diào)度;
4. 熟悉deepspeed、megatronlm等分布式訓練框架者優(yōu)先;
5. 有軟硬件聯(lián)合設計的經(jīng)驗,能使用數(shù)學工具分析深度學習訓練中的優(yōu)化算法優(yōu)先;
6. 有大模型訓練推理調(diào)優(yōu)經(jīng)驗優(yōu)先。
工作地點
地址:北京海淀區(qū)北京-海淀區(qū)弘源·新時代
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。
職位發(fā)布者
HR
北京小桔科技有限公司
- 交通·運輸·物流
- 1000人以上
- 股份制企業(yè)
- 北京市海淀區(qū)東北旺西路8號院35號樓5層501室