【大模型專項(xiàng)】異構(gòu)大模型推理優(yōu)化工程師
30000-60000元
北京
應(yīng)屆畢業(yè)生
本科



- 全勤獎(jiǎng)
- 節(jié)日福利
- 不加班
- 周末雙休
職位描述

職位描述:參與內(nèi)部異構(gòu)大模型推理引擎優(yōu)化,支持大模型推理各種優(yōu)化技術(shù)在異構(gòu)硬件上的落地。包括但不限于:
1、參與日常推理引擎的優(yōu)化開發(fā),不斷優(yōu)化大模型業(yè)務(wù)在對(duì)應(yīng)硬件上的TTFT、TPOT等指標(biāo);關(guān)注業(yè)界最佳實(shí)踐,能將業(yè)界最佳實(shí)踐落地到內(nèi)部的引擎優(yōu)化中;
2、完成各種大模型推理所需的功能性開發(fā)任務(wù);
3、參與支持日常的大模型推理服務(wù)部署,參與內(nèi)部日常提效工具的研發(fā)。
任職要求:1、有扎實(shí)的C 工程基礎(chǔ);
2、有大模型相關(guān)訓(xùn)練或推理優(yōu)化經(jīng)驗(yàn);有vLLM、TensorRT-LLM、MLC-LLM 等框架之一的實(shí)踐經(jīng)驗(yàn);熟悉LLM infer 相關(guān)技術(shù)棧,熟悉TP/PP/DP等分布式通信原理等;
3、熟悉CUDA 或 ROCM,熟悉Nsight System/ Nsight Compute 工具的使用,有 GPU 或 ASIC 高性能算子開發(fā)經(jīng)驗(yàn);
4、了解AI infra 整體技術(shù)棧需求,有訓(xùn)練框架或推理框架實(shí)戰(zhàn)經(jīng)驗(yàn)、熟悉TensorRT、TVM 等框架的使用、有二次開發(fā)能力或開源社區(qū)貢獻(xiàn)經(jīng)歷更佳。
工作地點(diǎn)
地址:北京海淀區(qū)北京-海淀區(qū)上地西路6號(hào)快手總部


職位發(fā)布者
HR
北京快手科技有限公司


-
計(jì)算機(jī)軟件
-
1000人以上
-
私營(yíng)·民營(yíng)企業(yè)
-
北京市海淀區(qū)上地西路6號(hào)1幢1層101 D1-10
相似職位
-
電話催收【長(zhǎng)春】 面議應(yīng)屆畢業(yè)生 不限深圳萬科祥盈管理服務(wù)有限公司沈陽分公司
-
財(cái)務(wù)核算組長(zhǎng) 5000-8000元應(yīng)屆畢業(yè)生 本科長(zhǎng)春華美利達(dá)貿(mào)易有限公司
-
釀酒師 9000-15000元應(yīng)屆畢業(yè)生 本科吉林省福澤醫(yī)藥有限公司
-
Manufacturing Engineer 面議應(yīng)屆畢業(yè)生 不限大陸汽車電子(長(zhǎng)春)有限公司
-
審方藥師 面議應(yīng)屆畢業(yè)生 不限國(guó)藥控股吉林有限公司
-
藥企藥品質(zhì)量管理員 面議應(yīng)屆畢業(yè)生 不限國(guó)藥控股吉林有限公司