職位描述
該職位已進行加V認證,請放心投遞
1. 參與滴滴機器學習訓練框架、推理框架的設計與研發,服務于內部各個產品線;
2. 參與機器學習分布式訓練,多卡推理框架等底層組件的抽象與設計,包括訓練框架優化,分布式網絡優化等;
3. 支持大模型在滴滴內部場景的業務落地。
任職資格:
1. 熟練掌握linux環境下的c/c++與python語言;
2. 熟練掌握至少一種機器學習框架(tensorflow / pytorch / mxnet 或其他自研框架)并熟悉設計思路及工作原理;
3. 有以下至少一項的背景知識與經驗:cuda編程,nccl,編譯器,高性能網絡,并行計算,集群調度;
4. 熟悉deepspeed、megatronlm等分布式訓練框架者優先;
5. 有軟硬件聯合設計的經驗,能使用數學工具分析深度學習訓練中的優化算法優先;
6. 有大模型訓練推理調優經驗優先。
工作地點
地址:北京海淀區北京-海淀區弘源·新時代
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。
職位發布者
HR
北京小桔科技有限公司
- 交通·運輸·物流
- 1000人以上
- 股份制企業
- 北京市海淀區東北旺西路8號院35號樓5層501室