- 深度學習
- 模型加速/性能優(yōu)化
- C/C++
- Python
- 分布式訓練
- 算法工程化經(jīng)驗
- GPU
- CUDA
- 訓練引擎
AML是公司的機器學習中臺,為推薦/廣告/搜索等業(yè)務提供推薦/廣告/CV/語音/NLP的訓練和推理系統(tǒng)。為公司內(nèi)業(yè)務部門提供強大的機器學習算力,并在這些業(yè)務的問題上研究一些具有通用性和創(chuàng)新性的算法。同時,也通過火山引擎將一些機器學習/推薦系統(tǒng)的核心能力提供給外部企業(yè)客戶。此外,AML還在AI for Science,科學計算等領域做一些前沿研究。
1、負責字節(jié)跳動 AML 機器學習訓練框架的研究與開發(fā),服務于全公司各個產(chǎn)品;
2、參與機器學習訓練框架底層組件的抽象,設計,優(yōu)化與落地;
3、與全公司算法部門深度合作,為重點項目進行算法與系統(tǒng)的聯(lián)合優(yōu)化。
職位要求
1、熟練掌握Linux環(huán)境下的C/C++與Python語言;
2、接觸過至少一種機器學習框架(Tensorflow / PyTorch / MxNet 或其他自研框架);
3、有以下至少一項的背景知識與經(jīng)驗:GPU編程,編譯器,高性能網(wǎng)絡,分布式存儲,集群調(diào)度;
4、具有獨立解決問題的能力,良好的團隊合作精神;
5、有強烈的工作責任心,較好的學習能力、溝通能力和自驅(qū)力;
6、有良好的工作文檔習慣,及時按要求撰寫更新工作流程及技術文檔。
加分項
1、深入研究過至少一種機器學習框架(Tensorflow / PyTorch / MxNet 或其他自研框架)的底層架構和機制;
2、熟悉至少一種經(jīng)典深度學習模型及其應用場景,如ResNet50,BERT,或者了解GAN,強化學習,圖神經(jīng)網(wǎng)絡,AutoML等;
3、有研究生或博士階段的計算機系統(tǒng)方向(包含分布式系統(tǒng),并行計算,編程語言與編譯器,網(wǎng)絡,存儲等)研究背景;
4、有軟硬件聯(lián)合設計的經(jīng)驗;
5、能使用數(shù)學工具分析深度學習訓練中的優(yōu)化算法。