職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
工作職責
1. 負責大模型的訓練和迭代,包括數據清洗、微調、測試;
2. 結合業務場景微調大模型,提高模型在特定任務上的效果;
3. 負責多模態基座大模型的訓練和迭代,包括數據清洗、微調、測試;
4. 長期跟蹤顯示領域的具體場景與多模態大模型結合的業務場景;
任職資格
教育程度:碩士
工作經歷:
1.工作經驗2年以上,具有自然語言處理、語音交互、計算機視覺或者深度學習相關專業碩士以上學歷;
2.具備扎實的LLM/MLLM相關理論知識,熟悉大模型的微調、增量預訓練、對齊以及部署加速等相關知識,具備實操能力;
3.熟悉BERT/llama/qwen/qwen-vl/intern-vl等主流大模型,等熟悉Pytorch,DeepSpeed、Megatron主流的深度學習訓練框架,熟悉常用的大模型加速推理框架(vLLM,TensorRT-LLM);
4.有基于大模型的RAG/ChatBI/代碼生成落地應用項目開發經驗者加分,有多模態大模型訓練經驗者加分;
5.了解基于大模型的多任務學習,跨領域任務學習經驗者加優先。
所需專業:自然語言處理、語音交互、計算機視覺或者深度學習相關專業
其他要求:具有一定的抗壓能力;每季度出差次數不大于1次
語言要求:編程語言 python、C
1. 負責大模型的訓練和迭代,包括數據清洗、微調、測試;
2. 結合業務場景微調大模型,提高模型在特定任務上的效果;
3. 負責多模態基座大模型的訓練和迭代,包括數據清洗、微調、測試;
4. 長期跟蹤顯示領域的具體場景與多模態大模型結合的業務場景;
任職資格
教育程度:碩士
工作經歷:
1.工作經驗2年以上,具有自然語言處理、語音交互、計算機視覺或者深度學習相關專業碩士以上學歷;
2.具備扎實的LLM/MLLM相關理論知識,熟悉大模型的微調、增量預訓練、對齊以及部署加速等相關知識,具備實操能力;
3.熟悉BERT/llama/qwen/qwen-vl/intern-vl等主流大模型,等熟悉Pytorch,DeepSpeed、Megatron主流的深度學習訓練框架,熟悉常用的大模型加速推理框架(vLLM,TensorRT-LLM);
4.有基于大模型的RAG/ChatBI/代碼生成落地應用項目開發經驗者加分,有多模態大模型訓練經驗者加分;
5.了解基于大模型的多任務學習,跨領域任務學習經驗者加優先。
所需專業:自然語言處理、語音交互、計算機視覺或者深度學習相關專業
其他要求:具有一定的抗壓能力;每季度出差次數不大于1次
語言要求:編程語言 python、C
工作地點
地址:北京大興區京東方技術創新中心


職位發布者
呼女士HR
京東方科技集團股份有限公司

-
電子技術·半導體·集成電路
-
500-999人
-
股份制企業
-
北京市朝陽區酒仙橋路10號