商汤研究院
·大模型训练系统研究员 (社招 / 校招 / 实习,26 届可快速转正,HC 充足,Base 上海)工作职责
1.参与深度学习框架核心代码开发,支撑大模型训练与强化学习业务;
2.持续优化系统架构与模型设计,提升训练速度与稳定性;
3.跟踪并落地海内外前沿技术。
任职要求
1.硕士及以上学历,计算机或相关专业,CS 基础扎实,代码规范良好;
2.熟练使用 PyTorch;
3.熟悉 Megatron、DeepSpeed 等大模型加速框架;
4.熟悉 verl、OpenRLHF 等强化学习框架。
加分项
-深入阅读过 vLLM、sglang 推理框架源码;
-学校
-校招/社招/实习) 微信:13262900920(备注:姓名
-学校
-校招/社招/实习) 联系人:杨波