是一家外企风格的AI芯片公司,工作氛围很好,工作时长非常合理,早九晚六,管理扁平,薪资比较可观,base有北京和上,校招不会要求立马签三方,可以作为一个选择等到明年春天再决定lz上一年秋招放弃了其他互联网的offer,来了这里,很多时间可以自己支配学习,
工作内容也较为自由,目前感觉很好,非常wlb,社招、校招名额都有,融资情况不错可以简历发邮箱 571630963@qq.com, 也可以加微信 13603935107,可以进一步了解,也帮忙看面试进度,和hr沟通lz所在的小组是:https://neitui.italent.cn/siorigin/sharejobs/detail?shareId=45e7caa8
-74a1
-4810
-9330
-1fba
-415a
-b9cb
-a25935a97f80&language=zh_CN工作职责
-大语言模型和多模态方向:聚焦于LLM, LMM, VLM等领域,包括前沿算法的研究与开发,推动算法的实际落地与优化。
-视觉生成任务方向: 聚焦于图像/视频生成、编辑,风格迁移等领域,包括前沿算法的研究与开发,推动算法的实际落地与优化。
-量化压缩和模型优化方向:聚焦于模型压缩和优化,致力于模型量化、稀疏化等前沿模型压缩算法的研究和开发,以精度和性能为视角推动算法在自研芯片的高效部署。
岗位职责
1.参与前沿LLM、LMM、AIGC算法的设计与开发,如 Deepseek, InternVL, Diffusion Models等主流模型,持续优化算法性能。
2.参与前沿优化加速方案设计,如Flash Attention v2/v3, Page Attention等,持续深耕软件优化发挥芯片最佳性能
3.负责数据预处理、模型训练与调优,进行效果评估,推动算法在实际业务场景中的高效落地。
4.分析实验结果并撰写技术文档,定期进行技术总结与分享,促进团队知识积累。
5.持续跟踪领域的前沿技术,提出创新性算法方案,提升技术竞争力。
6.支持团队完成其他算法相关任务,协助推进项目进度与交付质量。
任职资格
1.本科及以上学历,计算机科学、人工智能、机器学习等相关专业。
2.深入理解深度学习原理与技术,具备扎实的算法理解能力,对CNN、Transformer等模型架构有深入研究。
3.熟练掌握一种或者多种深度学习框架(如PyTorch/vLLM/Megatron
-LM/Deepspeed),精通Python/C++/CUDA等编程语言,具备良好的代码开发与调试能力。
4.具备优秀的学习能力,善于团队合作与高效沟通,能够快速适应新环境与挑战。
--※ 修改:
·a571630963 于 Dec 3 16:44:46 2025 修改本文
·[FROM:
101.5
2.2
41.*]※ 来源:
·[FROM:
101.5
2.2
41.*]