内推详情 - 银行帮

【可灵

-视频生成算法

-Research实习生】

1、参与多模态视频生成算法的研究和探索，包括但不限于: t2v，i2v等基础模型研发、多模态可控视频生成编辑、世界模型等；

2、探索将多模态大语言模型mllm如deepseek/qwen相关技术与视频生成相结合，包括但不限于：提升kling视频生成的多模态理解、推理、多轮交互能力等；

3、探索将语音和视频生成相结合，包括但不限于：语音驱动的视频生成，有声视频等；

4、探索实时可拓展的多模态视频生成技术，提升多模态视频生成的质量和效率等；

5、在顶会顶刊上发表研究成果和开源代码，提升团队在多模态视频生成等领域的学术声望。

1、熟悉视频生成基础模型如SVD、Sora、meta moviegen、hunyun video等的优先；

2、熟悉多模态大语言模型（deepseek/qwen等）、多模态理解生成、世界模型优先；

3、熟悉语音驱动视频生成、语音生成优先；

4、有多模态大语言模型、图像/视频生成、3D生成大规模训练和数据清洗经验者优先；

5、学习能力强、自驱、代码能力强、善于解决问题者优先；

6、有一作顶会或顶刊论文发表经历或相关知名大模型开源项目者优先。邮箱：xuyulong03@kuaishou.com

【可灵-视频生成算法-Research实习生】