内推详情 - 银行帮

-in, Text

-out)范式在信息完整性与推理能力方面存在明显局限，制约了基模在安全业务中的深度应用。我们诚邀具备扎实研究能力与工程实现经验的RI(Research Intern)实习生，深入探索以下方向:

1.研究并实现面向长上下文输入的长图到文(lmage

-to

-Text)关键信息提取模型;

2.设计并开展严谨对比实验，系统验证“图进图出”(Image

-in, Image

-out)模式是否能比传统“图进文出”更完整地保留与传递图像中的语义与结构信息;

3.探索多模态推理(reasoning)机制在复杂图文理解任务中对关键/敏感信息提取能力的增强作用;

4.将研究成果反哺至安全基模，提升其在攻防场景(如漏洞识别、威胁情报提取、敏感数据检测等)中的实际能力;

5.目标产出高质量学术论文(目标顶会如CVPR、ICML、ACL、 NeurIPS、USENIX Security等)，并推动技术落地。该岗位将直接参与前沿Al for Security研究，为构筑公司在攻防领域的核心技术壁垒提供关键支撑，并对外产生学术与行业影响力。

1.计算机科学、人工智能、信息安全或相关专业硕士/博士在读，具备扎实的机器学习与深度学习基础；

2.熟悉多模态大模型(VLM)、大语言模型(如Transformer、LLM)及训练方法(SFT、GRPO等)；

3.具备良好的编程能力(Python为主)，熟悉PyTorch/TensorFlow等主流框架；

4.有较强的科研素养，能独立阅读论文、复现算法并设计实验；

5.对信息抽取或攻防技术有浓厚兴趣。

1.有图像/文档理解、OCR、视觉问答(VQA)、长上下文建模等相关项目或论文经验；

2.熟悉敏感信息识别、数据脱敏、网络安全日志分析等安全领域任务；

3.在CV/NLP/Security方向顶会发表过论文；

4.具备处理超长序列、高分辨率图像或多页文档的实际工程经验；

5.对“图生图”、“图生文”“推理增强”等前沿方向有深入思考或实践。

1.具备强烈的问题驱动意识和探索精神；

2.能在有限资源下高效推进研究，兼顾创新性与实用性；

3.愿意与正岗研发团队紧密协作，将研究成果转化为基模能力。四：接收简历微信号：brave99

【实习招聘】阿里安全 AGI实验室-多模态安全大模型（硕/博研究