一、
职位描述 我们正在构建面向攻防场景的安全大模型,亟需突破在高密度、强上下文依赖的长图文内容(如网页截图、技术文档、复杂图表、原始网络流量可视化图等)中关键/敏感信息提取的技术瓶颈。当前“图进文出”(Image
-in, Text
-out)范式在信息完整性与推理能力方面存在明显局限,制约了基模在安全业务中的深度应用。我们诚邀具备扎实研究能力与工程实现经验的RI(Research Intern)实习生,深入探索以下方向:
1.研究并实现面向长上下文输入的长图到文(lmage
-to
-Text)关键信息提取模型;
2.设计并开展严谨对比实验,系统验证“图进图出”(Image
-in, Image
-out)模式是否能比传统“图进文出”更完整地保留与传递图像中的语义与结构信息;
3.探索多模态推理(reasoning)机制在复杂图文理解任务中对关键/敏感信息提取能力的增强作用;
4.将研究成果反哺至安全基模,提升其在攻防场景(如漏洞识别、威胁情报提取、敏感数据检测等)中的实际能力;
5.目标产出高质量学术论文(目标顶会如CVPR、ICML、ACL、 NeurIPS、USENIX Security等),并推动技术落地。该岗位将直接参与前沿Al for Security研究,为构筑公司在攻防领域的核心技术壁垒提供关键支撑,并对外产生学术与行业影响力。
二、职位要求:
1.计算机科学、人工智能、信息安全或相关专业硕士/博士在读,具备扎实的机器学习与深度学习基础;
2.熟悉多模态大模型(VLM)、大语言模型(如Transformer、LLM)及训练方法(SFT、GRPO等);
3.具备良好的编程能力(Python为主),熟悉PyTorch/TensorFlow等主流框架;
4.有较强的科研素养,能独立阅读论文、复现算法并设计实验;
5.对信息抽取或攻防技术有浓厚兴趣。
加分项(满足其一即可)
1.有图像/文档理解、OCR、视觉问答(VQA)、长上下文建模等相关项目或论文经验;
2.熟悉敏感信息识别、数据脱敏、网络安全日志分析等安全领域任务;
3.在CV/NLP/Security方向顶会发表过论文;
4.具备处理超长序列、高分辨率图像或多页文档的实际工程经验;
5.对“图生图”、“图生文”“推理增强”等前沿方向有深入思考或实践。
三、我们期待你:
1.具备强烈的问题驱动意识和探索精神;
2.能在有限资源下高效推进研究,兼顾创新性与实用性;
3.愿意与正岗研发团队紧密协作,将研究成果转化为基模能力。四:接收简历微信号:brave99
-