科研实习 | 南方科技大学-香港中文大学(深圳)联合招收大语言模型算法实习生
合适的工作难找?最新的招聘信息也不知道?
AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!
单位与团队介绍
导师简介
荆炳义教授,现任南方科技大学统计与数据科学系副系主任、讲席教授、南方科技大学大数据创新中心主任。于1993年在悉尼大学获得统计学博士学位,1992-1994 年在澳洲国立大学做博士后,师从国际著名统计学家Peter Hall 教授。1994-2021年在香港科技大学工作,任数学系教授、统计科学中心主任。荆炳义研究兴趣广泛,包括概率论与数理统计,金融计量及高频数据分析,机器学习理论与算法,生物信息,网络数据分析,强化学习等。他在各领域中有许多开创性研究,取得了很多突破性科研成果。共发表论文100余篇。荆炳义教授荣获2015年度国家自然科学奖二等奖, 教育部特聘教授,及两年度(2010,2015)获教育部高等学校自然科学奖二等奖。荆炳义教授是美国统计协会(ASA)和数理统计协会(IMS)会士(Fellow),国际统计学会(ISI)当选会士,泛华统计协会理事会成员,并先后分别担任七家国际期刊副主编。
2023年12月初,荆炳义教授课题组联合IDEA研究院发布34B Chat模型,具备超强多轮对话能力,在由美国Hugging Face社区支持的、致力于追踪、排名和评估大语言模型性能的开放大语言模型排行榜(Open LLM Leaderboard)中占据榜首,同时登顶上海AILab发布的Opencompass榜单同规模模型榜首,成为目前最具优势的开源34B指令微调模型之一。
个人主页:
https://faculty.sustech.edu.cn/?tagid=jingby&iscss=1&snapid=1&orderby=date&go=1
王本友,香港中文大学(深圳)助理教授,曾是欧盟玛丽居里研究员,于天津大学和意大利帕多瓦大学分别取得硕士和博士学位。主要研究方向为自然语言处理(NLP)、应用机器学习、和信息检索。曾在丹麦哥本哈根大学、加拿大蒙特利尔大学、荷兰阿姆斯特丹大学、华为诺亚方舟实验室、中科院理论物理所、社科院语言所交流访问。王本有助理教授曾获得国际信息检索顶级会议SIGIR 2017(CCF A类会议)最佳论文提名奖;博士期间获得国际NLP顶级会议NAACL 2019最佳可解释论文奖,该工作与NLP里程碑工作BERT同台领奖,长期担任ICLR/NeurIPS/ICML审稿人。发表包括国际顶级会议ICLR/NuerIPS/ACL/EMNLP/NAACL/ SIGIR/WWW和顶级期刊TOIS/TOC等20余篇,撰写的《推荐系统与深度学习》由清华大学出版社出版。
岗位职责
1. 参与多模态 (文本、图像、视频等) 大模型的研发和优化工作,协助进行模型的训练与调试;
2. 收集和处理多模态数据集,确保数据质量符合模型训练需求;
3. 协助团队进行相关算法的设计、训练和测试工作;
4. 追踪最新的人工智能研究进展,特别是多模态学习领域的前沿技术和应用。推进多模态大模型在业务场景的应用落地。
岗位要求
1. 正在就读于计算机科学、人工智能或相关专业的硕士或博士研究生;
2. 在计算机视觉、多模态理解等方面有扎实的研究基础,熟悉主流模型和算法,如CLIP、ALBEF、BEIT3、BLIP-2、LLaVA等多模态理解模型;
3. 具备良好的编程能力,熟练使用至少一种编程语言,如Python、Java或C++;
4. 对深度学习、机器学习有深入理解,有使用TensorFlow、PyTorch等深度学习框架的实战经验。熟悉分布式训练框架,如Megatron-LM和DeepSpeed,并具备多机多卡大模型训练经验者优先考虑;
5. 有高质量论文发表者优先 (如CVPR, AAAI, NIPS, ICLR, TPAMI, ICCV, ECCV等);
6. 有良好工程能力,在kaggle、天池等数据竞赛中获奖者优先;
7. 具有良好的英语读写能力,能够阅读和理解英文学术论文。
岗位职责
1. 参与大语言模型在垂域的算法落地,根据业务需求开发定制化大语言模型,包括应用在AI Agent、虚拟对话、评论分析等业务场景;
2. 收集和处理垂域文本数据集,确保数据质量符合模型训练需求;
3. 负责提升大语言模型在检索增强、工具增强范式下的性能,提升检索和工具调用的准确度并降低内容生成的幻觉;
4. 参与深度学习和大语言模型研发相关工作,包括但不限于预训练、SFT、RLHF、Prompt调优、上下文窗口扩充、知识增强等。
岗位要求
1. 正在就读于计算机科学、人工智能或相关专业的硕士或博士研究生;
2. 在NLP、LLM等方面有扎实的研究基础,熟悉主流模型和算法,如LLaMA、Yi、Qwen等主流LLM的架构和MoE、LORA等主流训练技术;
3. 熟悉大语言模型的原理和训练方法,有实际训练经验者优先;
4. 对深度学习、机器学习有深入理解,有使用TensorFlow、PyTorch等深度学习框架的实战经验。熟悉分布式训练框架,如Megatron-LM和DeepSpeed,并具备多机多卡大模型训练经验者优先考虑;
5. 具备算法优化、模型量化、推理加速等工程能力和经验者优先;
6. 有高质量论文发表者优先 (如ICML, NIPS, ICLR, ACL, EMNLP等);
7. 有良好工程能力,在kaggle、天池等数据竞赛中获奖者优先。
岗位职责
1. 参与开发优化大模型训练框架,支持单任务千卡规模的高效和稳定训练;
2. 参与大语言模型、多模态大模型结构设计,并联合业务和校企合作进行模型训练效率和性能的验证;
3. 参与文生图和文生视频的训练性能加速;
4. 参与低精度训练性能优化和长窗口训练性能优化。
岗位要求
1. 熟悉使用PyTorch框架,可对DataLoader数据迭代和DDP训练代码进行性能分析和优化;
2. 熟练使用主流大模型训练框架DeepSpeed、Megatron、Colossal。掌握3D并行、ZeRO机制、Flash-Attnetion等原理和可优化方向。具有vLLM、llama.cpp等推理框架的研发经验;
3. 有ViT、Stable Diffusion、DiT模型训练性能优化经验者优先;
4. 熟练掌握CUDA性能优化手段,能够进行算子的拆分和融合,进行并行算法设计和优化,有算子编写优化项目经验者优先;
5. 有使用cutlass2/3进行深度学习相关算子开发,有复现接近cuBLAS效率kernel开发,有写过pytorch cuda extenti的优先。
福利待遇
1. 日薪350~500元(可覆盖在深生活开销,租房约1500元/月),可根据候选人的经验和技能水平确定薪资;
2. 优秀者可推荐攻读香港中文大学(深圳)数据科学哲学硕士/博士项目, 并提供最多全额的奖学金(与香港中文大学深圳的奖学金不冲突);
3. 实习期间提供计算资源、舒适的办公环境用于科学研究。
平台资源
1. 可为实习生提供南科大丰富优质的图书馆资源,AI和交叉学科领域拥有雄厚的师资力量;
2. 实习期间中心提供计算资源、舒适的办公环境用于科学研究;3. 可参与课题组科研项目,并可作为论文合作者;
4. 与华为、IDEA、UCloud、滴谱、鹏程实验室等有深度合作,也可提供内推机会。
申请方式
电话:0755-88015665
实习内推
蚂蚁集团机器智能团队|腾讯游戏AI大语言模型团队|京东广告研发部|阿里通义实验室对话智能团队|NVIDIA中国|腾讯混元大模型团队|秘塔科技|途深智合|蚂蚁集团风险智能团队|昆仑万维AI游戏团队|小红书社区搜索组|阿里达摩院多模态团队|上海算法创新研究院|新东方教育科技集团|快手大模型训练引擎团队|小红书|快手大模型中心|VIVO影像算法研究部|小红书智能创作团队|京东零售九数算法中台|Infinity Ground|OPPO AI中心大模型算法部|上海期智研究院|抖音搜索生活服务团队|腾讯混元AIGC团队|亚马逊上海人工智能研究院
高校招生
香港大学陈怡老师|香港理工大学姚岱教授|哈尔滨工业大学(深圳)万佳教授|香港科技大学(广州)骆昱宇教授|澳门大学郑哲东教授|大湾区大学乔子越老师|西湖大学蓝振忠老师|香港科技大学(广州)丁宁宁老师|大湾区大学余梓彤老师|香港中文大学(深圳)陈锐老师|香港科技大学(广州)汤南教授|医疗大数据与医学智能实验室|香港理工大学林婉瑜老师|香港科技大学郭嵩教授|亚利桑那大学杨幻睿老师|中山大学苗嘉旭教授|香港科技大学(广州)谢泽柯老师|武汉大学罗勇教授|上海交通大学张倬胜老师|香港中文大学(深圳)林天麟老师|香港城市大学马佳葳老师|南方科技大学张建国教授|浙江大学智能生物医用大分子实验室|香港科技大学雪巍老师
AI 求职是「PaperWeekly」旗下聚焦人工智能领域的招聘平台,涵盖高校硕博招生、博士后招募、企业校招、社招、实习和内推等。
微信扫码关注该文公众号作者