CUHK计算机系James Cheng老师课题组招收MLOps、图系统方向工程师和实习生
本期将为大家介绍香港中文大学计算机科学与工程系 James Cheng 老师招收工程师和实习生相关信息。
Husky Data Lab 是由香港中文大学计算机科学与工程系 Prof. James Cheng 领导下的大数据实验室,专注于高性能数据分析系统和数据库的开发,研究成果已被应用于工业界多个大规模 / 高性能系统。
个人主页:https://www.cse.cuhk.edu.hk/~jcheng/
目前,James Cheng 教授团队在开发 Ofnil 和 Graxy 两个平台:
Ofnil graph feature platform 开源项目致力于提供一个 feature engineering 和 serving 解决方案,使多样化和海量的图数据立即发挥作用。Ofnil 的设计目标是通过使用先进的图数据库和图分析技术获得的丰富的特征,自动并加速从数据源到 ML 系统的 feature preparation 过程。
Graxy 是一套可服务于不同场景下(i.e., 离线 / 近线 / 在线 / 流式)对海量图数据的存储查询、计算训练、以及图特征管理提供 IaaS 能力的一体化平台;并在其上提供统一的数据管理、数据可视化、以及 SaaS 化的行业解决方案。
两个平台的招聘信息如下,详细介绍见网站:http://www.cse.cuhk.edu.hk/~jcheng/vacancy.html。
Ofnil open source project
Ofnil 计划招聘系统开发和开源社区维护两个方面的工程师和实习生,具体招聘要求如下:
Ofnil 系统开发
我们正在寻找具有优秀的编程技能和对开源 MLOps 系统热衷的系统开发方向工程师和实习生。
具体职责:
• 参与开发一个使用 Rust 语言编写的 feature platform;
• 研究 feature platform 的上下游系统,为我们的 Ofnil graph feature platform 提供支持;
• 备注:对于实习生, 在实习结束时,我们希望实习生能够充分理解特征工程或服务管道,解释关键的想法和设计选择,并以务实的、面向开源的方式有效地实现这些功能。
招聘要求:
至少可工作 6 个月,时间较长者为佳;
在使用 Rust、C++ 和 Python 等语言编程方面有出色的经验;
良好的人际交往能力和流利的英语;
优先考虑的资格
接受过计算机科学方面的研究生教育,最好是系统研究或数据库研究方面研究生。。 开源贡献经验。 有云技术栈的经验,如使用 AWS、Kubernetes 和 Docker 容器等。 有系统开发、数据库、数据流系统和云计算的经验。 熟悉 protobuf、gRPC、Restful API 等工具和协议。 CI-CD 知识。
Ofnil 开源社区维护:
我们正在寻找具有优秀的书面(主要是英文)沟通能力,并对人工智能、数据分析和数据库相关的技术内容有敏锐感觉的社区运营管理人员和实习生。
具体职责:
• 建立对开源产品的深入了解,并参与向社区用户发布 demo;
• 协助建立一个与社区沟通需求,发现推出社区机会的机制;
• 与系统开发团队就技术设计细节进行沟通,建立面向开发者的文档,为社区贡献者提供清晰有效的指导;
• 参与建立社区管理流程。
招聘要求:
• 至少可工作 6 个月,时间较长者优先考虑;
• 优秀的口头和书面英语沟通能力;
• 熟悉 Rust 和有使用 Docusaurus 等文档工具的经验优先。
工作模式
允许管理人员和实习生 on-site (in our Hong Kong office) 和 off-site (anywhere on earth) 之间分配工作时间。
简历投递
对以上各职位感兴趣的候选人,可投递简历至:
Email: [email protected]
联系时请备注:姓名 + 岗位
云原生的一站式图数据存储 / 计算 / 训练平台 Graxy
James Cheng 教授团队目前也在开发云原生的一站式图数据存储 / 计算 / 训练平台 Graxy。图(Graph)数据由点和边及其属性组成,已被广泛应用在社交网络、金融风控、生物制药等各个领域。Garnter 报告指出图数据的技术市场将在未来十年里得到蓬勃的发展,最近几年更是数据和分析领域十大技术趋势之一。基于图数据的事务性/分析型数据库、图计算系统、图 AI 训练/推理系统过去的 3 年来,在工业界/学术界都得到了广泛的发展和应用。Graxy 是一套可服务于不同场景下(i.e., 离线 / 近线 / 在线 / 流式)对海量图数据的存储查询、计算训练、以及图特征管理提供 IaaS 能力的一体化平台;并在其上提供统一的数据管理、数据可视化、以及 SaaS 化的行业解决方案。
简历投递
对以下各职位感兴趣的候选人,可投递简历至:
Email: [email protected]
联系时请备注:姓名 + 岗位
数据库存储引擎研发(全职 / 实习)
岗位职责
参与 Graxy 分布式分析型图数据库的设计与开发工作;负责查询引擎、存储引擎、元数据模板的设计与开发工作。
岗位要求
1. 熟练使用 C/C++, Rust, Go 任一编程语言,有良好的代码习惯;
2. 对分布式系统架构,分布式存储方向充满热情;
3. 熟悉计算机系统结构,熟悉多线程、网络编程等技术优先;
4. 优秀的发现和解决问题能力,良好的沟通能力,快速学习能力。
加分项
1. 有数据库、分布式系统研发经验者优先;
2. 熟悉 Doris/ClickHouse/Druid/Kylin 等 OLAP 系统原理者优先;
3. 熟悉 Impala/Presto/Hive/Spark/Hadoop 等分布式计算引擎原理者优先;
4. 熟悉 HDFS/Cassandra/HBase/Kudu/RocksDB 等存储引擎原理者优先。
图计算分析引擎研发(全职 / 实习)
岗位职责
参与 Graxy 分布式图计算 / 挖掘系统的设计与开发工作。
岗位要求
1. 精通 C/C++,深入了解高并发编程、网络编程原理;
2. 对分布式系统架构方向充满热情;
3. 了解并行计算,具有 OpenMP, MPI 相关开发经验;
4. 优秀的发现和解决问题能力,良好的沟通能力,快速学习能力。
加分项
1. 了解主流的图分析 / 挖掘算法理论,并有相关的编程经验;
2. 熟悉分布式图计算框架(e.g., Pregel, GraphLab)原理,了解业界主流图计算系统(Giraph, GraphX, Plato, Grape, etc.);
3. 对图计算在业务场景(e.g., 风控,审核,搜索 / 广告 / 推荐)上的应用有工作经验者优先。
图 AI 训练 / 推理引擎研发(全职 / 实习)
岗位职责
参与 Graxy 分布式图神经网络训练 / 推理系统的设计与开发工作;负责 GNN 算法的开发工作。
岗位要求
1. 熟练使用 Python, C/C++ 两种编程语言,有良好的代码习惯;
2. 熟悉分布式 Tensorflow、Pytorch 下的编程;熟悉 GNN 算法基本知识;
3. 对分布式系统架构,分布式存储方向充满热情;
4. 优秀的发现和解决问题能力,良好的沟通能力,快速学习能力。
加分项
1. 熟悉业界开源的 GNN 系统(e.g., DGL, PyG, PGL, AliGraph, etc.);
2. 熟悉 HDFS/Hive/Spark/KafKa/Arrow 等大数据系统;
3. 在 GNN 系统 / 算法领域发表过计算机顶会论文。
后台开发方向(校招 / 实习生)
岗位描述
参与服务后台的架构设计、开发、优化,打造更稳定、高效和安全可靠的后台系统。
岗位要求
1. 扎实的编程能力;
2. 熟练掌握 C++/Go/Rust 等其中一门开发语言;
3. 熟悉 TCP/UDP 网络协议及相关编程、进程间通信编程;
4. 专业软件知识,包括算法、操作系统、软件工程、设计模式、数据结构、数据库系统、网络安全等。
加分项
1. 分布式系统设计与开发,负载均衡、系统容灾、高可用系统等知识;
2. 对云原生相关技术有所了解;
3. 有图数据库如 Neo4j 等、图计算系统如 Spark 等开发经验。
全栈开发方向(校招 / 实习生)
岗位描述
参与平台的前后端开发,打造业界最好用的图平台。
岗位要求
1. 熟练掌握 React/Vue 等前端技术;
2. 熟悉 java/C++/Python/Go 等主流编程语言,接触过相应的框架并有一定的理解;
3. 熟练使用 MySQL/MongoDB 等数据库;
4. 有较强的学习能力、分析及解决问题能力,具备良好的团队合作意识,心态好,有责任心。
加分项
1. 了解 Redis/MemCache 等缓存中间件优先;
2. 有性能优化方面的经验优先;
3. 有互联网实习项目经验者优先。
「TalentAI」是机器之心最新招聘栏目,欢迎有招聘需求的高校实验室、企业与我们联系合作。邮箱:[email protected]
微信扫码关注该文公众号作者