工作地点:
广东省-广州市
工作职责:
1、负责智算调度核心模块设计开发,主导算力池化与调度引擎建设,实现异构算力(GPU/NPU)的细粒度切分、动态扩缩容及多租户配额管理。
2、基于Kubernetes进行容器管理平台开发,负责集群生命周期管理、工作负载编排及应用交付体系。
3、开发K8s Operator/Controller,扩展K8s原生能力以适配智算场景,熟悉Volcano、HAMI等调度框架。
任职资格:
1、精通Golang,有大型分布式或云原生项目实战经验,深刻理解高并发编程及性能调优。
2、精通容器技术(Docker/Containerd),熟悉Namespace、Cgroup等底层原理。
精通Kubernetes架构,具备源码阅读与修改能力,有成熟的Operator/CRD开发经验。
3、了解GPU虚拟化、拓扑感知调度、断点续训等技术,熟悉CNI网络模型(Calico/Cilium)及高性能网络(RDMA/RoCE)落地经验者优先。
4、具备产品意识与良好沟通协作能力,能独立攻坚技术难题。