一、工作职责:
- Kubernetes服务集群架构性能调优与优化: 通过设计服务架构,包括使用监控工具(如Prometheus、Grafana)对Kubernetes集群进行全面性能分析,并优化关键节点、组件和流程,以提升整体系统的稳定性和响应速度。
- 集群部署与运维: 独立负责Kubernetes集群的稳定部署、监控与维护工作,确保集群在高负载环境下的可靠运行。
- 平台化能力建设: 研究并实施Kubernetes平台化的能力建设,提升平台的扩展性、可用性和可管理性。
- 跟踪云原生生态的最新发展趋势,研究并应用新技术以提升底座的稳定性、可扩展性、可维护性。
二、岗位要求:
- 计算机科学、软件工程等相关专业本科及以上学历,3年以上容器、Kubernetes 或相关分布式系统开发经验。
- 熟练掌握 Kubernetes 核心组件的原理和开发,有二次开发能力。
- 精通 Go 或 C++ /Python编程,具有良好的代码风格和系统架构设计能力,能进行复杂系统的代码开发和调试。
- 熟悉容器技术栈(如 Docker、containerd),有容器存储、容器网络、稳定性、性能优化等相关知识。
- 有云原生项目(如 Containerd、Calico、Etcd、Cilium、Fluid等)开发经验者优先。
- 具备较强的学习能力和分析问题的能力,能够快速理解并应用新技术。
- 对AI工具研发和使用有热情。
三、加分项:
- 参与或主导过大型分布式系统/高性能计算平台的架构设计。
- 有 Prometheus、Thanos 等监控系统的运维经验,能基于实时数据进行性能及稳定性的优化。
- 熟悉服务器基础硬件与操作系统配置
