极客时间AIOps 训练营,本课涵盖laC、Client -go、Operator 开发等多种技能,打造自己的云管理工具,全面覆盖AIOps核心技术,培养新时代复合型云原生、运维人才,紧跟机器学习和大模型最新趋势,掌握AIOps和LL .MOps的最佳实践。
由浅入深,轻松掌握 AIOps 核心技能
项目一:借助 IaC 自建 PaaS 平台 项目二: AIOps 核心基础 项目三: Client-go + AIOps实战 项目四: K8s Operator + AIOps开发实战 项目五: All-in-One 可观测性实战 项目六:云原生AIOps实战
模块一 云原生基础概述
模块二 AIOps 基础
模块三 Client-go 开发实战
模块四 Kubernetes Operator开发实战
模块五 云原生AIOps综合实战
模块六 OpenTelemetry 可观测开发实战
模块七 eBPF可观测开发实战
.
└── 第一周:云原生基础/
├── [ 45M] 1. 从精益、敏捷、DevOps 到 AIOps
├── [ 51M] 2. 什么是 AIOps
├── [ 70M] 3. IaC 和 Terraform 概述
├── [ 50M] 4. Terraform 核心命令
├── [210M] 5. Terraform 案例演示
└── 资料/
├── [4.6M] 1-云原生AIOps概览.pdf
└── [6.0M] 2-基础设施即代码实战.pdf
└── 第二周:容器和 K8s 入门/
├── [ 96M] 1. 深入 Dockerfile 和镜像构建
├── [ 70M] 2. Dockerfile 的最佳实践
├── [7.7M] 3-容器和 K8s 入门.pdf
├── [ 11M] 3. 初级应用定义:Manifest
├── [ 56M] 4. 微服务示例应用的设计和实现
├── [ 95M] 5. 应用定义:Helm 入门和实战
├── [ 35M] 6. 应用定义:Kustomize 入门和实战
└── [135K] 第 2 周作业.pdf
├── 第三周:AIOps 入门/
│ ├── [ 19M] 1. Prompt Engineering 入门和实战
│ ├── [ 58M] 2. Chat Completions、Memory、JSON Mode 实战
│ ├── [ 43M] 3. Function Calling 实战
│ ├── [8.4M] 4-AIOps 入门.pdf
│ ├── [ 35M] 4. Fine-tuning 实战
│ ├── [139M] 5. 检索增强生成(RAG、Graph RAG)实战
│ ├── [ 27M] 6. 本地部署常见开源模型并推理
│ └── [178K] 第 3 周作业.pdf
└── 第四周:Agent 入门/
├── [ 28M] 1. Agent 的四种设计模式
├── [166M] 2. Agent 开发实战(一)
├── [110M] 3. Agent 开发实战(二)
├── [142M] 4. Agent 开发实战(三)
├── [8.0M] 5-Agent 开发实战.pdf
└── [162K] 第 4 周作业.pdf
├── 第五周:Client-go 入门及实战/
│ ├── [ 89M] 1. Client-go 简介和配置
│ ├── [107M] 2. Client-go 里的 4 种 Client
│ ├── [114M] 3. 实现一个 Client-go Watch 客户端
│ ├── [ 16M] 4. Informers、Indexer、Workqueue
│ ├── [ 41M] 5. 实现一个简单的 Kubectl get CRD
│ ├── [5.4M] 6-Client-go 入门和实战.pdf
│ └── [140K] 第 5 周作业.pdf
└── 第六周:Client-go AIOps 实战/
├── [ 75M] 1. Golang CLl 实战:Cobra SDK
├── [174M] 2. 从零开发 Chat K8s 命令行工具
├── [ 61M] 3. 从零开发 K8sGPT 故障诊断工具
├── [2.2M] 7-Client-go AIOps 实战.pdf
└── [136K] 第 6 周作业.pdf
├── 第七周:Kubernetes Operator 入门/
│ ├── [ 45M] 1. Operator 概述
│ ├── [ 87M] 2. Kubebuilder 实战一:实现类似 KubeVela Application 定义
│ ├── [104M] 3. Kubebuilder 实战二:实现阿里云定时弹性伸缩器
│ ├── [ 33M] 4. Operator SDK 实战一:基于 Helm 开发 Operator
│ ├── [ 23M] 5. Operator SDK OLM
│ ├── [ 51M] 6. Operator 最佳实践
│ ├── [4.1M] 8-Operator 入门与实战.pdf
│ └── [134K] 第 7 周作业.pdf
├── 第九周:训练流量预测模型实现自动扩容/
│ ├── [132M] 1. AlOps 模型训练和自动扩容(上篇)
│ └── [149M] 2. AlOps 模型训练和自动扩容(下篇)
├── 第八周:Operator AIOps 实战/
│ ├── [169M] 1. 实战一:开发 Operator 调度 GPU 竞价实例资源池
│ ├── [141M] 2. 实战二:Operator 实现大模型私有部署
│ ├── [ 95M] 3. 实战三:开发基于 LLM 的日志流监测 Operator
│ ├── [112M] 4. 实战四:实现基于运维专家知识库故障排查 Operator
│ ├── [4.2M] 9-Operator AIOps 实战.pdf
│ └── [137K] 第 8 周作业.pdf