价格: 140 学币
JK多模态agent开发实战营,本课程以前沿技术全覆盖为起点,深度集成Sora2、文生3D、Lovart等最新AIGC能力,帮助学员系统掌握DiT、Index TTS、Qwen3-Omni等核心模型;同时构建全链路工程化闭环,从ComfyUI节点开发到SaaS化部署,全面覆盖容器封装、FastAPI服务化等生产级能力。课程坚持商业化强导向,案例覆盖图像、3D、视频、虚拟人、语音、AI审核及全模态交互等多个领域,并深入拆解Lovart的商业模式与技术路径。最终,助力学员实现架构能力进阶,完成从单模态生成到多模态协同、多Agent编排,再到全模态整合的全栈架构能力构建。
.
├── 00-直播回放/
│ ├── [451M] 开营直播:Agent 在长视频与复杂生图场景下的商业化路径
│ ├── [1.1M] 开营直播:Agent 在长视频与复杂生图场景下的商业化路径.pdf
│ └── [ 347] 资料.txt
├── 01-第一章:全模态 Agent 技术革命与一体化创作范式/
│ ├── [ 99M] 1.全模态发展概述-上
│ ├── [263M] 2.全模态发展概述-下
│ ├── [ 85M] 3.多模态Agent爆发背景
│ ├── [ 38M] 4.多模态Agent的技术架构
│ ├── [113M] 5.复杂推理与规划
│ ├── [ 56M] 6.创作工作流
│ └── [ 19M] 第一章-全模态Agent的技术革命与一体化创作范式-极客时间最新版.pdf
├── 02-第二章:文生图 Agent 的智能创作革命/
│ ├── [ 70M] 多模态 Agent 开发实战营-1.AI 图像技术演进的过程
│ ├── [ 39M] 多模态 Agent 开发实战营-2.主流文生图模型全景解析
│ ├── [112M] 多模态 Agent 开发实战营-3. 从角色一致性到-精确结构控制的技术突破
│ ├── [282M] 多模态 Agent 开发实战营-4.FLUX实践部分
│ ├── [ 19M] 多模态 Agent 开发实战营-5.图像到图像转换
│ ├── [ 49M] 多模态 Agent 开发实战营-6.推理加速与实时生成 &生图优化、评估与微调
│ ├── [ 61M] 多模态 Agent 开发实战营-7.LangGraph基础
│ ├── [457M] 多模态 Agent 开发实战营-8.LangGraph实践
│ ├── [444M] 多模态 Agent 开发实战营-9.文生图 Agent 实践
│ └── 资料文件/
├── 03-第三章:文生 3D Agent 与空间内容创作/
│ ├── [ 44M] 多模态 Agent 开发实战营-1.3D 生成技术演进的过程
│ ├── [296M] 多模态 Agent 开发实战营-2.主流 3D 生成技术全景解析 - 多图、单图生成 3D 场景
│ ├── [ 46M] 多模态 Agent 开发实战营-3.主流 3D 生成技术全景解析 - 文本、多模态生成 3D 场景
│ ├── [ 31M] 多模态 Agent 开发实战营-4.主流 3D 生成技术全景解析 - 3D 场景编辑
│ ├── [189M] 多模态 Agent 开发实战营-5.从象牙塔到商业化
│ ├── [184M] 多模态 Agent 开发实战营-6.混元 3D 实践
│ ├── [403M] 多模态 Agent 开发实战营-7.3D生成 - 智能 3D 资产生成 Agent实践1
│ ├── [ 73M] 多模态 Agent 开发实战营-7.3D生成 - 智能 3D 资产生成 Agent实践2
│ └── [ 20M] 第三章-文生3D-Agent与空间内容创作.pdf
├── 04-第四章:视频生成 Agent 的动态内容创作/
│ ├── PythonProject-test/
│ ├── [ 60M] 多模态 Agent 开发实战营-1.AI 视频生成概述
│ ├── [ 45M] 多模态 Agent 开发实战营-2.AI视频前沿技术与市场
│ ├── [452M] 多模态 Agent 开发实战营-3.底层开源技术全景
│ ├── [ 56M] 多模态 Agent 开发实战营-4.第三方商业视频平台对比
│ ├── [306M] 多模态 Agent 开发实战营-5.视频模型生成实践
│ ├── [146M] 多模态 Agent 开发实战营-6.视频Agent应用与工作流自动化
│ └── [311M] 多模态 Agent 开发实战营-7.视频生成Agent实践
├── 05-第五章-虚拟人生成技术与数字化身创作(最终调整版)/
│ ├── [165M] 多模态 Agent 开发实战营-1.虚拟人技术演进
│ ├── [426M] 多模态 Agent 开发实战营-2.开源技术全景解析
│ ├── [251M] 多模态 Agent 开发实战营-3.开源技术全景解析
│ ├── [152M] 多模态 Agent 开发实战营-4.技术选型
│ ├── [331M] 多模态 Agent 开发实战营-5.数字人Agent:虚拟主播生成系统(上)
│ ├── [500M] 多模态 Agent 开发实战营-6.数字人Agent:虚拟主播生成系统(下)
│ └── [ 17M] 第五章-虚拟人生成技术与数字化身创作(最终调整版).pdf
├── 06-第六章:语音合成 Agent 的音频内容革命/
│ ├── [ 76M] 多模态 Agent 开发实战营-1.语音合成技术总览
│ ├── [120M] 多模态 Agent 开发实战营-2.开源生态架构分类
│ ├── [ 83M] 多模态 Agent 开发实战营-3.TTS 模型实践(上)
│ ├── [169M] 多模态 Agent 开发实战营-4.TTS 模型实践(下)
│ ├── [124M] 多模态 Agent 开发实战营-5.开源生态架构分类-文生音乐
│ ├── [ 25M] 多模态 Agent 开发实战营-6.商业 TTS 服务生态概览
│ ├── [324M] 多模态 Agent 开发实战营-7.智能播客生成 Agent 实践
│ └── [ 15M] 第六章-语音合成TTS.pdf
├── 07-第七章:ComfyUI 工程化与生产级部署/
│ ├── [186M] 多模态 Agent 开发实战营-1.ComfyUI工程化与生产级部署概述
│ ├── [107M] 多模态 Agent 开发实战营-2.ComfyUI实践基础
│ ├── [185M] 多模态 Agent 开发实战营-3.ComfyUI自定义节点
│ ├── [141M] 多模态 Agent 开发实战营-4.ComfyUI工作流介绍
│ ├── [225M] 多模态 Agent 开发实战营-5.ComfyUI服务化方式
│ └── [ 20M] 第七章-ComfyUI工程化与生产级部署.pdf
├── 08-第八章:多模态理解 RAG 与内容分析 Agent/
│ ├── [ 45M] 多模态 Agent 开发实战营-1.多模态理解通用模型
│ ├── [665M] 多模态 Agent 开发实战营-2.RAG 知识库构建与问答实践
│ ├── [117M] 多模态 Agent 开发实战营-3.RAG 构建-知识图谱与 GraphRAG 实践
│ ├── [175M] 多模态 Agent 开发实战营-4.DeepSearcher&Agentic RAG 项目实践
│ ├── [ 56M] 多模态 Agent 开发实战营-5.多模态 RAG 内容安全场景
│ ├── [162M] 多模态 Agent 开发实战营-6.智能内容审核 Agent
│ └── [ 12M] 第八章-多模态理解RAG与内容分析Agent-校对后.pdf