项目介绍
AI Engineering from Scratch 是一个雄心勃勃的 AI 工程师完整课程体系,由 rohitg00 创建。项目包含 435 节课、20 个阶段,总学习时长约 320 小时,覆盖从数学基础到多智能体系统的完整 AI 工程技能树。
“84% 的学生已经在使用 AI 工具,但只有 18% 的人觉得自己有能力在专业环境中使用它们。这个课程填补了这一差距。”
“你不只是学习 AI。你要从头构建它。端到端。亲手做。”
这个项目于 2026 年 3 月创建,短短两个月已获得 9,758 星,成为 AI 教育领域增长最快的开源课程之一。
课程架构
核心理念:Build It → Use It
课程的独特之处在于"先自己实现,再用框架"的学习路径——先用纯数学从零实现算法,然后再用 PyTorch/sklearn 运行同样的功能。这确保你真正理解框架的底层原理。
课程结构(6 拍子)
格言 → 问题 → 概念 → 构建 → 使用 → 交付
每节课都放在一个独立文件夹中:
phases/<NN>-<阶段名>/<NN>-<课程名>/
├── code/ 可运行的实现代码
├── docs/
│ └── en.md 课程说明
└── outputs/ 提示词、技能、Agent 或 MCP 服务器成品
20 个阶段概览
| 阶段 | 课程数 | 覆盖范围 |
|---|---|---|
| P0 — 环境搭建与工具链 | 12 | 开发环境、Git、GPU/云、Docker、Linux、API、调试 |
| P1 — 数学基础 | 22 | 线性代数、微积分、概率论、信息论、优化、PCA、SVD、傅里叶、图论 |
| P2 — 机器学习基础 | 18 | 回归、树/SVM、集成学习、特征工程、评估、时间序列、异常检测 |
| P3 — 深度学习核心 | 13 | 感知机、反向传播、优化器(SGD/Adam/AdamW)、正则化、PyTorch、JAX |
| P4 — 计算机视觉 | 28 | CNN、YOLO、U-Net、GAN、扩散模型、Stable Diffusion、NeRF、Gaussian Splatting、ViT、SAM3、VLM、World Models |
| P5 — NLP | 29 | Tokenization、Word2Vec、Seq2Seq、Attention、BERT、RAG、chunking、评估(RAGAS/G-Eval)、长上下文 |
| P6 — 语音与音频 | 17 | FFT、声谱图、ASR/Whisper、TTS、语音克隆、音频LM、流式S2S、编解码、水印 |
| P7 — Transformer 深入 | 14 | Self-attention、多头注意力、RoPE/ALiBi、完整Transformer、BERT、GPT、MoE、KV Cache、Flash Attention、Scaling Laws |
| P8 — 生成式 AI | 14 | VAE、GAN、StyleGAN、DDPM、Latent Diffusion、ControlNet、LoRA、视频/3D/音频生成、Flow Matching |
| P9 — 强化学习 | 12 | MDP、Q-Learning、DQN、REINFORCE、PPO、RLHF、多智能体RL、Sim-to-Real |
| P10 — 从零实现 LLM | 22 | Tokenizer(BPE/WordPiece)、预训练(124M GPT)、SFT、RLHF、DPO、量化、推测解码、DeepSeek V3、Jamba |
| P11 — LLM 工程 | 15 | 提示工程、CoT、RAG(高级)、微调(LoRA/QLoRA)、Function Calling、MCP、护栏、缓存 |
| P12 — 多模态 AI | 25 | CLIP、BLIP-2、LLaVA、Qwen-VL、Chameleon、Emu3、Janus、Omni模型、视频定位、VLA、Computer Use |
| P13 — 工具与协议 | 23 | Function Calling、MCP(深入:服务器/客户端/鉴权/安全/网关)、A2A协议、OpenTelemetry、Agent SDK |
| P14 — 智能体工程 | 42 | Agent Loop、ReWOO、Reflexion、ToT、Memory(MemGPT/Mem0)、LangGraph、AutoGen、CrewAI、Benchmark、语音Agent |
| P15 — 自主系统 | 22 | 长程Agent、STaR、AI Scientist、递归自我改进、安全(Kill Switch/RSP/METR/Preparedness) |
| P16 — 多智能体与群体 | 25 | 协议、编排器-工作者、角色专业化、A2A、MARL、群体优化、Agent经济、失败模式 |
| P17 — 基础设施与生产 | 28 | vLLM、SGLang、TensorRT-LLM、GPU自动伸缩、可观测性、网关、A/B测试、SRE、FinOps、合规(SOC2/HIPAA/EU AI Act) |
| P18 — 伦理、安全与对齐 | 30 | RLHF/DPO家族、潜伏Agent、AI控制、红队测试、越狱、水印、模型卡片、监管框架 |
| P19 — 毕业项目 | 17个 | 编码Agent、代码库RAG、语音助手、多模态QA、研究Agent、MCP服务器、安全护栏、工程团队、个人导师 |
核心特色
1. "从零构建"方法论
课程的核心哲学是 “Build It → Use It”:先用纯 NumPy 实现线性回归,再用 scikit-learn;先手写 Transformer 注意力机制,再使用 Hugging Face。这种模式确保你永远不会成为"只会调包"的工程师。
2. 覆盖前沿技术栈
课程持续更新(最新推送为 2026 年 5 月),涵盖了包括 MCP 协议、A2A、DeepSeek V3、Flash Attention、World Models、Agent Swarms 等最新技术主题。
3. 多语言支持
使用 Python、TypeScript、Rust、Julia 四种语言授课,兼顾 AI 研究的主流语言和高性能工程需求。
4. 生产级项目输出
每节课的 outputs/ 目录会产出实际可用的成果:提示词模板、技能集、Agent 配置、甚至 MCP 服务器。
快速上手
# 克隆仓库
git clone https://github.com/rohitg00/ai-engineering-from-scratch.git
cd ai-engineering-from-scratch
# 从 Phase 0 开始
cd phases/00-setup-and-tooling
# 按照 docs/en.md 的指引逐步学习
# 或者直接跳到感兴趣的阶段
cd phases/14-agent-engineering/01-agent-loop
类似项目推荐
与 Andrej Karpathy Skills(编码原则)和 Academic Research Skills(学术研究)不同,AI Engineering from Scratch 是一个完整的课程体系,更适合系统性学习 AI 工程。
| 项目 | 定位 | 学习方式 | 适合人群 |
|---|---|---|---|
| AI Engineering from Scratch | 完整 AI 工程课程 | 从零实现 + 框架使用 | 想系统掌握 AI 的开发者 |
| Andrej Karpathy Skills | AI 编码原则 | CLAUDE.md 配置 | 使用 AI 编码工具的开发者 |
| Academic Research Skills | 学术研究全流程 | Claude Code 技能套件 | AI 学术研究者 |
| Easy-Vibe | Vibe Coding 入门 | 实战项目驱动 | AI 编程初学者 |
结合当前技术背景的分析
2026 年 AI 工程教育正面临一个核心矛盾:AI 工具越来越强大,但真正理解其原理的工程师却越来越少。AI Engineering from Scratch 正好填补了这个缺口:
- AI 原生教育 — 课程本身就是用 Claude Code 辅助开发的,体现了"AI 辅助学习 AI"的理念
- 从原理到实践 — 在 AI 工具黑盒化的大趋势下,坚持"理解原理"的教育理念尤为可贵
- Agent 工程成为核心 — P14-P16 整整 89 节课聚焦 Agent 相关技术,反映了行业对 Agent 工程师的迫切需求
- 生产就绪 — 不只是理论课程,还涵盖 P17 基础设施和生产部署,培养的是能上手的工程师
对于想要在 AI 领域深耕的开发者来说,这个课程提供了一个从数学基础到前沿 Agent 工程的完整路径,是目前开源社区中最全面的 AI 工程学习资源之一。
更新记录(2026-05-21)
- 首次上榜 GitHub Trending,获得 765 stars,总星数达 9,758
- 作为 2026 年 3 月才创建的项目,两个月内获得近万星,增长速度惊人
|—
更新记录(2026-05-22)
- 二连上榜! 今日再获 1,333 stars,总星数达 10,886
- 成为今日热榜 Top 5 项目,学习者对系统性 AI 工程教育的需求持续高涨
- 课程持续更新中,从零实现 Transformer 到 Agent 工程实践的内容深度获好评
更新记录(2026-05-23)
- 三连上榜! 今日再获 988 stars,总星数达 12,687
- 连续三天位列今日热榜 Top 5,说明系统性 AI 工程教育的需求正在持续扩大
- 435 课完整体系 + 从零实现的原则受到越来越多学习者的认可
更新记录(2026-05-24)
- 今日再获 1,521 stars,总星数达 13,950
- 本周累计获得 5,026 stars,日榜和周榜双双在列,增长势头稳定
- 435 课/320 小时的完整课程体系持续吸引自学者——从底层数学到多智能体系统的全覆盖设计是其核心卖点