菜单

Administrator
发布于 2026-05-21 / 1 阅读
0
0

AI Engineering from Scratch:从零构建 AI 工程技能 — 435课完整课程体系

项目介绍

AI Engineering from Scratch 是一个雄心勃勃的 AI 工程师完整课程体系,由 rohitg00 创建。项目包含 435 节课、20 个阶段,总学习时长约 320 小时,覆盖从数学基础到多智能体系统的完整 AI 工程技能树。

“84% 的学生已经在使用 AI 工具,但只有 18% 的人觉得自己有能力在专业环境中使用它们。这个课程填补了这一差距。”

“你不只是学习 AI。你要从头构建它。端到端。亲手做。”

这个项目于 2026 年 3 月创建,短短两个月已获得 9,758 星,成为 AI 教育领域增长最快的开源课程之一。

课程架构

核心理念:Build It → Use It

课程的独特之处在于"先自己实现,再用框架"的学习路径——先用纯数学从零实现算法,然后再用 PyTorch/sklearn 运行同样的功能。这确保你真正理解框架的底层原理。

课程结构(6 拍子)

格言 → 问题 → 概念 → 构建 → 使用 → 交付

每节课都放在一个独立文件夹中:

phases/<NN>-<阶段名>/<NN>-<课程名>/
├── code/      可运行的实现代码
├── docs/
│   └── en.md  课程说明
└── outputs/   提示词、技能、Agent 或 MCP 服务器成品

20 个阶段概览

阶段 课程数 覆盖范围
P0 — 环境搭建与工具链 12 开发环境、Git、GPU/云、Docker、Linux、API、调试
P1 — 数学基础 22 线性代数、微积分、概率论、信息论、优化、PCA、SVD、傅里叶、图论
P2 — 机器学习基础 18 回归、树/SVM、集成学习、特征工程、评估、时间序列、异常检测
P3 — 深度学习核心 13 感知机、反向传播、优化器(SGD/Adam/AdamW)、正则化、PyTorch、JAX
P4 — 计算机视觉 28 CNN、YOLO、U-Net、GAN、扩散模型、Stable Diffusion、NeRF、Gaussian Splatting、ViT、SAM3、VLM、World Models
P5 — NLP 29 Tokenization、Word2Vec、Seq2Seq、Attention、BERT、RAG、chunking、评估(RAGAS/G-Eval)、长上下文
P6 — 语音与音频 17 FFT、声谱图、ASR/Whisper、TTS、语音克隆、音频LM、流式S2S、编解码、水印
P7 — Transformer 深入 14 Self-attention、多头注意力、RoPE/ALiBi、完整Transformer、BERT、GPT、MoE、KV Cache、Flash Attention、Scaling Laws
P8 — 生成式 AI 14 VAE、GAN、StyleGAN、DDPM、Latent Diffusion、ControlNet、LoRA、视频/3D/音频生成、Flow Matching
P9 — 强化学习 12 MDP、Q-Learning、DQN、REINFORCE、PPO、RLHF、多智能体RL、Sim-to-Real
P10 — 从零实现 LLM 22 Tokenizer(BPE/WordPiece)、预训练(124M GPT)、SFT、RLHF、DPO、量化、推测解码、DeepSeek V3、Jamba
P11 — LLM 工程 15 提示工程、CoT、RAG(高级)、微调(LoRA/QLoRA)、Function Calling、MCP、护栏、缓存
P12 — 多模态 AI 25 CLIP、BLIP-2、LLaVA、Qwen-VL、Chameleon、Emu3、Janus、Omni模型、视频定位、VLA、Computer Use
P13 — 工具与协议 23 Function Calling、MCP(深入:服务器/客户端/鉴权/安全/网关)、A2A协议、OpenTelemetry、Agent SDK
P14 — 智能体工程 42 Agent Loop、ReWOO、Reflexion、ToT、Memory(MemGPT/Mem0)、LangGraph、AutoGen、CrewAI、Benchmark、语音Agent
P15 — 自主系统 22 长程Agent、STaR、AI Scientist、递归自我改进、安全(Kill Switch/RSP/METR/Preparedness)
P16 — 多智能体与群体 25 协议、编排器-工作者、角色专业化、A2A、MARL、群体优化、Agent经济、失败模式
P17 — 基础设施与生产 28 vLLM、SGLang、TensorRT-LLM、GPU自动伸缩、可观测性、网关、A/B测试、SRE、FinOps、合规(SOC2/HIPAA/EU AI Act)
P18 — 伦理、安全与对齐 30 RLHF/DPO家族、潜伏Agent、AI控制、红队测试、越狱、水印、模型卡片、监管框架
P19 — 毕业项目 17个 编码Agent、代码库RAG、语音助手、多模态QA、研究Agent、MCP服务器、安全护栏、工程团队、个人导师

核心特色

1. "从零构建"方法论

课程的核心哲学是 “Build It → Use It”:先用纯 NumPy 实现线性回归,再用 scikit-learn;先手写 Transformer 注意力机制,再使用 Hugging Face。这种模式确保你永远不会成为"只会调包"的工程师。

2. 覆盖前沿技术栈

课程持续更新(最新推送为 2026 年 5 月),涵盖了包括 MCP 协议、A2A、DeepSeek V3、Flash Attention、World Models、Agent Swarms 等最新技术主题。

3. 多语言支持

使用 Python、TypeScript、Rust、Julia 四种语言授课,兼顾 AI 研究的主流语言和高性能工程需求。

4. 生产级项目输出

每节课的 outputs/ 目录会产出实际可用的成果:提示词模板、技能集、Agent 配置、甚至 MCP 服务器。

快速上手

# 克隆仓库
git clone https://github.com/rohitg00/ai-engineering-from-scratch.git
cd ai-engineering-from-scratch

# 从 Phase 0 开始
cd phases/00-setup-and-tooling
# 按照 docs/en.md 的指引逐步学习

# 或者直接跳到感兴趣的阶段
cd phases/14-agent-engineering/01-agent-loop

类似项目推荐

Andrej Karpathy Skills(编码原则)和 Academic Research Skills(学术研究)不同,AI Engineering from Scratch 是一个完整的课程体系,更适合系统性学习 AI 工程。

项目 定位 学习方式 适合人群
AI Engineering from Scratch 完整 AI 工程课程 从零实现 + 框架使用 想系统掌握 AI 的开发者
Andrej Karpathy Skills AI 编码原则 CLAUDE.md 配置 使用 AI 编码工具的开发者
Academic Research Skills 学术研究全流程 Claude Code 技能套件 AI 学术研究者
Easy-Vibe Vibe Coding 入门 实战项目驱动 AI 编程初学者

结合当前技术背景的分析

2026 年 AI 工程教育正面临一个核心矛盾:AI 工具越来越强大,但真正理解其原理的工程师却越来越少。AI Engineering from Scratch 正好填补了这个缺口:

  1. AI 原生教育 — 课程本身就是用 Claude Code 辅助开发的,体现了"AI 辅助学习 AI"的理念
  2. 从原理到实践 — 在 AI 工具黑盒化的大趋势下,坚持"理解原理"的教育理念尤为可贵
  3. Agent 工程成为核心 — P14-P16 整整 89 节课聚焦 Agent 相关技术,反映了行业对 Agent 工程师的迫切需求
  4. 生产就绪 — 不只是理论课程,还涵盖 P17 基础设施和生产部署,培养的是能上手的工程师

对于想要在 AI 领域深耕的开发者来说,这个课程提供了一个从数学基础到前沿 Agent 工程的完整路径,是目前开源社区中最全面的 AI 工程学习资源之一。


更新记录(2026-05-21)

  • 首次上榜 GitHub Trending,获得 765 stars,总星数达 9,758
  • 作为 2026 年 3 月才创建的项目,两个月内获得近万星,增长速度惊人
    |—

更新记录(2026-05-22)

  • 二连上榜! 今日再获 1,333 stars,总星数达 10,886
  • 成为今日热榜 Top 5 项目,学习者对系统性 AI 工程教育的需求持续高涨
  • 课程持续更新中,从零实现 Transformer 到 Agent 工程实践的内容深度获好评

更新记录(2026-05-23)

  • 三连上榜! 今日再获 988 stars,总星数达 12,687
  • 连续三天位列今日热榜 Top 5,说明系统性 AI 工程教育的需求正在持续扩大
  • 435 课完整体系 + 从零实现的原则受到越来越多学习者的认可

更新记录(2026-05-24)

  • 今日再获 1,521 stars,总星数达 13,950
  • 本周累计获得 5,026 stars,日榜和周榜双双在列,增长势头稳定
  • 435 课/320 小时的完整课程体系持续吸引自学者——从底层数学到多智能体系统的全覆盖设计是其核心卖点

评论