机器学习系统工程教材（CS249r）

哈佛大学出品的机器学习系统工程教材，集成 TinyTorch 框架与边缘设备部署实验，覆盖从 ML 基础到系统优化的完整知识体系。

项目概述#

CS249r Book (MLSysBook.ai) 是哈佛大学 Vijay Janapa Reddi 教授主导的机器学习系统工程教材项目，定位于填补"ML 算法 ↔ 系统工程"之间的教学空白。项目当前版本为 v0.5.1 (Early Access Preview)，计划由 MIT Press 于 2026 年出版精装版。

核心定位#

定位描述：Introduction to Machine Learning Systems — Principles and Practices of Engineering Artificially Intelligent Systems
所属机构：Harvard University (harvard-edge)
作者/维护者：Prof. Vijay Janapa Reddi
主要语言：JavaScript (81.2%), Python (13.9%), TeX (2.4%), HTML, Lua, Shell

学习栈（Learning Stack）#

层级	组件	用途	状态
READ	教材	理论、概念与最佳实践（涵盖 ML ↔ 系统工程桥梁）	✅ 可用
BUILD	TinyTorch 框架	从零实现 ML 框架（仅依赖 NumPy）	✅ 可用
DEPLOY	硬件 Kits	在真实受限设备上部署（Arduino、Raspberry Pi 等）	✅ 可用
EXPLORE	Software Co-Labs	对延迟、内存、能耗、成本等做受控实验	🔄 2026 推出
PROVE	AI Olympics	跨赛道竞争与基准测试	🔄 2026 推出

教材结构（六大部分）#

Part	主题	覆盖章节
I. Foundations	核心概念	Introduction, ML Systems, DL Primer, Architectures
II. Design	构建模块	Workflow, Data Engineering, Frameworks, Training
III. Performance	加速	Efficient AI, Optimizations, HW Acceleration, Benchmarking
IV. Deployment	部署	MLOps, On-device Learning, Privacy, Robustness
V. Trust	可信与可持续	Responsible AI, Sustainable AI, AI for Good
VI. Frontiers	前沿	新兴趋势与未来方向

TinyTorch 20 模块课程#

Part	模块编号	构建内容
I. Foundations	01-08	Tensors, activations, layers, losses, dataloader, autograd, optimizers, training
II. Vision	09	Conv2d, CNNs for image classification
III. Language	10-13	Tokenization, embeddings, attention, transformers
IV. Optimization	14-20	Profiling, quantization, compression, acceleration, benchmarking, capstone

工作流：src/*.py → modules/*.ipynb → tinytorch/*.py，由 tito CLI 驱动（23 条子命令）

硬件 Kits 支持平台#

Arduino Nicla Vision（STM32H7，超低功耗视觉）
Seeed XIAO ESP32S3（WiFi 视觉）
Grove Vision AI V2（无代码快速原型）
Raspberry Pi（复杂边缘 AI 流水线）

硬件 Labs 技能矩阵#

Lab	构建内容	技能
Setup	硬件与环境配置	工具链、烧录、调试
Image Classification	CNN 图像识别	模型部署、推理
Object Detection	实时目标检测	YOLO、边界框
Keyword Spotting	音频唤醒词检测	DSP、MFCC 特征
Motion Classification	IMU 手势识别	传感器融合、时间序列

ML ↔ 系统工程桥梁#

ML 概念	系统概念	学习要点
模型参数	内存约束	如何在资源受限设备上装入大模型
推理延迟	硬件加速	GPU/TPU/NPU 如何执行神经网络
训练收敛	计算效率	混合精度与优化技术如何降低成本
模型精度	量化与剪枝	如何压缩模型并保持性能
数据需求	流水线基础设施	如何构建高效的数据加载与预处理
模型部署	MLOps 实践	如何监控、版本管理与更新生产模型
隐私约束	端侧学习	如何在不上传数据的情况下训练与适配模型

历史里程碑复现（TinyTorch）#

年份	里程碑	学习成就
1958	感知机	梯度下降二分类
1969	XOR 危机	多层网络解决非线性问题
1986	反向传播	多层网络训练
1998	CNN 革命	卷积图像分类
2017	Transformer	自注意力语言生成
2018+	MLPerf	生产级优化基准

安装与快速开始#

教材阅读（读者）#

# 在线阅读
open https://mlsysbook.ai

# 下载格式
curl -O https://mlsysbook.ai/pdf      # PDF
curl -O https://mlsysbook.ai/epub     # EPUB

教材贡献者构建#

cd book
./binder setup
./binder doctor
./binder build              # 构建 HTML 书
./binder preview intro      # 带热重载预览章节
./binder pdf                # 构建 PDF
./binder epub               # 构建 EPUB

TinyTorch 安装（开发者）#

cd tinytorch
pip install -r requirements.txt
tito --help

仓库结构#

cs249r_book/
├── book/           # 教材源码（Quarto Markdown）
├── tinytorch/      # TinyTorch 框架与课程（600+ 测试用例）
├── kits/           # 硬件实验 Labs
├── labs/           # 通用实验室资源
├── _brand/         # 品牌与设计资源
├── binder/         # 根目录 binder 脚本
├── pyproject.toml  # Python 项目配置
├── CITATION.bib    # 学术引用
└── LICENSE.md      # 许可证声明

适用场景#

高校课程教材：机器学习系统、边缘 AI、嵌入式智能课程
自学者进阶路径：从 DL 理论走向框架实现与生产部署
工程培训材料：团队系统性补齐 ML Sys 知识图谱
研究参考：MLSys 研究入门与文献线索