发现 AI 代理的未来arrow_forward

机器学习系统工程教材(CS249r)

calendar_today收录于 2026年2月23日
category文档教程与资源
code开源
PythonPyTorch深度学习机器学习Web应用文档教程与资源其他教育/研究资源模型训练/推理

哈佛大学出品的机器学习系统工程教材,集成 TinyTorch 框架与边缘设备部署实验,覆盖从 ML 基础到系统优化的完整知识体系。

项目概述#

CS249r Book (MLSysBook.ai) 是哈佛大学 Vijay Janapa Reddi 教授主导的机器学习系统工程教材项目,定位于填补"ML 算法 ↔ 系统工程"之间的教学空白。项目当前版本为 v0.5.1 (Early Access Preview),计划由 MIT Press 于 2026 年出版精装版。

核心定位#

  • 定位描述:Introduction to Machine Learning Systems — Principles and Practices of Engineering Artificially Intelligent Systems
  • 所属机构:Harvard University (harvard-edge)
  • 作者/维护者:Prof. Vijay Janapa Reddi
  • 主要语言:JavaScript (81.2%), Python (13.9%), TeX (2.4%), HTML, Lua, Shell

学习栈(Learning Stack)#

层级组件用途状态
READ教材理论、概念与最佳实践(涵盖 ML ↔ 系统工程桥梁)✅ 可用
BUILDTinyTorch 框架从零实现 ML 框架(仅依赖 NumPy)✅ 可用
DEPLOY硬件 Kits在真实受限设备上部署(Arduino、Raspberry Pi 等)✅ 可用
EXPLORESoftware Co-Labs对延迟、内存、能耗、成本等做受控实验🔄 2026 推出
PROVEAI Olympics跨赛道竞争与基准测试🔄 2026 推出

教材结构(六大部分)#

Part主题覆盖章节
I. Foundations核心概念Introduction, ML Systems, DL Primer, Architectures
II. Design构建模块Workflow, Data Engineering, Frameworks, Training
III. Performance加速Efficient AI, Optimizations, HW Acceleration, Benchmarking
IV. Deployment部署MLOps, On-device Learning, Privacy, Robustness
V. Trust可信与可持续Responsible AI, Sustainable AI, AI for Good
VI. Frontiers前沿新兴趋势与未来方向

TinyTorch 20 模块课程#

Part模块编号构建内容
I. Foundations01-08Tensors, activations, layers, losses, dataloader, autograd, optimizers, training
II. Vision09Conv2d, CNNs for image classification
III. Language10-13Tokenization, embeddings, attention, transformers
IV. Optimization14-20Profiling, quantization, compression, acceleration, benchmarking, capstone

工作流src/*.pymodules/*.ipynbtinytorch/*.py,由 tito CLI 驱动(23 条子命令)


硬件 Kits 支持平台#

  • Arduino Nicla Vision(STM32H7,超低功耗视觉)
  • Seeed XIAO ESP32S3(WiFi 视觉)
  • Grove Vision AI V2(无代码快速原型)
  • Raspberry Pi(复杂边缘 AI 流水线)

硬件 Labs 技能矩阵#

Lab构建内容技能
Setup硬件与环境配置工具链、烧录、调试
Image ClassificationCNN 图像识别模型部署、推理
Object Detection实时目标检测YOLO、边界框
Keyword Spotting音频唤醒词检测DSP、MFCC 特征
Motion ClassificationIMU 手势识别传感器融合、时间序列

ML ↔ 系统工程桥梁#

ML 概念系统概念学习要点
模型参数内存约束如何在资源受限设备上装入大模型
推理延迟硬件加速GPU/TPU/NPU 如何执行神经网络
训练收敛计算效率混合精度与优化技术如何降低成本
模型精度量化与剪枝如何压缩模型并保持性能
数据需求流水线基础设施如何构建高效的数据加载与预处理
模型部署MLOps 实践如何监控、版本管理与更新生产模型
隐私约束端侧学习如何在不上传数据的情况下训练与适配模型

历史里程碑复现(TinyTorch)#

年份里程碑学习成就
1958感知机梯度下降二分类
1969XOR 危机多层网络解决非线性问题
1986反向传播多层网络训练
1998CNN 革命卷积图像分类
2017Transformer自注意力语言生成
2018+MLPerf生产级优化基准

安装与快速开始#

教材阅读(读者)#

# 在线阅读
open https://mlsysbook.ai

# 下载格式
curl -O https://mlsysbook.ai/pdf      # PDF
curl -O https://mlsysbook.ai/epub     # EPUB

教材贡献者构建#

cd book
./binder setup
./binder doctor
./binder build              # 构建 HTML 书
./binder preview intro      # 带热重载预览章节
./binder pdf                # 构建 PDF
./binder epub               # 构建 EPUB

TinyTorch 安装(开发者)#

cd tinytorch
pip install -r requirements.txt
tito --help

仓库结构#

cs249r_book/
├── book/           # 教材源码(Quarto Markdown)
├── tinytorch/      # TinyTorch 框架与课程(600+ 测试用例)
├── kits/           # 硬件实验 Labs
├── labs/           # 通用实验室资源
├── _brand/         # 品牌与设计资源
├── binder/         # 根目录 binder 脚本
├── pyproject.toml  # Python 项目配置
├── CITATION.bib    # 学术引用
└── LICENSE.md      # 许可证声明

适用场景#

  • 高校课程教材:机器学习系统、边缘 AI、嵌入式智能课程
  • 自学者进阶路径:从 DL 理论走向框架实现与生产部署
  • 工程培训材料:团队系统性补齐 ML Sys 知识图谱
  • 研究参考:MLSys 研究入门与文献线索

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。

rocket_launch