2.
导论
search
Quick search
code
Show Source
GitHub
English
Table Of Contents
1. 前言
2. 导论
keyboard_arrow_down
2.1. 机器学习应用
2.2. 机器学习框架的设计目标
2.3. 机器学习框架的基本组成原理
2.4. 机器学习系统生态
2.5. 图书结构和读者
3. 编程接口
keyboard_arrow_down
3.1. 机器学习系统编程模型的演进
3.2. 机器学习工作流
3.3. 定义深度神经网络
3.4. C/C++编程接口
3.5. 机器学习框架的编程范式
3.6. 总结
3.7. 扩展阅读
4. 计算图
keyboard_arrow_down
4.1. 计算图的设计背景和作用
4.2. 计算图的基本构成
4.3. 计算图的生成
4.4. 计算图的调度
4.5. 总结
4.6. 扩展阅读
5. 第二部分:进阶篇
6. AI编译器和前端技术
keyboard_arrow_down
6.1. AI编译器设计原理
6.2. AI编译器前端技术概述
6.3. 中间表示
6.4. 自动微分
6.5. 类型系统和静态分析
6.6. 常见前端编译优化方法
6.7. 总结
6.8. 扩展阅读
7. 编译器后端和运行时
keyboard_arrow_down
7.1. 概述
7.2. 计算图优化
7.3. 算子选择
7.4. 内存分配
7.5. 计算调度与执行
7.6. 算子编译器
7.7. 总结
7.8. 扩展阅读
8. 硬件加速器
keyboard_arrow_down
8.1. 概述
8.2. 加速器基本组成原理
8.3. 加速器基本编程原理
8.4. 加速器实践
8.5. 总结
8.6. 扩展阅读
8.7. 参考文献
9. 数据处理框架
keyboard_arrow_down
9.1. 概述
9.2. 易用性设计
9.3. 高效性设计
9.4. 保序性设计
9.5. 单机数据处理性能的扩展
9.6. 总结
9.7. 扩展阅读
10. 模型部署
keyboard_arrow_down
10.1. 概述
10.2. 训练模型到推理模型的转换及优化
10.3. 模型压缩
10.4. 模型推理
10.5. 模型的安全保护
10.6. 总结
10.7. 扩展阅读
11. 分布式训练
keyboard_arrow_down
11.1. 系统概述
11.2. 实现方法
11.3. 流水线并行
11.4. 机器学习集群架构
11.5. 集合通信
11.6. 参数服务器
11.7. 总结
11.8. 拓展阅读
12. 第三部分:拓展篇
13. 深度学习推荐系统
keyboard_arrow_down
13.1. 系统基本组成
13.2. 多阶段推荐系统
13.3. 模型更新
13.4. 案例分析:支持在线模型更新的大型推荐系统
13.5. 小结
13.6. 扩展阅读
13.7. 参考文献
14. 联邦学习系统
keyboard_arrow_down
14.1. 概述
14.2. 横向联邦学习
14.3. 纵向联邦学习
14.4. 隐私加密算法
14.5. 展望
14.6. 小结
15. 强化学习系统
keyboard_arrow_down
15.1. 强化学习介绍
15.2. 单节点强化学习系统
15.3. 分布式强化学习系统
15.4. 多智能体强化学习
15.5. 多智能体强化学习系统
15.6. 小结
15.7. 参考文献
16. 可解释性AI系统
keyboard_arrow_down
16.1. 背景
16.2. 可解释AI定义
16.3. 可解释AI算法现状介绍
16.4. 可解释AI系统及实践
16.5. 未来可解释AI
16.6. 参考文献
17. 机器人系统
keyboard_arrow_down
17.1. 机器人系统概述
17.2. 通用机器人操作系统
17.3. 案例分析:使用机器人操作系统
17.4. 总结
附录:机器学习介绍
keyboard_arrow_down
1. 神经网络
2. 梯度下降与反向传播
3. 经典机器学习方法
4. 参考文献
Table Of Contents
1. 前言
2. 导论
keyboard_arrow_down
2.1. 机器学习应用
2.2. 机器学习框架的设计目标
2.3. 机器学习框架的基本组成原理
2.4. 机器学习系统生态
2.5. 图书结构和读者
3. 编程接口
keyboard_arrow_down
3.1. 机器学习系统编程模型的演进
3.2. 机器学习工作流
3.3. 定义深度神经网络
3.4. C/C++编程接口
3.5. 机器学习框架的编程范式
3.6. 总结
3.7. 扩展阅读
4. 计算图
keyboard_arrow_down
4.1. 计算图的设计背景和作用
4.2. 计算图的基本构成
4.3. 计算图的生成
4.4. 计算图的调度
4.5. 总结
4.6. 扩展阅读
5. 第二部分:进阶篇
6. AI编译器和前端技术
keyboard_arrow_down
6.1. AI编译器设计原理
6.2. AI编译器前端技术概述
6.3. 中间表示
6.4. 自动微分
6.5. 类型系统和静态分析
6.6. 常见前端编译优化方法
6.7. 总结
6.8. 扩展阅读
7. 编译器后端和运行时
keyboard_arrow_down
7.1. 概述
7.2. 计算图优化
7.3. 算子选择
7.4. 内存分配
7.5. 计算调度与执行
7.6. 算子编译器
7.7. 总结
7.8. 扩展阅读
8. 硬件加速器
keyboard_arrow_down
8.1. 概述
8.2. 加速器基本组成原理
8.3. 加速器基本编程原理
8.4. 加速器实践
8.5. 总结
8.6. 扩展阅读
8.7. 参考文献
9. 数据处理框架
keyboard_arrow_down
9.1. 概述
9.2. 易用性设计
9.3. 高效性设计
9.4. 保序性设计
9.5. 单机数据处理性能的扩展
9.6. 总结
9.7. 扩展阅读
10. 模型部署
keyboard_arrow_down
10.1. 概述
10.2. 训练模型到推理模型的转换及优化
10.3. 模型压缩
10.4. 模型推理
10.5. 模型的安全保护
10.6. 总结
10.7. 扩展阅读
11. 分布式训练
keyboard_arrow_down
11.1. 系统概述
11.2. 实现方法
11.3. 流水线并行
11.4. 机器学习集群架构
11.5. 集合通信
11.6. 参数服务器
11.7. 总结
11.8. 拓展阅读
12. 第三部分:拓展篇
13. 深度学习推荐系统
keyboard_arrow_down
13.1. 系统基本组成
13.2. 多阶段推荐系统
13.3. 模型更新
13.4. 案例分析:支持在线模型更新的大型推荐系统
13.5. 小结
13.6. 扩展阅读
13.7. 参考文献
14. 联邦学习系统
keyboard_arrow_down
14.1. 概述
14.2. 横向联邦学习
14.3. 纵向联邦学习
14.4. 隐私加密算法
14.5. 展望
14.6. 小结
15. 强化学习系统
keyboard_arrow_down
15.1. 强化学习介绍
15.2. 单节点强化学习系统
15.3. 分布式强化学习系统
15.4. 多智能体强化学习
15.5. 多智能体强化学习系统
15.6. 小结
15.7. 参考文献
16. 可解释性AI系统
keyboard_arrow_down
16.1. 背景
16.2. 可解释AI定义
16.3. 可解释AI算法现状介绍
16.4. 可解释AI系统及实践
16.5. 未来可解释AI
16.6. 参考文献
17. 机器人系统
keyboard_arrow_down
17.1. 机器人系统概述
17.2. 通用机器人操作系统
17.3. 案例分析:使用机器人操作系统
17.4. 总结
附录:机器学习介绍
keyboard_arrow_down
1. 神经网络
2. 梯度下降与反向传播
3. 经典机器学习方法
4. 参考文献
2.
导论
¶
本章将会介绍机器学习应用,梳理出机器学习系统的设计目标,总结出机器学习系统的基本组成原理,让读者对机器学习系统有自顶而下的全面了解。
2.1. 机器学习应用
2.2. 机器学习框架的设计目标
2.3. 机器学习框架的基本组成原理
2.4. 机器学习系统生态
2.5. 图书结构和读者
Previous
1. 前言
Next
2.1. 机器学习应用