2.
导论
search
Quick search
code
Show Source
GitHub
English
Table Of Contents
1. 前言
2. 导论
2.1. 机器学习应用
2.2. 机器学习框架的设计目标
2.3. 机器学习框架的基本组成原理
2.4. 机器学习系统生态
2.5. 图书结构和读者
3. 编程接口
3.1. 机器学习系统编程模型的演进
3.2. 机器学习工作流
3.3. 定义深度神经网络
3.4. C/C++编程接口
3.5. 机器学习框架的编程范式
3.6. 总结
3.7. 扩展阅读
4. 计算图
4.1. 计算图的设计背景和作用
4.2. 计算图的基本构成
4.3. 计算图的生成
4.4. 计算图的调度
4.5. 总结
4.6. 扩展阅读
5. 第二部分:进阶篇
6. AI编译器和前端技术
6.1. AI编译器设计原理
6.2. AI编译器前端技术概述
6.3. 中间表示
6.4. 自动微分
6.5. 类型系统和静态分析
6.6. 常见前端编译优化方法
6.7. 总结
6.8. 扩展阅读
7. 编译器后端和运行时
7.1. 概述
7.2. 计算图优化
7.3. 算子选择
7.4. 内存分配
7.5. 计算调度与执行
7.6. 算子编译器
7.7. 总结
7.8. 扩展阅读
8. 硬件加速器
8.1. 概述
8.2. 加速器基本组成原理
8.3. 加速器基本编程原理
8.4. 加速器实践
8.5. 总结
8.6. 扩展阅读
8.7. 参考文献
9. 数据处理框架
9.1. 概述
9.2. 易用性设计
9.3. 高效性设计
9.4. 保序性设计
9.5. 单机数据处理性能的扩展
9.6. 总结
9.7. 扩展阅读
10. 模型部署
10.1. 概述
10.2. 训练模型到推理模型的转换及优化
10.3. 模型压缩
10.4. 模型推理
10.5. 模型的安全保护
10.6. 总结
10.7. 扩展阅读
11. 分布式训练
11.1. 系统概述
11.2. 实现方法
11.3. 流水线并行
11.4. 机器学习集群架构
11.5. 集合通信
11.6. 参数服务器
11.7. 总结
11.8. 拓展阅读
12. 第三部分:拓展篇
13. 深度学习推荐系统
13.1. 系统基本组成
13.2. 多阶段推荐系统
13.3. 模型更新
13.4. 案例分析:支持在线模型更新的大型推荐系统
13.5. 小结
13.6. 扩展阅读
13.7. 参考文献
14. 联邦学习系统
14.1. 概述
14.2. 横向联邦学习
14.3. 纵向联邦学习
14.4. 隐私加密算法
14.5. 展望
14.6. 小结
15. 强化学习系统
15.1. 强化学习介绍
15.2. 单节点强化学习系统
15.3. 分布式强化学习系统
15.4. 多智能体强化学习
15.5. 多智能体强化学习系统
15.6. 小结
15.7. 参考文献
16. 可解释性AI系统
16.1. 背景
16.2. 可解释AI定义
16.3. 可解释AI算法现状介绍
16.4. 可解释AI系统及实践
16.5. 未来可解释AI
16.6. 参考文献
17. 机器人系统
17.1. 机器人系统概述
17.2. 通用机器人操作系统
17.3. 案例分析:使用机器人操作系统
17.4. 总结
附录:机器学习介绍
1. 神经网络
2. 梯度下降与反向传播
3. 经典机器学习方法
4. 参考文献
Table Of Contents
1. 前言
2. 导论
2.1. 机器学习应用
2.2. 机器学习框架的设计目标
2.3. 机器学习框架的基本组成原理
2.4. 机器学习系统生态
2.5. 图书结构和读者
3. 编程接口
3.1. 机器学习系统编程模型的演进
3.2. 机器学习工作流
3.3. 定义深度神经网络
3.4. C/C++编程接口
3.5. 机器学习框架的编程范式
3.6. 总结
3.7. 扩展阅读
4. 计算图
4.1. 计算图的设计背景和作用
4.2. 计算图的基本构成
4.3. 计算图的生成
4.4. 计算图的调度
4.5. 总结
4.6. 扩展阅读
5. 第二部分:进阶篇
6. AI编译器和前端技术
6.1. AI编译器设计原理
6.2. AI编译器前端技术概述
6.3. 中间表示
6.4. 自动微分
6.5. 类型系统和静态分析
6.6. 常见前端编译优化方法
6.7. 总结
6.8. 扩展阅读
7. 编译器后端和运行时
7.1. 概述
7.2. 计算图优化
7.3. 算子选择
7.4. 内存分配
7.5. 计算调度与执行
7.6. 算子编译器
7.7. 总结
7.8. 扩展阅读
8. 硬件加速器
8.1. 概述
8.2. 加速器基本组成原理
8.3. 加速器基本编程原理
8.4. 加速器实践
8.5. 总结
8.6. 扩展阅读
8.7. 参考文献
9. 数据处理框架
9.1. 概述
9.2. 易用性设计
9.3. 高效性设计
9.4. 保序性设计
9.5. 单机数据处理性能的扩展
9.6. 总结
9.7. 扩展阅读
10. 模型部署
10.1. 概述
10.2. 训练模型到推理模型的转换及优化
10.3. 模型压缩
10.4. 模型推理
10.5. 模型的安全保护
10.6. 总结
10.7. 扩展阅读
11. 分布式训练
11.1. 系统概述
11.2. 实现方法
11.3. 流水线并行
11.4. 机器学习集群架构
11.5. 集合通信
11.6. 参数服务器
11.7. 总结
11.8. 拓展阅读
12. 第三部分:拓展篇
13. 深度学习推荐系统
13.1. 系统基本组成
13.2. 多阶段推荐系统
13.3. 模型更新
13.4. 案例分析:支持在线模型更新的大型推荐系统
13.5. 小结
13.6. 扩展阅读
13.7. 参考文献
14. 联邦学习系统
14.1. 概述
14.2. 横向联邦学习
14.3. 纵向联邦学习
14.4. 隐私加密算法
14.5. 展望
14.6. 小结
15. 强化学习系统
15.1. 强化学习介绍
15.2. 单节点强化学习系统
15.3. 分布式强化学习系统
15.4. 多智能体强化学习
15.5. 多智能体强化学习系统
15.6. 小结
15.7. 参考文献
16. 可解释性AI系统
16.1. 背景
16.2. 可解释AI定义
16.3. 可解释AI算法现状介绍
16.4. 可解释AI系统及实践
16.5. 未来可解释AI
16.6. 参考文献
17. 机器人系统
17.1. 机器人系统概述
17.2. 通用机器人操作系统
17.3. 案例分析:使用机器人操作系统
17.4. 总结
附录:机器学习介绍
1. 神经网络
2. 梯度下降与反向传播
3. 经典机器学习方法
4. 参考文献
2.
导论
¶
本章将会介绍机器学习应用,梳理出机器学习系统的设计目标,总结出机器学习系统的基本组成原理,让读者对机器学习系统有自顶而下的全面了解。
2.1. 机器学习应用
2.2. 机器学习框架的设计目标
2.3. 机器学习框架的基本组成原理
2.4. 机器学习系统生态
2.5. 图书结构和读者
Previous
1. 前言
Next
2.1. 机器学习应用