Skip to content

Commit

Permalink
Update 第十五章_异构运算、GPU及框架选型.md
Browse files Browse the repository at this point in the history
添加15章节的第2版内容结构草稿。
  • Loading branch information
szho42 authored Nov 1, 2018
1 parent 0c61cad commit 0d6c3f8
Showing 1 changed file with 108 additions and 1 deletion.
Original file line number Diff line number Diff line change
@@ -1,4 +1,111 @@
# 第十五章 GPU和框架选型指南
# 第十五章 异构计算, GPU和框架选型指南
深度学习训练和推理的过程中,会涉及到大量的向量(vector),矩阵(matrix)和张量(tensor)操作,通常需要大量的浮点计算,包括高精度(在训练的时候)低精度(在推理和部署的时候)。GPU, 作为一种通用可编程的加速器,最初设计是用来进行图形处理和渲染功能,但是从2007年开始,英伟达(NVIDIA)公司提出了第一个可编程通用计算平台(GPGPU),同时提出了CUDA框架,从此开启了GPU用于通用计算的新纪元。此后,不计其数的科研人员和开发者,对各种不同类型的算法用CUDA进行(部分)改写,从而达到几倍到数百倍的加速效果。尤其是在机器学习,特别是深度学习的浪潮来临后,GPU加速已经是各类工具实现的基本底层构架之一。本章里,会简单介绍GPU的基本架构,和与深度学习相关的内容。

## 15.1 什么是异构计算?

## 15.2 什么是GPGPU?

## 15.3 GPU架构简介

(架构内容,和CPU的区别 + 图示)

### 15.3.1 CUDA 核心是什么?

### 15.3.2 新图领架构里的tensor core对深度学习有什么作用?

### 15.3.3 GPU内存架构和应用性能的联系?

## 15.4 CUDA 框架

### 15.4.1 做CUDA编程难不难?

### 15.4.2 cuDNN

## 15.5 GPU硬件环境配置推荐

### 15.5.1 GPU主要性能指标

### 15.5.2 购买建议


## 15.6 软件环境搭建

### 15.6.1 本机安装还是使用docker?

### 15.6.2 GPU驱动问题

## 15.7 框架选择

### 15.7.1 主流框架比较

(一个大表格比较)

### 15.7.2 框架详细信息

* Tensorflow

* PyTorch

* Keras

* Sonnet

* Caffe

* Caffe2

* MxNet

* CNTK

* 其他国内自主开发开源框架

### 15.7.3 哪些框架对于部署环境友好?

* Tensorflow Serving

* ONNX 标准

* TensorRT

* ONNPACK

* Clipper

### 15.7.4 移动平台的框架如何选择?

* Tensorflow Lite

* Caffe2


## 15.8 其他

### 15.8.1 多GPU环境的配置

* Tensorflow

* PyTorch


### 15.8.2 是不是可以分布式训练?


### 15.8.3 可以在SPARK环境里训练或者部署模型吗?

### 15.8.4 怎么进一步优化性能?

* TVM

* nGraph

### 15.8.5 TPU和GPU的区别?

### 15.8.6 未来量子计算对于深度学习等AI技术的影像?


-------


## 15.1 GPU购买指南

Expand Down

0 comments on commit 0d6c3f8

Please sign in to comment.