CUDA入門
1. GPU并行計(jì)算
2. 深度學(xué)習(xí)與GPU:
(1)深度學(xué)習(xí)介紹以及GPU在其中的作用
(2)caffe框架介紹及mnist訓(xùn)練和測(cè)試講解
3. GPU體系架構(gòu)
4. OpenMP介紹
5. CUDA環(huán)境搭建
CUDA入門
1. CUDA C編程基礎(chǔ)
(1)CUDA編程模式:block和thread
(2)CUDA存儲(chǔ)模式:global memory/shared memory
(3)CUDA C關(guān)鍵字及內(nèi)核調(diào)用
(4)示例:向量加法
(5)課上練習(xí):矩陣加法
2. CUDA線程調(diào)度
3. CUDA調(diào)試方法
4. 課上練習(xí):調(diào)試方法練習(xí)
CUDA高級(jí)編程
1. 存儲(chǔ)器優(yōu)化技巧:
(1)矩陣乘法-global memory
(2)矩陣乘法-shared memory
2. 訪存優(yōu)化:bank conflict,bandwidth
3. 流與事件
4. 多GPU編程
5. 測(cè)試時(shí)間方法
6. 課上練習(xí):
CUDA高級(jí)編程
1. 并行算法設(shè)計(jì)的一般原則
2. 并行算法設(shè)計(jì)方法
3. 優(yōu)化技巧實(shí)戰(zhàn):卷積計(jì)算step by step優(yōu)化性能
4. 調(diào)優(yōu)工具:NSight分析性能瓶頸
|