深度学习中的高效计算方法课程详细信息

课程号 04835640 学分 2
英文名称 Efficient Computing of Deep Neural Networks
先修课程 数据结构与算法,C/C++编程语言
中文简介 深度神经网络(DNN)的高计算需求及其在云平台和物联网平台中的广泛应用,催生了专门用于加速DNN执行的硬件和软件技术的发展。本课程将介绍DNN高效应用和计算技术,将从DNN的概述开始,介绍支持DNN的各种框架和架构,以及在特定计算平台上的实现与优化方法。本课程邀请香港中文大学余备教授一起联合讲授。
英文简介 The high computational demands of deep neural networks (DNNs) coupled with their pervasiveness across both cloud and IoT platforms have led to a rise in specialized hardware and software techniques to accelerate DNN executions. This course will present techniques that enable efficient applications and computing of DNNs. The course will start with an overview of DNNs, and then will introduce various frameworks and architectures that support DNNs, as well as the implementations and optimizations on some particular computing platforms. The course will be co-instructed by Prof. Bei Yu of the Chinese University of Hong Kong.
开课院系 信息科学技术学院
成绩记载方式  
通识课所属系列  
授课语言 中英双语
教材
参考书
教学大纲 在课程学习结束时,学生将掌握以下知识和技能:
1) 深度神经网络(DNN)架构和结构的相关知识;
2) DNN推理过程和算法的相关知识;
3) DNN推理高效计算的相关知识。
本课程涵盖模型压缩、剪枝、量化、高效网络架构设计以及深度学习框架的软件优化等内容。学生需具备C/C++编程语言和数据结构的基础知识。
具体学时安排如下:
1、课程简介:课堂讲授2学时
2、矩阵乘法算子:课堂讲授4学时,实践4学时
3、模型稀疏化:课堂讲授4学时,实践4学时
4、低秩分解:课堂讲授4学时,实践4学时
5、模型量化:课堂讲授2学时,实践2学时
6、模型二值化:课堂讲授2学时,实践2学时
本课程采用英文课件、中文讲授,辅以教学工具的实践。
两次课程项目作业,各占50%评分。
教学评估