非参数方法和机器学习在经济学中的应用课程详细信息

课程号 21130026 学分 2
英文名称 Applications of Nonparametric Methods and Machine Learning in Economics
先修课程 数学分析(或微积分),线性代数,概率论与数理统计,计量经济学
中文简介 《非参数方法以及机器学习在经济学中的应用》是一门面向全校学生开设的交叉型前沿课程,旨在系统讲授非参数方法与机器学习的基本理论、方法原理及其在经济学研究中的实践应用,帮助学生建立现代数据分析思维,提升解决经济学前沿问题的能力。课程内容涵盖非参数方法与机器学习两大模块。其中,非参数部分重点介绍基本概念、核方法、级数方法以及Bootstrap和Jackknife等统计推断工具,使学生理解如何在较少依赖函数形式假设的条件下识别和估计经济关系。机器学习部分则进一步覆盖模型评估与模型选择、LASSO与Ridge等收缩方法、最近邻方法、决策树与集成学习、支持向量机、深度学习以及双重机器学习、因果森林等因果机器学习前沿内容。课程在教学安排上注重理论与实践相结合,以“理论讲解+代码实操”为主要形式,使用Python开展应用训练,并结合经典教材与前沿论文阅读,引导学生掌握从方法理解、程序实现到研究应用的完整能力链条。通过本课程的学习,学生不仅能够系统掌握现代计量与机器学习方法,还能够提升代码实操、论文阅读和独立研究能力,为开展高水平经济学实证研究打下坚实基础。
英文简介 Nonparametric Methods and Machine Learning in Economics is an interdisciplinary and frontier-oriented course designed for students across the university. It aims to provide a systematic introduction to the fundamental theories, methodological principles, and practical applications of nonparametric methods and machine learning in economic research. The course is intended to help students develop a modern data-analytic mindset and strengthen their ability to address cutting-edge questions in economics.The course consists of two main components: nonparametric methods and machine learning. The nonparametric section introduces key concepts and commonly used approaches, including kernel methods, series estimation, and statistical inference tools such as the bootstrap and jackknife. This part emphasizes how to identify and estimate economic relationships with fewer functional form assumptions than traditional parametric models, thereby offering greater flexibility in empirical analysis.The machine learning section covers a broad range of core methods and modern applications, including model evaluation and model selection, regularization techniques such as LASSO and Ridge, k-nearest neighbors, decision trees and ensemble learning, support vector machines, and deep learning. In addition, the course introduces recent developments at the intersection of econometrics and machine learning, such as double machine learning and causal forests, with a focus on their use in causal inference and policy evaluation.In terms of teaching design, the course combines theoretical instruction with hands-on coding practice. Lectures are organized around a “theory plus implementation” framework, with Python used as the primary programming language for empirical applications. Through the study of both classic textbooks and frontier academic papers, students will be guided to build an integrated skill set that connects methodological understanding, computational implementation, and research application.By the end of the course, students are expected to acquire a solid understanding of modern nonparametric and machine learning methods, improve their programming and empirical research skills, enhance their ability to read and evaluate academic literature, and develop the capacity to conduct independent research in economics.
开课院系 现代农学院
成绩记载方式 百分制
通识课所属系列  
授课语言 中文
教材
参考书
教学大纲 本课程面向全校学生,系统讲授非参数方法与机器学习的基本理论、方法原理以及在经济学领域的实践应用,培养学生运用现代数据分析工具解决经济研究前沿问题的能力,提升学生代码实操、论文阅读与独立研究水平。
1.课程导论与方法基础
2. 非参数方法
a) 基本概念
b) Kernel Methods
c) Series Methods: Power Series, Spline Methods
d) Model Inference: Bootstrap and Jackknife
3. 机器学习方法
a) 基本概念
b) Model Assessment
I. Bias-Variance Tradeoff
II. Cross-validation
c) Model selection
I. Subset selection
II. Shrinkage Methods:LASSO and Ridge Regression
d)Prototype Methods and Nearest-Neighbors
e) Tree-Based Methods:
Decision Tree
Ensemble Methods: Bagging, Random Forests and Boosting
f)Support  Vector Machines
g)Deep Learning:
Single Layer Neural Networks
Multilayer Neural Networks
Convolutional Neural Networks
Recurrent Neural Networks
h) Causal Machine Learning:
Double Machine Learning
Causal Forest
4. 前沿论文品读


第一部分:课程导论与方法基础(2学时)
本部分主要介绍非参数方法与机器学习在经济学研究中的发展背景、核心问题与应用场景,帮助学生理解为什么传统参数模型在面对高维数据、非线性关系和复杂异质性时存在局限,以及现代数据分析方法如何弥补这些不足。课程将结合经济增长、劳动力市场、消费行为、政策评估等典型问题,引导学生形成“研究问题—方法选择—识别策略—结果解释”的基本分析框架,为后续学习奠定整体认知基础。
第二部分:非参数方法基本概念(2学时)
本部分系统介绍非参数方法的基本思想、与参数方法和半参数方法的区别、非参数估计的优势与局限,以及非参数方法在经济学实证中的适用条件。重点讲解函数形式设定偏误、灵活逼近、局部估计等核心概念,使学生理解非参数方法为何能够在较少函数形式约束下刻画经济变量之间的关系。同时结合经济学实例,说明样本量、维度灾难、平滑参数等问题对估计结果的影响,帮助学生建立对非参数方法的理性认识。
第三部分:核方法(4学时)
本部分围绕课程大纲中的Kernel Methods展开。前2学时重点讲解核密度估计与核回归的基本原理,包括核函数、局部加权平均、偏差与方差、带宽选择等内容,使学生理解核方法如何实现对未知函数的局部平滑估计。后2学时结合Python代码实操,演示不同核函数和带宽设置对估计结果的影响,并训练学生使用图形化方式解释非线性关系、局部趋势和边际效应。
第四部分:级数方法(2学时)
本部分对应课程大纲中的Series Methods,重点介绍幂级数方法的基本思想与实际应用。课程将讲解如何使用一组基函数对未知函数进行逼近,帮助学生理解级数方法与核方法在估计思路上的差异。教学中还将结合经济学案例讨论基函数选择、阶数设定与过拟合问题,使学生能够掌握级数方法在经验研究中的基本实现路径。
第五部分:模型推断——Bootstrap与Jackknife(2学时)
本部分围绕非参数和半参数分析中的统计推断展开,重点介绍Bootstrap和Jackknife这两类重抽样方法的原理、步骤与适用场景。课程将说明为何在复杂模型、有限样本和难以解析推导标准误的条件下,需要借助重抽样方法进行统计推断,并通过实例帮助学生理解置信区间构造、标准误估计与稳健性检验的实现方式。
第六部分:机器学习基本概念与模型评估(4学时)
本部分对应课程大纲中的机器学习基本概念与Model Assessment。前2学时主要介绍监督学习与非监督学习的区别、训练集与测试集划分、预测误差、过拟合与欠拟合,以及偏差—方差权衡等核心思想,帮助学生建立机器学习的基础分析框架。后2学时重点讲解交叉验证、模型比较和预测性能评估方法,并结合Python进行应用演示,使学生掌握如何在多个模型之间进行科学比较,而不是靠感觉第
七部分:模型选择与收缩方法(2学时)
本部分围绕Subset Selection以及Shrinkage Methods中的LASSO和Ridge Regression展开。课程将介绍变量选择的基本思想、高维数据下传统回归面临的问题,以及LASSO和Ridge如何通过惩罚项实现变量筛选与参数收缩。教学中将结合经济学数据案例,讲解正则化参数选择、偏差引入与预测性能改善之间的关系,使学生掌握在高维控制变量、文本特征或政策变量较多的情况下如何构建更稳定的模型。
第八部分:原型方法与最近邻方法(2学时)
本部分对应Prototype Methods and Nearest-Neighbors。课程将介绍k近邻方法的基本思想、距离度量、邻居数选择以及分类与回归中的应用,并分析该方法在局部预测、模式识别和异质性刻画中的优点与局限。通过实操训练,学生将理解最近邻方法为何简单直观、为何容易受维度影响,以及在经济数据中如何合理使用这类局部学习方法。
第九部分:树模型与集成学习(4学时)
本部分围绕Tree-Based Methods展开。前2学时介绍决策树的基本结构、特征划分、剪枝思想以及树模型在解释非线性和变量交互方面的优势。后2学时进一步介绍Bagging、Random Forest和Boosting等集成学习方法。课程将结合经济预测与政策识别案例,训练学生掌握树模型及其集成方法在处理复杂非线性关系和提高预测精度方面的作用。
第十部分:支持向量机(2学时)
本部分对应Support Vector Machines。课程将讲解最大间隔分类器、软间隔、核技巧等核心概念,并说明支持向量机在分类问题中的优势及其在高维样本中的适用性。
第十一部分:深度学习基础与拓展(4学时)
本部分对应Deep Learning模块。主要介绍单层神经网络与多层神经网络的结构、激活函数、损失函数、反向传播的基本思想,以及深度学习相对于传统机器学习方法的优势与局限。
第十二部分:因果机器学习与前沿论文品读(2学时)
本部分围绕课程大纲中的Causal Machine Learning展开,重点介绍Double Machine Learning的核心思想,说明机器学习如何服务于因果推断、异质性处理效应识别和政策评估。课程还将组织学生阅读与专题相关的经典论文和前沿文献,引导学生理解现代经济学研究如何将方法工具、识别策略与现实问题结合起来。通过本部分学习,学生不仅能够了解因果机器学习的研究前沿,也能够提升学术论文阅读、方法辨析和独立研究设计的能力。
60%课堂教授+25%代码实操+10%文献阅读+5%报告展示
成绩的20%来源于平时表现(包括到课情况、参与课程积极性以及课后与教师互动等),剩余80%来源于课程所安排的小组作业(2-3人一组),即利用课程所学知识,选择一个经济学领域的课题,收集数据进行分析,完成一份4-6页书面的报告书,并在全班面前进行展示(报告书占40%,展示占40%)。
教学评估