计算机科学高级专题课程详细信息

课程号 04835490 学分 2
英文名称 Advanced Topics in Computer Science
先修课程 无。
中文简介 本课程涉及计算机学科多个领域,由北大计算机学院的多位知名教授共同讲授,课程内容包括程序设计语言概览、开源数据分析、人工智能时代的数据库系统、计算摄像学、计算机视觉、普适计算和情境感知、人工智能系统实践、软硬件协同设计优化、现代自适应计算、网络计算与分布式系统、智能视频传输、同伴预测与群体智慧以及具身智能。课程理论和实践并重,将设置多个实验和操作环节。通过本课程的学习,学生基本掌握编程语言发展、量子算法、深度学习应用、操作系统原理、视频传输优化、计算摄像学基本概念、人工智能系统构建、智能机器人原理、软硬件设计协同优化、现代自适应计算、网络计算技术、开源数据分析以及普适计算的愿景和无线传感技术应用等计算学科各个领域的核心原理与方法,获得相关领域的实践经验,提高创新意识和实践能力。本课程的各部分内容概要介绍如下:

1. 程序设计语言概览(熊英飞):介绍编程语言的发展、技术、未来方向。
2. 开源数据分析(周明辉):讨论开源软件及其开发复杂性,以及挖掘数据揭示开源规律的量化分析技术和建立智能工具控制复杂系统及其开发的方法。
3. 人工智能时代的数据库系统(吴垠鋆):本课程旨在帮助学生理解人工智能时代数据库系统面临的新挑战和机遇,了解数据库系统与人工智能技术的融合趋势,例如智能查询优化、自动数据管理等;掌握支持人工智能应用的新型数据库技术,例如向量数据库等。
4. 计算摄像学(施伯鑫):介绍计算摄像学的基本概念、研究趋势、数字图像形成以及数码相机工作原理,并包含与成像基本原理相关的课程实践练习。
5. 计算机视觉(仉尚航):介绍重要模型与算法,深度学习在其中的应用,以及面对开放环境的计算机视觉挑战,包括大量数据域偏移和新类别动态出现。
6. 普适计算和情境感知(张大庆):介绍普适计算的愿景、历史、研究原则和情境感知计算,涵盖无线传感作为新的情境感知计算研究领域。
7. 人工智能系统实践(王乐业):涵盖问题建模、数据获取、预处理、调参、部署和维护等技术,通过现实人工智能系统实例展示系统构建全流程所需的关键知识和工具。
8. 软硬件协同设计优化(刘先华):探讨硬件和软件组件的协同设计原则,强调提高性能和效率,学生将参与实践项目设计系统。
9. 现代自适应计算(罗国杰):介绍现代自适应计算的芯片架构、编译技术、编程接口等,以及其作为系统原型研究平台的典型案例。
10. 网络计算与分布式系统(吴文斐):介绍在网络计算的原语,降低网络流量和时延,提升系统效率的设计、管理、应用编程模型等。
11. 智能视频传输(边凯归):探讨提升视频流服务与体验质量的关键技术,如预测视频内容流行度、网络带宽动态变化表征、对象检测等,为 5G 时代视频内容消费者提供更好服务。
12. 同伴预测与群体智慧(孔雨晴):本章介绍同行预测机制,该机制无需依赖客观真实值,即可激励参与者真实报告意见。基于信息论框架,它适用于两人参与的有限任务场景,并通过报告匹配进行奖励。此外,我们将探讨该机制与从噪声标签数据中学习的关系。
13. 具身智能(王鹤): 本课程聚焦具身智能这一通用人工智能发展的关键领域,探索通过物理交互实现智能行为的系统。内容涵盖足式机器人与灵巧手操作、多模态大模型应用(如GPT-4V/4o)、以及从仿真到现实(Sim2Real)技术的核心任务与方法。学生将有机会在真实机器人上进行实验,深入理解具身智能在机器人控制与交互中的前沿挑战和应用。
英文简介 Students will explore programming language development, traditional and quantum algorithm design, deep learning in computer vision, challenges in open-world vision, operating system principles, video streaming optimization, computational photography, AI system construction, embodied intelligence, hardware-software co-design, adaptive computing, network computing, open-source software complexities, and ubiquitous computing with wireless sensing applications. The course includes practical experiments to master core principles, enhance skills, and foster innovation.
1. An Overview of Programming Language Research – Introduction to the evolution, technologies, and future directions of programming languages, featuring related professors at Peking University.
2. Open-source Data Analytics – Examines open-source software development, quantitative analysis techniques for pattern recognition, and intelligent tools for complex system control via data mining.
3. Database Systems in the AI Era – Explores AI-driven database systems, including intelligent query optimization, automated data management, and emerging technologies like vector databases.
4. Computational Photography – Covers fundamental concepts, research trends, digital image formation, and digital camera principles, with hands-on exercises on imaging fundamentals.
5. Computer Vision in the Open World – Discusses key models, algorithms, and deep learning applications, addressing challenges such as domain shifts and new category emergence.
6. Ubiquitous Computing & Context Awareness – Examines the vision, history, and research in ubiquitous computing, with a focus on context-aware computing and wireless sensing applications.
7. AI System Practice – Covers problem modeling, data processing, tuning, deployment, and maintenance, demonstrating real-world AI systems and essential tools for system development.
8. Software/Hardware Co-design & Optimization – Explores principles of hardware-software collaboration, emphasizing performance and efficiency improvements through hands-on projects.
9. Modern Adaptive Computing – Introduces adaptive computing chip architectures, compilation techniques, and programming interfaces, illustrating real-world applications for system prototyping.
10. Accelerating Distributed Systems with In-Network Computing – Covers network computing principles to reduce traffic and latency, improving efficiency through advanced programming models.
11. Video Streaming with AI – Explores AI-enhanced video streaming, including content popularity prediction, bandwidth characterization, and object detection for optimized 5G services.
12. Peer Prediction & Wisdom of the Crowds – Introduces peer prediction mechanisms that incentivize truthful reporting without objective ground truth, connecting to learning from noisy labeled data.
13. Introduction to Embodied AI – Explores embodied intelligence, covering AI-physical world interaction, 3D vision, reinforcement learning, multimodal models (GPT-4V/4o), and real-robot Sim2Real challenges.
开课院系 信息科学技术学院
成绩记载方式  
通识课所属系列  
授课语言 英文
教材
参考书
教学大纲 该课程旨在通过多位资深教授的授课,帮助留学生深入探索计算机领域的前沿研究内容,激发他们的学术热情。通过课程学习,留学生将全面了解计算机科学领域的最新进展,进而增强其对学术研究的兴趣和动力。这将有助于吸引更多有志于深造的留学生选择报考计算机学院的硕士和博士项目,同时也将有助于提升学院的国际声誉,扩大其在全球学术界的影响力。
1. 程序设计语言概览(熊英飞): 3学时
2. 开源数据分析(周明辉): 3学时
3. 人工智能时代的数据库系统(吴垠鋆): 3学时
4. 计算摄像学(施伯鑫): 3学时
5. 计算机视觉(仉尚航): 3学时
6. 普适计算和情境感知(张大庆): 3学时
7. 人工智能系统实践(王乐业): 3学时
8. 软硬件协同设计优化(刘先华): 3学时
9. 现代自适应计算(罗国杰): 2学时
10. 网络计算与分布式系统(吴文斐): 3学时
11. 智能视频传输(边凯归): 3学时
12. 同伴预测与群体智慧(孔雨晴): 1.5学时
13. 具身智能(王鹤): 1.5学时

本课程涉及计算机学科多个领域,课程理论和实践并重,将设置多个实验和操作环节。通过本课程的学习,学生基本掌握编程语言发展、量子算法、深度学习应用、操作系统原理、视频传输优化、计算摄像学基本概念、人工智能系统构建、智能机器人原理、软硬件设计协同优化、现代自适应计算、网络计算技术、开源数据分析以及普适计算的愿景和无线传感技术应用等计算学科各个领域的核心原理与方法,获得相关领域的实践经验,提高创新意识和实践能力。本课程的各章节内容如下:
第一章为程序设计语言概览:将概述编程语言的发展,讨论其动机、发明的主要技术和未来方向。

第二章为开源数据分析:开源已经成为软件技术创新和软件产业发展的主要模式。开源软件及其开发非常复杂,难以理解难以控制。开源量化分析是挖掘软件数据以理解开源开发进而进行智能预测和推荐。它涉及的内容包括:对开源软件以及量化分析技术的介绍;开源开发的重要问题;如何挖掘数据揭示开源规律,如何建立智能工具帮助控制复杂系统及其开发。

第三章为人工智能时代的数据库系统:本章旨在帮助学生理解人工智能时代数据库系统面临的新挑战和机遇,了解数据库系统与人工智能技术的融合趋势,例如智能查询优化、自动数据管理等;掌握支持人工智能应用的新型数据库技术,例如向量数据库等。

第四章为计算摄像学:计算摄像学是一门融合计算机视觉、计算机图形学和计算光学的新兴交叉学科,通过在成像过程中引入计算,实现比传统相机更高性能和更多维度的视觉信息捕捉,呈现传统相机看不清、看不准、甚至看不到的内容。本章会介绍计算摄像学的基本概念、研究趋势以及数字图像的形成和数码相机的工作原理(包含一个关于成像基本原理的课程实践练习)。

第五章为为计算机视觉:本章将介绍计算机视觉的重要模型与算法,包括图片分类、物体检测、语义分割、视觉Transformer等,并重点介绍深度学习在计算机视觉中的典型应用。现实世界中的计算机视觉往往面对开放环境,存在大量数据域偏移,并有新的类别动态出现。然而已有机器视觉往往针对封闭环境,存在闭集假设和大样本假设等局限。本章将介绍一系列增强开放世界计算机视觉泛化能力,使其自动适应新环境、识别新事物的研究工作。为了加深学生对课程内容的理解,还安排了机器人真机上的动手实践内容。

第六章为为普适计算和情境感知:本章将介绍普适计算的愿景、历史、主要研究原则和主题。讲座还将介绍关键研究主题--情境感知计算,包括关键概念、主要研究领域、情境推理机制和一些应用实例。其中,无线传感将作为一个新的情境感知计算研究领域加以介绍。

第七章为人工智能系统实践:构建人工智能系统,除掌握其核心算法外,还需掌握问题建模、数据获取、预处理、调参、部署和维护等各方面技术。本章将通过若干现实人工智能系统实例,讲授在核心算法之外,构建人工智能系统全流程中所需掌握的关键知识和工具。

第八章为软硬件协同设计优化:本章涵盖硬件和软件组件的协同设计原则,强调它们之间的协同作用,以提高性能和效率。主题包括系统级协同设计、硬件/软件接口协议和优化技术。学生将参与实践项目,从高层次的角度设计系统,同时考虑硬件和软件组件。

第九章为现代自适应计算:本章将介绍现代自适应计算的芯片架构、编译技术、编程接口等,以及其作为系统原型研究平台的典型案例。

第十章为网络计算与分布式系统:本章将介绍一种新的提升和扩展集群效率的原语——在网计算。在网计算将应用功能卸载到网络设备上,可以降低网络流量和时延,进而提升系统整体效率。其中包含正确高效的在网计算协议的设计、集群中多在网计算实例的管理、在网计算的应用编程模型。

第十一章为智能视频传输:互联网视频内容传输已经消耗了80%以上的网络带宽。在中国观看长视频或短视频的用户数量已超过6亿。然而,高速移动接入网、骨干网络和正在建设的“边缘”网络无法满足互联网用户对视频流的需求。因此,提高在线观看视频的体验质量仍然具有挑战性。为了解决这个问题,在网络边缘使用人工智能 (AI) 技术可以极大地增强视频流服务与体验质量,例如预测未来视频内容的流行度、表征网络带宽的动态变化、以及分析网络带宽的变化以及用户行为等。关键技术包括视频内容缓存、动态比特率选择、超分辨率、对象检测、广告推荐等,这些技术为 5G时代的视频内容消费者提供更好的服务与体验质量。

第十二章为同伴预测与群体智慧:本章将涵盖设计同行预测机制,该机制无需依赖客观真实值,即可激励参与者真实地报告意见。在同伴预测机制中,参与者会根据他们自己的报告和同伴们的报告获得奖励。本章将介绍用于设计同伴预测机制的信息论框架。该框架引入了一种新的基于信息的机制,适用于两个人参与的场景和有限的任务集。我们还将探索该机制与从噪声标签数据中学习之间的联系。

第十三章为具身智能:随着深度学习和大模型的发展,人工智能在视觉感知领域取得突破,但在物理交互上仍存瓶颈。具身智能通过物理感知与行动推动通用人工智能发展,应用于人形与四足机器人。本章涵盖机器人学基础、多模态大模型应用,并通过真实机器人实验探索Sim2Real技术及机器人控制方法。
课堂讲述80%,实践作业10%, 小组交流讨论5%,文献阅读5%
总结报告100%
教学评估