北航 BUAA 2025 秋研究生机器学习期末考试回忆版

目录
考试已经过去一周了,根据依稀的记忆写下这篇考试回忆,希望能对后来的同学有所帮助。
本次机器学习期末考试包含大量往年题目,如决策树、反向传播推导、按照最小错误率和最小风险求后验等等。
临近考试不要慌张,多看往年经验分享博客、掌握老师说过的的必考知识点、补齐课件中短板、自信应对考试就可以啦。
以下内容为笔者回忆版,不保证准确性,请各位读者有选择性地参考。
T1 贝叶斯决策 #
给出先验概率和类条件概率,决策损失函数 \(\lambda\)(其实就是选错的风险值)
- 使用最小错误率进行决策
- 使用最小风险进行决策
T2 K-means #
- 使用数学语言描述 K-means 的流程
- 执行一遍 K-means 流程(给定 4 个二维点的坐标,初始化了 2 个二维中心点,要求迭代执行 2 次),并简述 EM 算法的 E-step 和 M-step 分别对应 K-means 中的哪个流程
- K-means 的缺陷以及解决办法(K-means++)
T3 PCA #
- 简述最大方差、最小均方误差的主要思想
- PCA 的一般求解过程(求协方差矩阵、最大特征值对应的特征向量等等)
- 与 LDA 的关系与区别
T4 SVM #
- 从几何解析的角度描述参数 w 和 b 的意义
- 说明惩罚系数和松弛变量的作用
T5 关联规则学习 #
- 简述先验算法的基本思想(支持度之类的)
- 简述关联规则学习的应用场景(社交网络、货品分类)
T6 半监督学习 #
简述聚类假设和流形假设
简述一种半监督学习的方法
T7 集成学习 #
叙述集成学习的思想
简述 boosting 和 bagging 的执行流程
T8 决策树 #
判断学生是否会加入算法竞赛集训队,4 个属性:GPA(高、中、低)、感兴趣程度(高、一般、低)、时间(充足、一般、紧张)、编程能力(高、中、低)。虽然题目给出了计算所需的 log 值,但笔者还是建议使用计算器。
- 按照 ID3 流程生成决策树(4 个属性看似十分复杂,实际上只需要两轮迭代)
- 给定一个同学的属性,判断他是否会加入(第一题没做出来的话也可以通过观察法判断)
- 简述预剪枝和后剪枝的方法和优缺点
T9 反向传播 #
给定带有一个隐藏层的前馈全连接神经网络,隐藏层和输出层都有激活函数
- 推导第一层和第二层参数 w 如何更新
- 动量 SGD 和 Adam 是如何解决陷入局部极值点或震荡问题
- 简述为什么会出现梯度消失,如何缓解这个现象
T10 强化学习 #
简述强化学习在大语言模型或机器人领域的应用
往年博客 #
- https://blog.csdn.net/weixin_66992679/article/details/145398059
- https://blog.csdn.net/weixin_52843454/article/details/135317356
- https://theuho.site/2025/08/11/ML-final/
- https://theuho.site/2025/08/11/ML-review/
- https://blog.csdn.net/m0_59182181/article/details/145010304
- https://suzumiyaakizuki.github.io/2024/12/21/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E6%9C%9F%E6%9C%AB%E8%80%83%E8%AF%95%E4%BE%8B%E9%A2%98%E6%B1%87%E6%80%BB/