哈工大2022秋自然语言处理NLP期末考试回忆版试题

这篇具有很好参考价值的文章主要介绍了哈工大2022秋自然语言处理NLP期末考试回忆版试题。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

刚考完NLP,趁着还没忘记,写一个回忆版试题。

题型及得分:选择题20道,每道1分;填空题10道,每道1分;判断题15道,每道1分;简答题4道,每道5分;推理题2道,每道10分;综合题1道,15分。合计100分。

选择题主要考察知识点的记忆,考了“编辑距离”,“词向量one-hot表示”,“SGNS中负样本k的选取是大于1还是小于1”,“宏平均和微平均”,“HMM中后向算法的时间复杂度”,“主题模型算法是什么(LDA)”等等,基本上都是一些必要的知识点,大部分都是送分题,不用太担心。

填空题跟选择题差不多,也是考察一些小知识点,第一道是“语言系统中的两种基本关系是( )和( )”,答案是组合关系和聚合关系。第二道是“移进-归约中遇到冲突该怎么办( )”,这个我不太确定,我写的是“保存断点,回溯”。第三道题给了互信息的定义然后问你是什么,答案是互信息。最后一道是问机器学习中需要将数据切分为哪几个集合,答案是训练集,测试集,验证集。诸如此类,剩下的我忘记了,基本上都比较简单。

判断题有些题不太好确定,基本上就是给一句描述,然后问你对不对。有一道题问的是“语法结构的最大单位是句子”,还有一道题问的是“机器翻译从机器学习角度看的本质是排序问题”,还有一道题直接给了语言的定义,还有一题说的是“WSD中基于词典和基于义类词典的方法都是从资源的角度进行划分的”。判断题挺难的,纠结了很久,有些陈述需要对NLP深入理解或者认真听课才能确定正误,PPT上没有答案。

简答题:

第一道:词向量的评价方法有“语义相关性”和“类比推理”两种。请论述这两种评价方法以及相关的评价指标。

(答:这题的答案在“文档表示与相似度计算”那节,评价方法论述课上有讲,评价指标分别是“斯皮尔曼等级相关系数”和“余弦相似度”)

第二道:题干给出两个语料库的描述。第一问:结合上述语料库的描述,从计算对角度浅谈对语言性质的理解。第二问:有些语言处理系统是建立在语料库上的,请结合上述描述谈一下这些系统的局限性。

(这题考试看的时候完全蒙了,那个语言的性质根本没背,感觉自己在考马原...)

第三道:题干给了一句话:“做核酸的队长死了”,还有一个词典:{做,核酸,的,队,长,队长,死,了}。第一问:结合词典用正反向最大匹配分词对这句话进行分词。第二问:结合分词结果,谈一谈歧义的类型。

(分词不必多说,歧义是组合歧义和交叉歧义,分词结果中只有组合歧义一种,不过我把两种都写上去了)

第四道:这道题有4.5学分和5学分两个版本,我选的是5学分的,问的是Transformer相比于RNN的优点在哪里

(答案在补充8学时的ppt上~)

推理题:

第一道:这道题考的是用HMM做词性标注,题干给了一句已经分好词的话(“教授”“正在”“教授”),还有这句话的词性的搜索空间,以及HMM的各种参数(转移概率,发射概率等等),让你算一下最大概率词性序列。

(维特比或者穷举都可以,HMM考的比较简单)

第二道:给了一句嵌套的CFG句法结构,大概长这个样子:(S(我 NP)(VP(是 V)(NP(CS(上级 NP)(V`(派 V)(来 V)))(的 de)))))。第一问:写出上述句法的树结构,第二问:统计上述结构中涉及的所有CFG产生式规则,第三问:谈一下什么是PCFG,相比CFG有什么特点

(原题给的嵌套句子特别长!!!写到右边都写不下了)

综合题:题干说的是采用最大熵方法做实体识别,利用BIO标记标注语料,给定如下标注语料:美国/B-ORG 外长/I-ORG 奥/B-PER 斯/I-PER 汀/I-PER 在/O 菲/B-LOC 律/I-LOC 宾/I-LOC

第一问:最大熵方法的实体识别需要用到特征,选取的特征的包括目标词、目标词的前一个词、目标词的后一个词,写出目标词“奥”对应的特征:

第二问:在最大熵模型中,如果“目标词的前一个词的标记”也作为特征,请问在训练阶段和测试阶段分别应该怎么做?

第三问:有4.5学分和5学分两个版本,5学分版本:描述一下利用BERT如何做实体识别

第四问:描述实体链接的一般步骤,并且每步给出简短说明。

终于写完了!

总结一下:考试覆盖范围大部分都是PPT上的固定内容,计算和公式的部分非常简单,甚至没有。CYK算法、chart算法、翻译模型、中心理论基本都没考。复习的话建议提前一周或者两周开始背PPT,理解+记忆。文章来源地址https://www.toymoban.com/news/detail-485558.html

到了这里,关于哈工大2022秋自然语言处理NLP期末考试回忆版试题的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 哈工大机器学习期末复习笔记(一)

    一、贝叶斯估计 当我们需要对一个参数进行估计时,一种办法是概率论与数理统计课程中已经学过的极大似然估计(Maximum Likelihood Estimation,MLE)。例如,如果我们想估计扔硬币正面朝上的概率p,可以扔N次,记录正面朝上的次数M,再用M/N估计p。这种方法得到的参数估计是个

    2024年02月01日
    浏览(40)
  • 哈工大操作系统实验三(整理自用)

    基于模板  process.c  编写多进程的样本程序,实现如下功能: + 所有子进程都并行运行,每个子进程的实际运行时间一般不超过 30 秒; + 父进程向标准输出打印所有子进程的 id,并在所有子进程都退出后才退出; 在  Linux0.11  上实现进程运行轨迹的跟踪。 + 基本任务是在内

    2024年02月11日
    浏览(40)
  • 哈工大CSAPP程序人生大作业

    正在上传…重新上传取消 计算机系统 大作业 题     目   程序人生 -Hello’s P2P  专       业    计算机科学与技术        学    号   2021110991             班    级      2103101             学       生         安心           指 导 教 师    

    2023年04月24日
    浏览(71)
  • 哈工大csapp-LAB3程序优化

    实验报告 实 验(三) 题     目       优化                 专       业     人工智能(未来技术)     学    号    7203610716              班    级    20WJ102                学       生     孙铭蔚             指 导 教 师     刘宏伟

    2023年04月24日
    浏览(44)
  • 哈工大 计算机系统 二进制炸弹实验报告

    实验报告 实 验(三) 题     目  Binary Bomb          二进制炸弹   专       业      计算机学院          学    号               班    级                学       生              指 导 教 师                实 验 地 点        实 验 日 期     

    2023年04月15日
    浏览(48)
  • 2023哈工大软件工程考研 | 395+251 | 个人经验分享

    初试成绩 :395 政治 英语一 数学一 专业课 总分 71 76 130 118 395 复试成绩 :251(综合测试118 + 面试133) 排名 :软专1/12,本部7/83,一校三区33/262 一切都拉下帷幕了,从去年二月到今年三月,已经一年多了;中间有大起大落,有艰难曲折,但最终还算有个不错的结果。 没有感

    2023年04月09日
    浏览(44)
  • [图论]哈尔滨工业大学(哈工大 HIT)学习笔记32-39

    视频来源:6.1.1 树的定义_哔哩哔哩_bilibili 目录 1. 树的定义 2. 树的性质 3. 极小连通图 4. 树的中心 5. 生成树 6. 最小生成树 7. 割点 8. 割点的性质 (1)定义:一个连通的无圈的图称为树 (2)平凡树:只有一个顶点的树 (3)推论1:非平凡树至少有两个叶子( ? ) (4)推论

    2024年02月08日
    浏览(48)
  • [图论]哈尔滨工业大学(哈工大 HIT)学习笔记23-31

    视频来源:4.1.1 背景_哔哩哔哩_bilibili 目录 1. 哈密顿图 1.1. 背景 1.2. 哈氏图 2. 邻接矩阵/邻接表 3. 关联矩阵 3.1. 定义 4. 带权图 (1)以地球为建模,从一个大城市开始遍历其他大城市并且返回,每个顶点只能被通过一次 (1)定义:如果G中有生成圈,则称G为哈氏图 (2)和欧

    2024年02月22日
    浏览(55)
  • 哈工大计算机网络传输层协议详解之:TCP协议

    哈工大计算机网络课程传输层协议详解之:可靠数据传输的基本原理 哈工大计算机网络课程传输层协议详解之:流水线机制与滑动窗口协议 哈工大计算机网络课程传输层协议详解之:拥塞控制原理剖析 点对点通信 一个发送方、一个接收方 可靠的、按序的字节流 流水线机制

    2024年02月10日
    浏览(46)
  • 哈工大计算机网络课程网络层协议详解之:DHCP协议

    在之前的网络层内容介绍中,我们讲解了IP地址的概念、IP子网/子网掩码、有类IP地址的划分,CIDR无类IP地址以及路由聚合等概念。接下来,继续介绍网络层中的另一个基础概念:作为一个主机,如何获得一个IP地址,并完成IP地址相关信息的配置。为此,重点介绍DHCP协议。

    2024年02月11日
    浏览(57)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包