国科大-自然语言处理复习

这篇具有很好参考价值的文章主要介绍了国科大-自然语言处理复习。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

谨以此博客作为复习期间的记录

实体关系联合抽取

流水线式

  • 流水线式抽取(Pipline): 把关系抽取的任务分为两个步骤,首先进行实体识别,再抽取出两个实体的关系。
    国科大-自然语言处理复习,自然语言处理,人工智能

  • 联合抽取(Joint Extraction): 端到端,同时进行实体和关系的抽取。流水线式抽取会导致误差在各流程中传递和累加,而联合抽取的方式则实现难度更大

端到端方法

国科大-自然语言处理复习,自然语言处理,人工智能
流水线式抽取和新标注策略的实体关系联合抽取都可以和序列标注结合起来,
国科大-自然语言处理复习,自然语言处理,人工智能

国科大-自然语言处理复习,自然语言处理,人工智能

检索式问答系统

流水线方式

Document Retriever 和 Document Reader 分两步

  • Document Retriever:通过TF-IDF检索维基百科中与问题相关的Top K个文档
  • Document Reader:将答案抽取转化为抽取式阅读理解问题
  • • 输入:一个文档段落,一个自然语言描述的问题
  • • 输出:段落中抽取的答案片段
    国科大-自然语言处理复习,自然语言处理,人工智能
    国科大-自然语言处理复习,自然语言处理,人工智能
    国科大-自然语言处理复习,自然语言处理,人工智能

论文中提出的模型结构主要包括两个阶段:信息检索(IR)和阅读理解(RC),以及两种答案重排方法:基于证据强度的重排和基于证据覆盖的重排。以下是这些模型组件的详细介绍:

信息检索(IR)阶段

  • 目标:检索与给定问题最相关的网页段落。
  • 方法:使用搜索引擎(例如谷歌或必应)来找到与问题最相关的顶级网页段落。
  • 特点:与标准阅读理解任务不同,在开放领域设置中,RC模型通常在远程监督下进行训练。这意味着在训练阶段,RC模型会将包含正确答案的所有段落与问题进行匹配

阅读理解(RC)阶段

  • 目标:从检索到的段落中提取答案。
  • 方法:使用阅读理解模型(例如R3模型)来从这些段落中提取候选答案。
  • 特点:与单个固定段落的标准阅读理解任务不同,开放领域问答需要处理多个段落,并从中提取候选答案

基于证据强度的重排

  • 目的:利用段落中出现答案的频率或概率来评估答案的强度。
  • 实现:计算每个答案在顶级答案候选中出现的次数,或者将RC模型为每个答案跨度分配的概率相加,以确定最终预测

基于证据覆盖的重排

  • 目的:根据不同段落的证据如何覆盖问题来排列答案候选。
  • 实现:首先将包含答案的段落连接成一个“伪段落”,然后使用匹配LSTM模型来衡量这个伪段落如何涵盖问题的各个方面

结合不同类型的聚合

  • 方法:将两种重排方法的输出进行加权组合,无需额外训练。
  • 特点:首先使用softmax重新归一化两种基于强度的重排器和一个基于覆盖的重排器提供的前5个答案得分,然后对相同答案的得分进行加权求和,选择得分最高的答案作为最终预测

这种结合信息检索、阅读理解和多种重排策略的方法充分利用了多个段落的证据,有效地提高了开放领域问答系统的性能。

端到端方式

Retriever-Reader的联合学习

Lee et al., Latent Retrieval for Weakly Supervised Open Domain Question Answering, ACL,2019
国科大-自然语言处理复习,自然语言处理,人工智能
国科大-自然语言处理复习,自然语言处理,人工智能
国科大-自然语言处理复习,自然语言处理,人工智能
国科大-自然语言处理复习,自然语言处理,人工智能
国科大-自然语言处理复习,自然语言处理,人工智能

国科大-自然语言处理复习,自然语言处理,人工智能

国科大-自然语言处理复习,自然语言处理,人工智能
国科大-自然语言处理复习,自然语言处理,人工智能
国科大-自然语言处理复习,自然语言处理,人工智能

基于预训练的Retriever-Free方法

Petroni et al. Language Models as Knowledge Bases? ACL, 2019

情感分析

联合三元组抽取

将问题转为一个序列生成问题
统一输入输出的标准
国科大-自然语言处理复习,自然语言处理,人工智能
国科大-自然语言处理复习,自然语言处理,人工智能

国科大-自然语言处理复习,自然语言处理,人工智能
国科大-自然语言处理复习,自然语言处理,人工智能
国科大-自然语言处理复习,自然语言处理,人工智能

A Unified Generative Framework for Aspect-Based Sentiment Analysis文章来源地址https://www.toymoban.com/news/detail-803048.html

到了这里,关于国科大-自然语言处理复习的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 自然语言处理的发展NLP语言模组人工智能的未来

    随着深度学习和大数据技术的进步,自然语言处理取得了显著的进步。人们正在研究如何使计算机更好地理解和生成人类语言,以及如何应用NLP技术改善搜索引擎、语音助手、机器翻译等领域。 方向一:技术进步 1. 人工智能的崛起: 人工智能(AI)作为当今技术进步的重要

    2024年01月25日
    浏览(59)
  • 人工智能与自然语言处理的哲学思考

    作者:禅与计算机程序设计艺术 《人工智能与自然语言处理的哲学思考》 引言 1.1. 背景介绍 随着信息技术的飞速发展,人工智能作为一项新兴技术,逐渐成为了人们关注的焦点。人工智能的应用涉及到众多领域,其中自然语言处理(NLP)是其中的一个重要分支。自然语言处

    2024年02月07日
    浏览(41)
  • 自然语言处理的未来:从语音助手到人工智能

    自然语言处理(NLP)是人工智能(AI)领域的一个重要分支,它涉及到计算机理解、生成和处理人类语言的能力。自从2010年左右,NLP技术在深度学习和大数据技术的推动下发生了巨大的变革,这使得许多之前只能由专业人士完成的任务现在可以由计算机自动完成。 在过去的几年里

    2024年02月21日
    浏览(70)
  • 人工智能LLM大模型:让编程语言更加支持自然语言处理

    作者:禅与计算机程序设计艺术 作为人工智能的核心技术之一,自然语言处理 (Natural Language Processing, NLP) 已经在各个领域得到了广泛应用,如智能客服、智能翻译、文本分类等。而机器学习 (Machine Learning, ML) 模型是实现自然语言处理的主要工具之一,其中深度学习 (Deep Lear

    2024年02月15日
    浏览(43)
  • 人工智能与大数据面试指南——自然语言处理(NLP)

    分类目录:《人工智能与大数据面试指南》总目录 《人工智能与大数据面试指南》系列下的内容会 持续更新 ,有需要的读者可以 收藏 文章,以及时获取文章的最新内容。 自然语言处理(NLP)领域有哪些常见任务? 基础任务 中文分词:将一串连续的字符构成的句子分割成

    2024年02月11日
    浏览(37)
  • 人工智能领域热门博客文章:自然语言处理和机器翻译

    作者:禅与计算机程序设计艺术 近年来,随着人工智能的迅猛发展,给人们生活带来的改变正在产生越来越多的影响力。其中,自然语言处理(Natural Language Processing,NLP)和机器翻译(Machine Translation,MT)被认为是两个最重要的研究方向。自然语言处理涉及到对人的语言进行

    2024年02月07日
    浏览(42)
  • 读十堂极简人工智能课笔记06_自然语言处理

    1.4.3.1. 能让真人腾出手来处理难度更大的咨询 2.1.3.1. 在研究儿童的语言能力发展后总结出来的理论 2.1.3.2. 儿童虽然能够学会流利地说话,但他们在学习过程里其实根本没有接收到足够的信息 2.1.3.2.1. 所谓的“刺激的贫乏” 2.1.3.3. 儿童能够发展语言技能的唯一途径是他们

    2024年02月19日
    浏览(39)
  • 华为Could API人工智能系列——自然语言处理——属性级情感分析

    云原生时代,开发者们的编程方式、编程习惯都发生了天翻地覆的变化,大家逐渐地习惯在云端构建自己的应用。作为新一代的开发者们,如何更快速了解云,学习云,使用云,更便捷、更智能的开发代码,从而提升我们的开发效率,是当前最热门的话题之一,而Huawei Cloud

    2024年02月04日
    浏览(42)
  • 自然语言处理的崛起:从人工智能的黎明到现代技术的融合

    自然语言处理的发展经历了多个阶段,大致可以分为以下四个阶段: 萌芽期(1956年以前) :这一时期可以看作自然语言处理的基础研究阶段。一方面,人类文明经过几千年的发展,积累了大量的数学、语言学和物理学知识,这些知识不仅是计算机诞生的必要条件,同时也是

    2024年01月19日
    浏览(51)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包