Mindspore 公开课 - prompt

这篇具有很好参考价值的文章主要介绍了Mindspore 公开课 - prompt。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

prompt 介绍

Fine-Tuning to Prompt Learning

Mindspore 公开课 - prompt,prompt

Pre-train, Fine-tune
  1. BERT
  • bidirectional transformer,词语和句子级别的特征抽取,注重文本理解
  • Pre-train: Maked Language Model + Next Sentence Prediction
  • Fine-tune: 根据任务选取对应的representation(最后一层hidden state输出),放入线性层中

例:Natural Language Inference

Mindspore 公开课 - prompt,prompt

Pre-train, Fine-tune: models
  1. BERT
    • bidirectional transformer,词语和句子级别的特征抽取,注重文本理解
    • Pre-train: Maked Language Model + Next Sentence Prediction
    • Fine-tune: 根据任务选取对应的representation(最后一层hidden state输出),放入线性层中
      例:Named Entity Recognition
      Mindspore 公开课 - prompt,prompt
Pre-train, Fine-tune: models
  1. GPT
    • auto-regressive model,通过前序文本预测下一词汇,注重文本生成
    • Pre-train: L 1 ( U ) = ∑ i log ⁡ P ( u i ∣ u i − k , … , u i − 1 ; Θ ) L_1(\mathcal{U})=\sum_i \log P\left(u_i \mid u_{i-k}, \ldots, u_{i-1} ; \Theta\right) L1(U)=ilogP(uiuik,,ui1;Θ)
    • Fine-tune: task-specific input transformations + fully-connected layer
      Mindspore 公开课 - prompt,prompt
Pre-train, Fine-tune: challenges
  1. gap between pre-train and fine-tune

少样本学习能力差、容易过拟合

Mindspore 公开课 - prompt,prompt

Pre-train, Fine-tune: challenges
  1. gap between pre-train and fine-tune

少样本学习能力差、容易过拟合
Mindspore 公开课 - prompt,prompt

Pre-train, Fine-tune: challenges
  1. cost of fine-tune

现在的预训练模型参数量越来越大,为了一个特定的任务去 finetuning 一个模型,然后部署于线上业务,也会造成部署资源的极大浪费
Mindspore 公开课 - prompt,prompt

Pre-train, Prompt, Predict: what is prompting

  • fine-tuning: 通过改变模型结构,使模型适配下游任务
  • prompt learning: 模型结构不变,通过重构任务描述,使下游任务适配模型

Mindspore 公开课 - prompt,prompt

Pre-train, Prompt, Predict: workflow of prompting

Mindspore 公开课 - prompt,prompt

Pre-train, Prompt, Predict: workflow of prompting
  1. Template: 根据任务设计prompt模板,其中包含 input slot[X] 和 answer slot [Z],后根据模板在 input slot 中填入输入
  2. Mapping (Verbalizer): 将输出的预测结果映射回label

Mindspore 公开课 - prompt,prompt

Pre-train, Prompt, Predict: prompt design

Prompting 中最主要的两个部分为 template 与 verbalizer 的设计。

他们可以分别基于任务类型和预训练模型选择(shape)或生成方式(huamn effort)进行分类。

Mindspore 公开课 - prompt,prompt文章来源地址https://www.toymoban.com/news/detail-796156.html

到了这里,关于Mindspore 公开课 - prompt的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Midjourney V5 比 V4 更好吗?Prompt 全公开(下篇)

    V5 的惊艳之处:photograpy,CG rendering, HD film style 类生成  Prompt 控制准确度的基本测试 V5 比 V4 的更好的地方: 在 V5 里可以准确控制镜头语言,光影也更真实自然 V5 相比 V4 倒退的地方: V5 会让构图更碎片化、产生更多不必要的细节,成像的锐利和清晰程度下降 3. V5 相比 V4 

    2024年02月11日
    浏览(31)
  • Midjourney V5 比 V4 更好吗?Prompt 全公开(上篇)

    Midjourney V5 发布好几天了,做个晚到的全面评测。分为 上下两篇发布: V5 的惊艳之处: photograpy,CG rendering, HD film style 类生成  Prompt 控制准确度的基本测试 V5 比 V4 的更好的地方: 在 V5 里可以准确控制镜头语言,光影也更真实自然 V5 相比 V4 倒退的地方: V5 会让构图更碎片

    2024年02月12日
    浏览(37)
  • 快来!Claude无需魔法不限量;百度官方AIGC公开课;Prompt高质量答案完全指南;GPT-5真的要来了?贾扬清离职阿里后首次受访 | ShowMeAI日报

    👀 日报周刊合集 | 🎡 生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! Siqi Chen 是初创公司Runway CEO兼AI投资人,他两周前的推特重新引发了热议:预计到2023年底,GPT-4将被新的GPT-5版本取代。 除了透露GPT-5的发布时间外,Siqi Chen还宣布,一些OpenAI员工希望新模型能够与

    2024年02月09日
    浏览(51)
  • 华为开源自研AI框架昇思MindSpore应用案例:基于MindSpore框架的UNet-2D案例实现

    Unet模型于2015年在论文《U-Net: Convolutional Networks for Biomedical Image Segmentation》中被提出,最初的提出是为了解决医学图像分割问题,用于细胞层面的图像分割任务。 Unet模型是在FCN网络的基础上构建的,但由于FCN无法获取上下文信息以及位置信息,导致准确性较低,Unet模型由此

    2024年02月13日
    浏览(47)
  • MindSpore保姆级安装教程

    MindSpore是华为发布的开源AI计算框架。于2019年8月推出的新一代全场景AI计算框架,2020年3月28日,宣布MindSpore正式开源。 MindSpore总体架构: 简单的开发体验:帮助开发者实现网络自动切分,只需串行表达就能实现并行训练,降低门槛,简化开发流程。 灵活的调试模式 具备训

    2024年02月01日
    浏览(30)
  • 昇思 MindSpore 安装教程

    昇思MindSpore是一个全场景深度学习框架,旨在实现易开发、高效执行、全场景覆盖三大目标。 其中,易开发表现为API友好、调试难度低;高效执行包括计算效率、数据预处理效率和分布式训练效率;全场景则指框架同时支持云、边缘以及端侧场景。 昇思MindSpore总体架构如下

    2024年02月15日
    浏览(48)
  • 基于MindSpore复现UNet—语义分割

    Unet模型于2015年在论文《U-Net: Convolutional Networks for Biomedical Image Segmentation》中被提出,最初的提出是为了解决医学图像分割问题,用于细胞层面的图像分割任务。 UNet模型是在FCN网络的基础上构建的,但由于FCN无法获取上下文信息以及位置信息,导致准确性较低,UNet模型由此

    2024年02月05日
    浏览(49)
  • MindSpore AI科学计算系类 | VAE基于MindSpore Elec的特征域MT反演,提升大地电磁反演的精度和分辨率

    背景 昇思MindSpore联合清华大学、华为先进计算与存储实验室合作构建了基于变分自编码器的特征域大地电磁反演算法,通过灵活嵌入多物理先验知识有效提升了复杂介质地球物理反演的精度。 大地电磁(Magnetotelluric, MT)数据反演是通过地表测量的天然电磁场推断地下介质分

    2024年01月25日
    浏览(45)
  • 教你如何基于MindSpore进行ChatGLM微调

    本文分享自华为云社区《基于MindSpore的ChatGLM微调》,作者: JeffDing 。 安装Transformer 执行 python 脚本,合并模型权重。 执行转换脚本,得到转换后的输出文件ms_glm_6b.ckpt 注意可能会遇到以下错误: 解决方法: 原理:找到torch中的libgomp-d22c30c5.so.1 然后赋值给LD_PRELOAD环境变量,这

    2024年02月08日
    浏览(44)
  • Resnet实现CIFAR-10图像分类 —— Mindspore实践

            计算机视觉是当前深度学习研究最广泛、落地最成熟的技术领域,在手机拍照、智能安防、自动驾驶等场景有广泛应用。从2012年AlexNet在ImageNet比赛夺冠以来,深度学习深刻推动了计算机视觉领域的发展,当前最先进的计算机视觉算法几乎都是深度学习相关的。深

    2024年02月07日
    浏览(38)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包