关于chatGPT的几点了解

这篇具有很好参考价值的文章主要介绍了关于chatGPT的几点了解。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

  1. GPT X(生成文字)是预训练模型,俗称大模型,Codex(生成代码)、Embedding(生成向量,用于search,classify,compare text)都是基于GPT X模型派生的。
  2. GPT架构是地表最强自然语言类深度学习架构,用来理解文字并做出相应的输出。当前text-devinci-003为Azure最强AI产品,数据截止到2021年6月。
  3. ChatGPT和DALL-E是以GPT3.5(生成文字)为基础衍生出来的应用,不是模型。ChatGPT优化问题解答和对话形式输出,DALL-E优化了RGB三原色输出。Azure将在3月份上架Enterprise chatGPT的应用,能够加强已有的对话机器人,建设完成的对话机器人,增强客服员工的体验。chatGPT让客服AI体验体验更好,可提升的地方在于语义理解、按场景动态生成自然对话、多轮对话(上下文继承)、多语种对话,Text-to-speech。结合文字转语音,在Car insurance(车险)案例中表现优异。
  4. 微软主要控股OpenAI,并为其研究提供了基础支撑,包括:MLOps(机器学习平台)、训练框架(Deepspeed)、基础算力(微软提供的超级计算环境),收购的成本以基础设施支付。
  5. Azure AI中OpenAI Service是可定制的AI模型,提供认知服务。Azure的Bot Service为基于场景的服务,即认知服务的应用,各厂商在此基础上催生了很多的partner Solution。客服中心和会话AI是H3C关注领域,提供智能协助,成为虚拟助手,识别客户情绪,优先应对情绪不佳的客户。
  6. **Azure OpenAI服务如何保障数据安全?**部署在自己的Azure订阅中,只由所有者保护和访问,并与个人数据集和应用程序绑定,提供专用网络的企业级安全,基于角色的访问控制(RBAC)。
  7. Azure OpenAI申请方式:(1)具备一个Azure国际版订阅 (2)需要完成的构思好应用场景 (3)访问http://aka.ms/oai/access
  8. GPT-3的主要概念:Prompt(文本输入提示,为引擎提供上下文)、Completion(GPT-3根据提示生成的输出)、Tokens(令牌,可理解为较小的乐高积木,组合成词语,100令牌约等于75单词。API在处理文本之前将文本分为令牌,令牌决定价格,Prompt和completion都计算Tokens)。
  9. Prompting Engineering指导:通俗的理解就是用户要知道如何合理的进行提问,这一个专题。Prompting Engineering指导1:Few-Shot Reasoning(可解释性);
    Prompting Engineering指导2:Model Reasoning-Chain-of-Thought
    多个不同任务,语料不一样,模型的标签准备也不一样。
  10. GPT-3有当前有四个模型,Ada、Babbage、Curie、Davinci,都是人名,能力越来越强,Davinci只接受4000tokens的Prompt,其他三种都是2048tokens。Codex模型有两种Cushman-codex和Davinci-codex。企业在选择模型时,可以从高到低依次试用。
  11. GPT、Codex、Embedding都能做什么?GPT-X【生成文章、归纳总结、打标签分类】Codex【文字转代码和SQL】Embedding【文字转矢量,帮助生成更强大的知识库(聚类),万科预警平台案例】DALL-E【文字转图片】。
  12. DALL.E2现在是2代模型,目前在Azure上还是内测版本(preview),可通过简单的文本生成无限多的原创图像,加速设计或激发创造性决策,价格感人。
  13. OpenAI需求关注点,考虑这5点权衡是否使用:(1) 同时处理多个task的通用模型 (2)生产人工模拟内容,同时保护数据隐私和安全 (3)需要加速的原型设计和上市,满足多种应用场景 (4)希望使用一个少量训练或零训练的模型 (5)查找之前描述过的解决 方案或用户案例。
  14. 国外应用案例介绍:CARmax(二手车商,完成了11年的车辆数据摘要),Mount BladeII(角色扮演游戏,Fine-Tuning结合TTS Custom Neural Voice和Cross Lingual Adaptation实现更强大的NPC表现力及游玩体验),Viva Sales(结合CRM资料,自动撰写邮件),sogeti(虚拟数字人),Farlands(农产品收购集团,试用OpenAI Service获取Dynamics沟通记录中的情绪价值)。
  15. Fine-Tuning的最佳实践
    1. Make sure to completely remove wrong labels in Fine-Tuning dataset
      1. Pre-existing dataset:offensive or inaccurate content
      2. Large dataset;review as many random samples as possible
    2. Conditional Generation
      1. 在提示末尾使用分隔符\n\n###\n\n。最终向模型发出请求时也要追加此分隔符。
      2. 在完成结果结尾时使用结束标记,例如END。
      3. 在推理时将结束标记添加为停止序列,例如stop=[”END”]
      4. 至少约500个示例。
      5. 确保提示加上完整结果不超过2048个标记(包括分隔符)。
      6. 高质量的示例遵循相同的所需格式。
      7. 用于微调的数据集在结构和任务类型上与模型未来的用途非常接近。
  16. 探索:Extend CLU to Conversational AI with GPT
    1. Current challanges
      1. Language service provided a subset of AI needed for conversational experiences
        1. CLU offers language understanding(intent/entities)
        2. CQA offers extrative QA used as fallback
      2. Lack of modern solution for language generation and dialog
        1. Rules-based language generation by Bot Framework/PVA/Nuance
        2. Rules-based and rigid dialog for slot filling by Bot Framework/PVA/Nuance
    2. Opportunity——核心:相辅相成
      1. Extend CLU to offer more natural interactions modernized LG powered by chatGPT
      2. Upgrade CLU to offer dynamic dialog manager through chatGPT
      3. Offer rich Question Answering grounded with enterprise data using GPT

文章来源地址https://www.toymoban.com/news/detail-440112.html

到了这里,关于关于chatGPT的几点了解的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • rxjs的几点使用心得

    1.对错误的处理 日常使用中,点击按钮需要往后台发消息,为了不重复发消息,经常需要把点击事件做成subject,然后把发消息的过程做成switchMap,类似下面的写法     const subject = new rxjs.Subject();     subject.pipe(       rxjs.operators.switchMap(index = {         return rxjs.of(index);    

    2023年04月10日
    浏览(26)
  • 敏捷项目参与的几点体会

    截至目前,参与过几个采用敏捷开发的项目,不论项目与否,单就敏捷而言,项目管理几乎都是失败的。有这么几点感受,特此记录一下: 敏捷项目最重沟通,但是在项目过程中最难的也是沟通。某个项目,基本上有三个最重要的沟通会:sprint plan会,每日站会,sprint总结会

    2024年02月11日
    浏览(24)
  • 对渗透新人的几点建议

    一、对渗透新人成长的建议 挖洞一定要去实战,不能只在漏洞环境复现漏洞,实战和环境是不一样的。实战环境的选择: 漏洞盒子:新人建议首先去寻找漏洞和挖洞,漏洞盒子接受大多数互联网漏洞,无论该单位是否在盒子上面注册过,漏洞审核相对容易通过。 补天:分为

    2023年04月20日
    浏览(27)
  • 分享我平时使用的几款免费的 AI 文字生成图片的在线网站

    现在网络上有很多基于文字生成图片的工具,相信大家日常生活中也经常在使用了。 比如百度的文心一言: 可惜文心一言生成的图片尺寸比较小,而且包含水印。 经过测试发现,文心一言文生图,似乎不支持英文字符? 而且我没找到让生成的图片不包含水印的方法: 我儿

    2024年02月01日
    浏览(80)
  • Eclipse整合tomcat时要注意的几点

      1、安装目录及jdk 2、参数配置   注意:Arguments 的配置,日志输出文件目录及java 内存大小设置等,如下: -Dcatalina.base=\\\"E:apache-tomcat-7.0.52\\\" -Dcatalina.home=\\\"E:apache-tomcat-7.0.52\\\" -Dwtp.deploy=\\\"E:apache-tomcat-7.0.52webapps\\\" -Djava.endorsed.dirs=\\\"E:apache-tomcat-7.0.52endorsed\\\" -Djava.util.logging.config.fil

    2024年02月16日
    浏览(34)
  • OCR -- 文本检测 - 训练DB文字检测模型

    百度飞桨(PaddlePaddle) - PP-OCRv3 文字检测识别系统 预测部署简介与总览 百度飞桨(PaddlePaddle) - PP-OCRv3 文字检测识别系统 Paddle Inference 模型推理(离线部署) 百度飞桨(PaddlePaddle) - PP-OCRv3 文字检测识别系统 基于 Paddle Serving快速使用(服务化部署 - CentOS) 百度飞桨(PaddlePaddle) - PP

    2024年02月07日
    浏览(25)
  • PyTorch框架训练的几种模型区别

    在PyTorch中,.pt、.pth和.pth.tar都是用于保存训练好的模型的文件格式,它们之间的主要区别如下: .pt文件是PyTorch 1.6及以上版本中引入的新的模型文件格式,它可以保存整个PyTorch模型,包括模型结构、模型参数以及优化器状态等信息。.pt文件是一个二进制文件,可以通过torc

    2023年04月08日
    浏览(22)
  • TECHnalysis Research:关于生成式AI的几个意外发现

    TECHnalysis Research是一家美国的独立市场调查公司,该调查公司于2023年5月份对于全美10个行业的1000家企业IT决策负责人进行了调研,调研围绕生成式AI及其对于企业业务的影响。就在全球持续升温的生成式AI热度中,TECHnalysis Research的调研结果却显示了几个令人惊讶的意外发现,

    2024年02月12日
    浏览(31)
  • Paddle笔记:PaddleOCR文字识别,简单实用,默认训练模型识别度不错

            PaddleOCR是百度深度学习框架PaddlePaddle开源的OCR项目,旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。PaddleOCR包含丰富的文本检测、文本识别以及端到端算法。         你可能用到的网址: Paddle官网:飞桨PaddlePaddle-源于

    2024年02月16日
    浏览(37)
  • 初步了解预训练语言模型BERT

    本文字数:: 4024 字 预计阅读时间: 12 分钟 BERT 是由Google提出的预训练语言模型,它基于 transformer 架构,被广泛应用于自然语言处理领域,是当前自然语言处理领域最流行的预训练模型之一。而了解 BERT 需要先了解注意力机制与 Transformers 。 注意力机制 注意力机制(Atten

    2024年02月15日
    浏览(29)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包