大模型扫盲之小白入门手记

这篇具有很好参考价值的文章主要介绍了大模型扫盲之小白入门手记。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

本篇内容来自小米集团数据科学部负责人刘汉武老师的数据特训营笔记。不涉及深入的知识,仅在扫盲。

首先一个问题:大模型和大语言模型的区别是什么?
有人说大模型像是连接数据的星辰,能给我们提供前所未有的见解和洞察。现有的大模型很多,随便一搜,就能看到很多,除却最近大火的GPT,还有专注于常识推理、形式逻辑的PaLM、专门服务于企业的Cohere、目前仅能用于研究的LLaMA…在大语言模型和大模型中,大语言模型的大体现在模型规模和数据量上;而由NLP发展起来的语言模型专注于文字语言的处理。可能在未来会有图像的分支(好像已经有了)

发展历史

大语言模型基于transform分支发展起来,整体大概可以分为3个大分支。

  • 蓝色的部分依赖于transform的解码器,以GPT为代表。GPT是闭源的,该分支下还有开源的LLaMA供研究学习
  • 粉色的部分依赖于transform的编码器,以BERT为代表,GPT君临天下之前,BERT横扫江湖
  • 绿色的部分既依赖于编码器,又依赖于解码器。其中最强健的两个模型,一个是谷歌T5,另一个是清华大学的GLM
    大模型扫盲之小白入门手记,机器学习,gpt-3,文心一言,机器学习,人工智能

扫盲小知识:BERT和GPT有什么区别

大模型一般用途

大模型发展很快,日常生活中,像我这样的程序员有时候会让他帮忙写代码(bushi),有人用它作为生活管家,有人依赖它对数据进行分析(譬如,生成一些简单的sql语句:我要查询2023年8月某商品的销售量和用户类型)。我们可以简单分为4类:

  1. 使用者(非研发):譬如用AI写某红书,画画,写作业(不行!作业还是要自己写!)
  2. 大模型工具开发者(研发):他们需要了解大模型原理,依靠模型进行分布式训练,同时需要处理数据,进行一些模型的开发。典型的成果包括通过预训练大模型数据能捕捉语义规律,产生更自然的文本和图像内容的Monica
  3. 领域大模型开发者(研发):典型的成果由医疗大模型、交通大模型等等,这类人群利用底层大模型做微调,构建领域的大模型。他们重点关注模型微调的技术,譬如P_Tuning、LoRa、Instruct。需要了解大模型原理
  4. 基座大模型开发者(研发):典型的基座大模型有OpenAI的ChatGpt、Meta的LLaMA、阿里的通义千问、百度文心一言、小米的MiLM。开发基座大模型,需要精通大模型原理,熟练掌握大规模分布式训练、大规模数据处理的技术。

使用大模型

大模型那么香,那么,我们如何使用大模型呢?
我们做一个场景假设,你开了一家餐厅,并迎来了第一批顾客。他们用餐之后,纷纷在小程序上留下了评论。你想要统计一下有多少顾客满意、多少顾客觉得差点儿意思。
传统的方式不外乎自己或者雇个小弟一条一条看。更科技一些,可以雇个程序员给你写一个分类器。但是如果有了大模型,你只需要对大模型进行调教,就能完成情感分类这个任务。

大模型扫盲之小白入门手记,机器学习,gpt-3,文心一言,机器学习,人工智能

使用prompt让下游任务适配大模型

从前,针对不同类型的需求,需要训练不同类型的模型。譬如机翻需要训练机翻的模型,情感分析需要训练情感分析的模型。每一次训练需要标注数据、预训练、获取尽可能收益大的特征、调参,才能得到一个对需求有效的模型。而prompt就像一个适配接口,只需要一个大模型,就可以适配不同的任务。

大模型扫盲之小白入门手记,机器学习,gpt-3,文心一言,机器学习,人工智能

模型部署

我们知道,模型越大,消耗的算力越多,选模型需要选最合适的。因此我们需要通过部署模型进行对比测试,找到最合适的基座大模型。模型部署分5步:

  1. 搭建开发环境
  2. 到官网下载模型
  3. 下载源码
  4. 安装依赖
  5. 测试模型的基本能力

–没写完,放个凳子。文章来源地址https://www.toymoban.com/news/detail-709368.html

到了这里,关于大模型扫盲之小白入门手记的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 全网最详细中英文ChatGPT-GPT-4示例文档-智能聊天机器人从0到1快速入门——官网推荐的48种最佳应用场景(附python/node.js/curl命令源代码,小白也能学)

    目录 Introduce 简介 setting 设置 Prompt 提示 Sample response 回复样本 API request 接口请求 python接口请求示例 node.js接口请求示例 curl命令示例 json格式示例 其它资料下载 ChatGPT是目前最先进的AI聊天机器人,它能够理解图片和文字,生成流畅和有趣的回答。如果你想跟上AI时代的潮流,

    2023年04月11日
    浏览(43)
  • 百度文心大模型4.0发布,对标GPT-4

    10月17日,李彦宏在百度世界2023大会上表示发布文心大模型4.0版本,并带来新搜索、新地图等十余款AI原生应用。 李彦宏自信地表示文心大模型 4.0 版本的能力,「和 GPT-4 比毫不逊色」。他表示,这是迄今为止最强大的文心大模型,实现了基础模型的全面升级,在理解、生成

    2024年02月08日
    浏览(35)
  • 【AI机器学习入门与实战】训练模型、优化模型、部署模型

    👍【 AI机器学习入门与实战 】目录 🍭 基础篇 🔥 第一篇:【AI机器学习入门与实战】AI 人工智能介绍 🔥 第二篇:【AI机器学习入门与实战】机器学习核心概念理解 🔥 第三篇:【AI机器学习入门与实战】机器学习算法都有哪些分类? 🔥 第四篇:【AI机器学习入门与实战】

    2024年02月12日
    浏览(43)
  • GPT与文心一言大模型的比较与展望

    随着人工智能技术的飞速发展,自然语言处理领域的两个引领者,GPT(生成式预训练模型)和文心一言(一种中文文本生成模型)各自展现了其独特的优势和特点。本文旨在深入研究和比较这两个大模型,探讨它们在语言生成、文本理解和创造性表达等方面的异同。通过对它

    2024年01月19日
    浏览(30)
  • H5测试扫盲,小白必看!

    对于刚刚接触H5测试的小伙伴来说,了解一些H5的基础知识是很有必要的,以免测完H5页面,还是一脸懵,出去面试的时候,面试官问最基础的问题比如什么是H5页面,都回答不上来。 抽空整理了一些H5的基础知识点,希望对大家有所启发。 一、什么是H5页面 H5指HTML5,是构建

    2024年02月09日
    浏览(48)
  • GPT-4、百度文心一言摆擂,AI大模型将掀起新一轮AIGC军备竞赛?

    科技云报道原创。 一觉醒来,万众期待的GPT-4来了。OpenAI老板Sam Altman直接开门见山地介绍说:“这是我们迄今为止功能最强大的模型!”仅隔一天,“中国版ChatGPT”百度文心一言正式发布,双方大有摆擂之势。 当深度学习推动AI技术又一次复兴,人类对它的最高期待,就是

    2024年02月09日
    浏览(30)
  • GPT4、文心一言4、ChatGLM、Claude2.1四大语言模型生成效果对比

            随着AIGC大风起,也掀起了语言模型大争之世,各种语言模型如雨后春笋,让大家眼花缭乱。周周都有新的选手入场,月月都有新的模型问世。不过其中最受人瞩目的当属GPT4、文心一言4、ChatGLM、Claude2.1四大模型。隐隐有傲视群雄之姿,今天我们也对这语言模型的四大

    2024年02月04日
    浏览(39)
  • AI介绍——chat gpt/文心一言/claude/bard/星火大模型/bing AI

    ChatGPT 是 OpenAI 开发的人工智能聊天机器人。该聊天机器人基于 GPT-3.5 语言模型,经过训练可以对用户给出的指令做出详细响应。与其他聊天机器人不同,ChatGPT 可以回答后续问题、求解数学方程式、撰写文本、修复和调试代码以及总结文本。它还可以在语言之间进行翻译。

    2024年02月14日
    浏览(86)
  • GEE入门学习,遥感云大数据分析、管理与可视化以及在林业应用丨灾害、水体与湿地领域应用丨GPT模型应用

    目录 ①海量遥感数据处理与GEE云计算技术实践应用 ②GPT模型支持下的Python-GEE遥感云大数据分析、管理与可视化技术及多领域案例实践应用 ③GEE遥感云大数据林业应用典型案例实践及GPT模型应用 ④遥感云大数据在灾害、水体与湿地领域典型案例实践及GPT模型应用 目前,GEE以

    2024年02月15日
    浏览(40)
  • 机器学习小白的学习路线

    当涉及到机器学习的学习路线时,以下是一个可以帮助你入门和提高的一般性路线: 学习基础知识: 数学基础:线性代数、概率论和统计学是机器学习的基础。学习这些概念将帮助你理解算法背后的原理。 编程技能:Python是机器学习最常用的编程语言。学习Python编程和相关

    2024年02月09日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包