【学习笔记】生成式AI（ChatGPT原理，大型语言模型）

9月前作者：沐兮Krystal 分类：Toy博客阅读(61) 违法举报

这篇具有很好参考价值的文章主要介绍了【学习笔记】生成式AI（ChatGPT原理，大型语言模型）。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

ChatGPT原理剖析

【学习笔记】生成式AI（ChatGPT原理，大型语言模型）,人工智能,chatgpt,学习

语言模型 == 文字接龙
ChatGPT在测试阶段是不联网的。

ChatGPT背后的关键技术：预训练（Pre-train）

又叫自监督式学习（Self-supervised Learning），得到的模型叫做基石模型（Foundation Model）。在自监督学习中，用一些方式“无痛”生成成对的学习资料。
GPT1 -> GPT2 -> GPT3 （参数量增加，通过大量网络资料学习，这一过程称为预训练），GPT -> ChatGPT (增加人类老师提供的资料学习)，GPT到ChatGPT增加的继续学习的过程就叫做微调（finetune）。

预训练多有帮助呢？

在多种语言上做预训练后，只要教某一个语言的某一个任务，自动学会其他语言的同样任务。
当在104种语言上预训练，在英语数据上微调后在中文数据上测试的结果（78.8的F1值），和在中文数据上微调并在中文数据上测试的结果（78.1的F1值）相当。

ChatGPT带来的研究问题

1.如何精准提出需求
2.如何更正错误【Neural Editing】
3.侦测AI生成的物件
- 怎么用模型侦测一段文字是不是AI生成的
4.不小心泄露秘密?【Machine Unlearning】

对于大型语言模型的两种不同期待 Finetune vs. Prompt

【学习笔记】生成式AI（ChatGPT原理，大型语言模型）,人工智能,chatgpt,学习文章来源地址https://www.toymoban.com/news/detail-633225.html

成为专才，对预训练模型做改造，加外挂和微调参数。
成为通才，机器要学会读题目描述或者题目范例
- 题目叙述–Instruction Learning
- 范例–In-context Learning
In-context Learning
给机器的范例的domain是很重要的；范例的数量并不需要很多，并不是通过范例进行学习，范例的作用只是唤醒模型的记忆；也就是说，语言模型本来就会做情感分析，只是需要被指出需要做情感任务。
Instruction-tuning

到了这里，关于【学习笔记】生成式AI（ChatGPT原理，大型语言模型）的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

LAION-AI 的新开源 ChatGPT 替代方案：个高端消费类 GPU 上运行的大型语言模型Open Assistant 评测

语言模型近年来取得了长足的进步，其中一个新发布的模型是 OpenAssistant 和 ChatGPT，无需介绍。为了比较这些模型的功能，我们在两个平台上进行了一系列测试，以了解它们在不同类别中的表现。今天（2023 年 4 月 12 日） Github上的热门话题是Open Assistant（简称 OA），它是由

2023年04月23日
浏览(46)
生成式AI：大语言模型ChatGPT交互的机制

推荐：将 NSDT场景编辑器加入你的3D工具链 3D工具集： NSDT简石数字孪生随着生成式人工智能的普及，特别是 ChatGPT，提示已成为人工智能世界中越来越重要的技能。制作提示，与大型语言模型（LLM）（如ChatGPT）交互的机制，并不是它最初看起来的简单语法任务。在与 ChatGP

2024年02月15日
浏览(49)
《大型语言模型自然语言生成评估》综述

在快速发展的自然语言生成（NLG）评估领域中，引入大型语言模型（LLMs）为评估生成内容质量开辟了新途径，例如，连贯性、创造力和上下文相关性。本综述旨在提供一个关于利用LLMs进行NLG评估的全面概览，这是一个缺乏系统分析的新兴领域。我们提出了一个连贯的分类体

2024年01月23日
浏览(58)
Llama大型语言模型原理详解

Llama大型语言模型是一种基于深度学习的自然语言处理模型，它在文本生成、问答、摘要等多种NLP任务中展现出强大的性能。本文将详细解析Llama模型的原理，包括其结构、训练过程以及工作机制，帮助读者深入理解这一先进的模型。一、模型结构 Llama模型采用了一种基于T

2024年04月12日
浏览(38)
用于 ChatGPT 的 FPGA 加速大型语言模型

近年来，大型语言模型（LLM）彻底改变了自然语言处理领域，使机器能够生成类似人类的文本并进行有意义的对话。这些模型，例如 OpenAI 的 GPT，具有惊人的理解和生成语言的能力。它们可用于广泛的自然语言处理任务，包括文本生成、翻译、摘要、情感分析等

2024年02月04日
浏览(47)
ChatGPT和大型语言模型(LLM)是什么关系？

什么是语言模型：\\\" 语言模型的本质是一个数学模型，用于捕捉和理解人类语言的结构和规律。它通过分析大量文本数据中的单词或字符之间的关系，以概率的方式预测在给定上下文情况下下一个可能出现的单词或字符。这种模型允许计算机在生成文本、翻译语言、问答等任

2024年02月10日
浏览(47)
李宏毅2023春季机器学习笔记 - 01生成AI（ChatGPT）

预设的知识储备要求：数学（微积分、线性代数、机率）；编程能力（读写python）这门课专注在深度学习领域deep learning，事实上深度学习在今天的整个机器学习（ML）的领域使用非常广泛，可以说是最受重视的一项ML技术。这门课可以作为你的机器学习的第一堂课，修完后

2023年04月19日
浏览(56)
6.Go语言学习笔记-结合chatGPT辅助学习Go语言底层原理

1、Go版本 2、汇编基础推荐阅读:GO汇编语言简介推荐阅读:A Quick Guide to Go\\\'s Assembler - The Go Programming Language 精简指令集数据传输: MOV/LEA 跳转指令: CMP/TEST/JMP/JCC 栈指令: PUSH/POP 函数调用指令: CALL/RET 算术指令: ADD/SUB/MUL/DIV 逻辑指令: AND/OR/XOR/NOT 移位指令: SHL/SHR JCC有条件跳转: JE

2024年02月04日
浏览(41)
大型语言模型RAG（检索增强生成）：检索技术的应用与挑战

检索增强生成（RAG）系统通过结合传统的语言模型生成能力和结构化数据检索，为复杂的问题提供精确的答案。本文深入探讨了RAG系统中检索技术的工作原理、实现方式以及面临的挑战，并对未来的发展方向提出了展望。随着大型预训练语言模型（LLMs）如GPT-3和BERT的出现，

2024年03月14日
浏览(42)
AI大战，Meta发布大型语言模型LLaMA

ChatGPT引爆了AI行业，全球的科技巨头都先后加入这场AI大战，作为行业大佬的Meta也不例外，宣布推出大型语言模型LLaMA，加入到了这场由微软、谷歌等科技巨头主导的AI“厮杀”中。 LLaMA 模型由 Meta 的FAIR 团队开发，旨在帮助研究人员和工程师探索人工智能应用和相关功能，在

2024年02月13日
浏览(53)