AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型

这篇具有很好参考价值的文章主要介绍了AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、Prompt Engineering(怎么去提问大模型)

1)环境准备

①安装OpenAI库

pip install --upgrade openai
  • 附加
    安装来源
python setup.py install

②生成API key
AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记
③设定本地的环境变量
AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记
④代码的准备工作
AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记

⑤在代码运用prompt(简单提问和返回)
AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记

2)交互代码的参数备注

temperature:随机性(从0到2可以调节,回答天马行空变化大可以选2)
model:跟什么类型的model互动
role:(定义交互中的角色)
①user:交互中的我
②assistant:交互中的model
③system:交互中的大环境(需要预先设定。比如告诉模型,你是一个AI专家,在接下来的互动中,回答尽量用专业术语)
AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记

3)交互代码

  • 单论交互代码
import openai
import os

#从.env文件中读取 key-value键值对,并将其设置为环境变量
from dotenv import load_dotenv,find_dotenv 
_ = load_dotenv(find_dotenv())

#获取OPENAI_API_KEY对应键值对数据
openai.api_key = os.getenv('OPENAI_API_KEY')




def getResponse(prompt,model='gpt-3.5-turbo-16k-0613'):
    messages = [
        {'role':'user',
         'content':prompt}]  #只有单论对话
    response = openai.ChatCompletion.create(
        model = model,
        messages = messages,
        temperature = 0,            #对应随机性,0随机性最小
    )



def example():
    instruction = """
        帮我生成一个课程的大概框架,主题是prompt的框架,150字之内
    """
    prompt = f"""
        {instruction}
    """
    response = getResponse(prompt)
    print(response)
    return response.choices[0].messages['content']

二、LangChain(一个框架去使用大模型)

  • 介绍
    通过输入自己的知识库来定制化自己的大语言模型

1)LangChain核心介绍:I/O模块、数据链接模块、记忆模块

  • 备注
    这篇文章主讲I/O模块、数据链路模块、记忆模块(时间关系讲的少)

  • 模块主题可以完整拆分为6部分
    I/O模块
    数据链路模块
    记忆模块
    ④链(Chain)模块
    ⑤智能体(Agent)模块
    ⑥Callbacks

2)I/O模块(Prompts、Language models、Output parsers)

①Prompts:主要管理/协助构送入model的输入
AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记
②Language models:用哪种model
1)LLM:普通的model(大语言模型)

from langchain.llms import OpenAI
llm = OpenAI() #默认是text-davinci-003 模型
print(llm.predict("Hello, "))

2)chat_models:对话式model

from langchain.chat_models import ChatOpenAI
chat_model = ChatOpenAI()  #默认是gpt-3.5-turbo
print(chat_model.predict("Hello, "))

③Output parsers:解析输出结果

AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记

3)数据链接模块(Data connection)

  • 整体流程图

AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记

  • 流程解释

①source:数据源
②load:加载器
这里介绍一个文件加载器 Document loaders,能加载CSV\HTML\JASON\Markdown\PDF

from langchain.document_loaders import PyPDFLoader
loader = PyPDFLoader(""WhatisChatGPT.pdf")
pages  = loader.load_and_split()

print(pages[0].page_content) 

③Transfrom (数据转换,也就是对数据的预处理
1)splitters:将数据按照要求切开成数据块,如按text,按character
2)translate:将数据翻译

translator = DoctraTextTranslator(
	openai_api_model = "gpt-3.5-turbo",language="chinese") # 定义translate
translated_document = await translator.atransform_documents(pages) # 使用translate
print(translated_document[0],page_content)

④embed操作
这里的translate就是将人类语言的数据转成模型认识的特征(feature)(所谓特征:在数学上就是一组张量,也就是一组数字)
AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记

AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记
⑤store储存和retirve
看哪个数据最合适,比对之后从store的地方拿出来
AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记

  • 向量和向量之间如何比对?
    1)常用的方式:余弦举例(看向量之间的夹角越小越进)
    2)最直接:欧式距离(看坐标点距离)
    AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记
# 1)存储
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.vectorstores import FAISS

# 2)embedding
embeddings = OpenAIEmbeddings()
db = FAISS.from_documents(paragraphs,embeddings)

# 3)比对
query = "What can ChatGPT do?"
docs = db.similarity_search(query)
print(docs[0].page_content)

4)记忆模块(针对多轮对话强相关,这种大模型有个特点:都是话痨)

①基本原理构造
从之前的提问数据写回去,再提问的时候丢给Prompt(这里回答的内容是你也好啊你又好啊

from langchain.memory import ConversationBufferMemory

history = ConversationBufferMemory()
history.save_context({"input":"你好啊"},{"output":"你也好啊"}) #保存字符串
# 打印保存的字符串
print(history.load_memory_variables({}))

history.save_context({"input":"你再好啊"},{"output":"你又也好啊"}) #保存字符串
# 打印保存的字符串
print(history.load_memory_variables({}))

AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记

AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记

②如果上下文太长怎么办?(给定特定参数)

from langchain.memory import ConversationBufferWindowMemory

window = ConversationBufferWindowMemory(k=2)  #k值参数决定保留多长参数
window.save_context()

AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记
③或是自动对历史信息取最摘要(ConversationSummaryMemory)
AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记

三、Fine-tuning(如果在自己领域中改变大模型)

  • 训练成本
    可以看到LLaMA这个模型,训练一轮需要21天,没个几百万不行,包括存储数据的成本
    AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记

1)from scratch:从头训练

2)finetune:微调/接着别人的训练

(1)全参数 fine tune
  • 备注
    全部参数都参与调试
(2)小参数fine tune
  • 备注
    小部分参数加入调试
  • 举例
    ①Adapter
    ②prompt tuning
    ③LoRA

AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记

(3)小参数的LoRA原理解析:

原始模型量:R(dxd),比如 4096x406,这个是LLaMA的真实参数量(神经网络的d乘d阶乘)
Efficient模型量:R(dxr),比如 r=8,这个是真实实验数值

  • 代码库
    AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记

  • 代码
    AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记

  • 参数解释
    AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记

(4)训练大模型

创建训练器trainer
AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记

  • 提供训练数据
    ①context:我说了啥
    ②target:我期待模型返回给我什么

AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型,学习,笔记文章来源地址https://www.toymoban.com/news/detail-795845.html

到了这里,关于AI大模型预先学习笔记二:prompt提问大模型、langchain使用大模型框架、fine tune微调大模型的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包