将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！-Toy模板网

这篇具有很好参考价值的文章主要介绍了将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

FastGPT 是一个基于 LLM 大语言模型的知识库问答系统，提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排，从而实现复杂的问答场景！

Llama2 是Facebook 母公司 Meta 发布的开源可商用大模型，国内的开源社区以及个人和机构也纷纷着手基于 Llama2 构建了中文版，并且还利用 GGML 机器学习张量库构建了可以在 CPU 上运行的 Llama2 中文版模型。

今天我们来玩点刺激的！ 首先在 CPU 上运行一个开源的 Llama2 中文版模型，然后将这个模型接入到 FastGPT 的知识库中，最后再将 FastGPT 接入第三方任意 GPT 套壳应用。

原文链接：https://forum.laf.run/d/1009

一键运行 LLama2 中文版

运行模型有很多种方法，但是为了能和各种 GPT 应用兼容，最好能够提供一个对外的 API，并且这个 API 还得对齐 OpenAI 的 API。这就需要用到一个叫做 Text generation web UI 的项目。

Text generation web UI

Text generation web UI 是一个大语言模型启动器，它的终极目标是在 AI 对话领域对标 Stable Diffusion WebUI。引用 GitHub 原文：

A gradio web UI for running Large Language Models like LLaMA, llama.cpp, GPT-J, OPT, and GALACTICA.

Its goal is to become the AUTOMATIC1111/stable-diffusion-webui of text generation.

它可以加载几乎所有的主流模型（支持 llama.cpp 模型），并且在本地运行他们。语言模型能做什么，你就能体验到什么，可以当成离线版 ChatGPT 来使用。再加上 ChatGPT 在国内的审查问题，以及信息泄露风险，客制化的本地模型几乎提供了无限可能。

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！,AI,人工智能,ChatGPT

值得一提的是，它还支持通过 API 来进行调用，同时还提供插件对齐 OpenAI 的 API，你可以将其接入任意套壳 GPT 应用中。

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！,AI,人工智能,ChatGPT

接下来我们就需要用到这个 openai 插件！

Sealos 国内集群

今年 6 月份，Sealos 正式上线了海外集群，虽然也向国内用户开放，但其机房在新加坡，国内部分线路不太友好。国内很多用户的需求比较特殊，必须要使用魔法，海外集群正好可以满足需求，至于线路到国内是否友好并不是非常重要。

但大部分国内用户的需求还是要保证线路稳定，使用海外集群就有点力不从心了。为了满足国内用户的需求，如今我们正式上线了国内集群，与海外集群功能一致。除此之外，国内集群还新增了一项功能：通过共享存储来加载主流的大模型文件（目前只加载了 LLama2 中文模型）。

运行 Llama2 中文模型

我们可以直接通过以下链接打开 Text generation web UI 的应用部署模板：

https://cloud.sealos.top/?openapp=system-template%3FtemplateName%3Dllama2-chinese

然后直接点击「部署应用」，部署完成后跳转到应用详情页面，查看日志：

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！,AI,人工智能,ChatGPT

只有出现下面红色方框中的日志，才算是启动完了：

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！,AI,人工智能,ChatGPT

这里的外网地址是 openai 插件的 API 地址（因为 Sealos 目前只能暴露一个端口到外网，暂且将 Web UI 端口关闭了，只暴露 API 端口），复制一下外网地址，就可以接入 FastGPT 了。

将 Llama2 中文版接入 FastGPT

首先打开 FastGPT 并登录：https://fastgpt.run

然后进入账号界面，点击「OpenAI 账号」：

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！,AI,人工智能,ChatGPT

API Key 的值随便填，BaseUrl 的值填入之前在应用详情页面复制的外网地址，并在结尾加上路径 v1，并点击「确认」：

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！,AI,人工智能,ChatGPT

然后就可以在 FastGPT 中和 Llama2 中文大模型进行对话啦~

首先来到「应用界面」，新建一个应用：

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！,AI,人工智能,ChatGPT

模板选择「简单的对话」，然后确认创建：

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！,AI,人工智能,ChatGPT

应用设置界面有很多可以自定义的选项，我们暂时先不管它，直接点击「对话」进行对话：

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！,AI,人工智能,ChatGPT

回复速度还是不错的，毕竟给他分配了 15C，勉强能用。而且理解能力也不错，就是有时候胡说八道的能力与 GPT-3.5 有的一拼~

接入知识库

下面来玩一个更花的，将 Llama2 中文版接入 FastGPT 的知识库。

首先创建一个知识库：

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！,AI,人工智能,ChatGPT

然后导入数据开始训练：

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！,AI,人工智能,ChatGPT

FastGPT 提供了手动输入、直接分段、LLM 自动处理和 CSV 等多种数据导入途径，其中“直接分段”支持通过 PDF、WORD、Markdown 和 CSV 文档内容作为上下文。FastGPT 会自动对文本数据进行预处理、向量化和 QA 分割，节省手动训练时间，提升效能。

关于知识库的训练方式，可以参考这篇文章：利用 FastGPT 打造高质量 AI 知识库

训练好知识库后，需要到你的「应用」中关联你的知识库：

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！,AI,人工智能,ChatGPT

关联完知识库后，再次与应用进行对话，它就会根据知识库内容来回答你的问题。以我训练的本公司 CEO 数字克隆为例：

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！,AI,人工智能,ChatGPT

效果还是很不错的👍

将 FastGPT 接入任意套壳 GPT

现在来到了最后一个环节，现在绝大多数的 GPT 应用接入的都是 OpenAI 的 API，所以只要咱们的 API 对齐了 OpenAI，就可以直接接入绝大多数的 GPT 应用。

这不巧了么这不是，FastGPT 现在已经完全对齐了 OpenAI，可以直接接入第三方 GPT 应用了。

首先依次选择应用 -> 「API访问」，然后点击「API 密钥」来创建密钥：

⚠️注意：密钥需要自己保管好，一旦关闭就无法再复制密钥，只能创建新密钥再复制。

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！,AI,人工智能,ChatGPT

组合秘钥

利用刚复制的 API 秘钥加上 AppId 组合成一个新的秘钥，格式为：API 秘钥-AppId，例如这里的组合密钥就是：fastgpt-z51pkjqm9nrk03a1rx2funoy-6467660e98568613e0525b45。

替换三方应用的变量

一般只需要替换以下两个变量即可：

OPENAI_API_BASE_URL: https://fastgpt.run/api/openapi (改成自己部署的域名)
OPENAI_API_KEY = 组合秘钥

不同应用的变量名不一样，但都差不多，自己甄别一下。

ChatGPT Next Web 示例：

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！,AI,人工智能,ChatGPT

ChatGPT Web 示例：

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！,AI,人工智能,ChatGPT

最后看一下效果：

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！,AI,人工智能,ChatGPT 文章来源地址https://www.toymoban.com/news/detail-683683.html

到了这里，关于将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！

一键运行 LLama2 中文版

Text generation web UI

Sealos 国内集群

运行 Llama2 中文模型

将 Llama2 中文版接入 FastGPT

接入知识库

将 FastGPT 接入任意套壳 GPT

组合秘钥

替换三方应用的变量

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2