PrivateGPT:安全和私密的离线 GPT-4

这篇具有很好参考价值的文章主要介绍了PrivateGPT:安全和私密的离线 GPT-4。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

在人工智能 (AI) 和自然语言处理 (NLP) 领域,隐私通常是一个基本问题,尤其是在处理敏感数据时。PrivateGPT 是这一领域的突破性发展,正面解决了这个问题。它旨在在没有互联网连接的情况下在本地运行,通过防止数据离开您的执行环境来确保完全隐私。

PrivateGPT:安全和私密的离线 GPT-4

什么是私有 GPT?

PrivateGPT 是一种创新工具,它将 GPT-4 强大的语言理解能力与严格的隐私措施相结合。利用 LangChain、GPT4All、LlamaCpp、Chroma 和 SentenceTransformers 的优势,PrivateGPT 允许用户完全在本地与 GPT-4 进行交互。让我们深入研究设置 PrivateGPT 的细节以及如何有效地使用它。

设置 PrivateGPT:分步

设置 PrivateGPT 主要包括两个步骤:安装要求和配置环境。首先,确保您的计算机上安装了 Python 3.10 或更高版本。

第一步:安装依赖

pip3 install -r requirements.txt

第 2 步:下载语言学习模型 (LLM) 并将其放置在您选择的目录中。默认模型是ggml-gpt4all-j-v1.3-groovy.bin. 但是,可以使用任何 GPT4All-J 兼容模型。

第 3 步:重命名example.env.env编辑环境变量:

  • MODEL_TYPE:指定 LlamaCpp 或 GPT4All。
  • PERSIST_DIRECTORY:设置矢量存储的文件夹。
  • MODEL_PATH: 提供你的 LLM 的路径。
  • MODEL_N_CTX:确定 LLM 模型的最大令牌限制。
  • EMBEDDINGS_MODEL_NAME:指定 SentenceTransformers 嵌入模型名称。
  • TARGET_SOURCE_CHUNKS:确定将用于回答问题的块数。

随着环境的建立,我们现在可以继续摄取数据。

使用 PrivateGPT 摄取数据

PrivateGPT 支持各种文件类型,从 CSV、Word 文档到 HTML 文件等等。以下是您摄取自己的数据的方式:

第 1 步:将文件放入source_documents目录

第二步:运行ingest.py脚本处理所有数据

python ingest.py

该脚本在文件夹中创建一个本地嵌入数据库db。每个文档大约需要 20-30 秒,具体取决于文档大小。

与 PrivateGPT 交互

现在,让我们深入探讨如何使用 PrivateGPT 在本地对文档提问:

第 1 步:运行privateGPT.py脚本:

python privateGPT.py

第 2 步:出现提示时,输入您的查询。

在 20-30 秒内,根据您机器的速度,PrivateGPT 使用 GPT-4 模型生成一个答案,并提供它从您的文档中使用的来源来创建响应。

释放 PrivateGPT 的力量:底层机制

PrivateGPT 的隐私保护本地操作由强大工具的组合提供支持。ingest.py利用 LangChain 工具解析文档,使用 HuggingFaceEmbeddings(SentenceTransformers 的一部分)创建本地嵌入。生成的嵌入存储在具有色度矢量存储的本地矢量数据库中。

privateGPT.py使用本地 LLM——GPT4All-J 或 LlamaCpp——来理解用户查询并制作合适的响应。本地向量存储用于提取这些响应的上下文,利用相似性搜索从摄取的文档中找到相应的上下文。

系统要求和故障排除

PrivateGPT 的系统先决条件包括 Python 3.10 或更高版本。在 pip 安装过程中,如果出现 C++ 编译器错误,则会提供适用于 Windows 10/11 和运行 Intel 的 Mac 的安装说明。

您可以在此处访问 PrivateGPT GitHub(在新标签页中打开).

结论

PrivateGPT 证明了强大的人工智能语言模型(如 GPT-4)与严格的数据隐私协议的融合。它为用户提供了一个安全的环境来与他们的文档进行交互,确保没有数据被外部共享。无论您是 AI 爱好者还是注重隐私的用户,PrivateGPT 都为保护隐私的 AI 应用程序开辟了新的可能性。文章来源地址https://www.toymoban.com/news/detail-482633.html

到了这里,关于PrivateGPT:安全和私密的离线 GPT-4的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 制作vs2017的离线安装包

    在公司的电脑上安装了vs2015,但是30天体验卡到期之后不能离线激活,所以只能下个vs2017。可微软官网vs2017的社区版停了,另外说一下官网有版本也都是在线的下载器。又由于公司的电脑不能连外网的,所以在安装vs的时候就只能使用安装包。所以只能用一天的时间自己鼓捣了

    2024年02月08日
    浏览(85)
  • docker-compose的离线安装

    记录而已 下载docker-compose 下载地址:https://github.com/docker/compose/releases 这里有很多个版本,最新的是2.24.6,具体可以自己选 上传文件,并且开始安装

    2024年02月22日
    浏览(46)
  • Ubuntu20下的Docker的离线安装

    在实际项目中,经常遇到一些纯内网的环境,对于项目的部署来说就需要做到离线安装Docker,然后把项目的外网镜像从拷贝到内网进行部署。下面主要记录下如何离线安装Docker 1.下载Docker的离线安装包 Docker的离线安装需要用到containerd.io ,docker-ce-cli,docker-ce,从下面的网址下

    2024年02月01日
    浏览(38)
  • HTML5 的离线储存怎么使用,工作原理

    TML5提供了一种称为离线储存(Offline Storage)的功能,它允许网页在离线时缓存和存储数据,以便用户可以在没有网络连接的情况下访问这些数据。离线储存是通过使用Web Storage API或者应用程序缓存(Application Cache)来实现的。 Web Storage API提供了两种用于离线储存的对象:se

    2024年02月15日
    浏览(40)
  • 准确率 99.9% 的离线IP地址定位库

    Ip2region 是一个离线 IP 地址定位库,准确率高达 99.9%,搜索性能为 0.0x 毫秒。DB 文件只有几兆字节,其中存储了所有 IP 地址。 支持 Java、PHP、C、Python、Nodejs、Golang、C#、lua 等查询绑定。查询算法使用二叉树、B树和内存搜索算法。 查询准确率高达99.9% 数据来源于一些知名的

    2024年02月12日
    浏览(40)
  • 免费,开源,可批量的离线图片文字提取软件OCR

    免费,开源,可批量的离线OCR软件 适用于 Windows7 x64 及以上 免费 :本项目所有代码开源,完全免费。 方便 :解压即用,离线运行,无需网络。 批量 :可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。 高效 :采用 PaddleOCR-json C++ 识别

    2024年02月07日
    浏览(59)
  • Office2021中文零售版的离线安装包下载地址合集

    office2021将于2021年10月5日跟随 Windows 11 正式版全面上市。 微软 Office 2021是Office 套件的下一个永久版本,微软 Office 2021 将面向商业客户、消费者和小型企业发布。 Office2021中文零售版的离线安装包下载地址合集: 一、专业增强版(强烈推荐): http://officecdn.microsoft.com/pr/49235

    2024年02月08日
    浏览(61)
  • OpenAI的离线音频转文本模型 Whisper 的.NET封装项目

    whisper介绍 Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的Whisper神经网络,且它亦支持其它98种语言的自动语音辨识。 Whisper系统所提供的自动语音辨识(Automatic Speech Recognition,ASR)模型是被训练来运行语音辨识与翻译任务的,它们能将各种语言的语音变

    2023年04月24日
    浏览(41)
  • Jenkins执行Maven项目的离线构建,引用本地lib资源方案记录

    这段时间手头上有个多模态结构的Maven项目需要给到客户进行验证部署,且不能直接打包镜像,而是在客户本地进行编译构建,但由于客户方的 Maven 私库有网络隔离不能连通外网,我们无法将项目的其他依赖推送到客户方,所以就需要将项目适配成引用本地lib目录下的jar包。

    2024年02月04日
    浏览(47)
  • 适用于 Windows 10/11 电脑 的 5 大好用的离线录屏软件

    屏幕录制应用程序可以 数字记录出现在任何设备或 PC 屏幕上的内容,并同时 以高清流式传输音频和视频。  因此,他们帮助 创建营销视频、跟踪客户行为、设计产品演示 、监控员工活动、录制教育内容、网络研讨会内容和业务会议内容。  现在您已经意识到屏幕录制应用

    2024年02月02日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包