关于语言模型私有化部署的讨论 | AIGC实践

这篇具有很好参考价值的文章主要介绍了关于语言模型私有化部署的讨论 | AIGC实践。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

上周在与TC同行关于AIGC实践的线上交流中,大家普遍比较关心的一个实践切入点是:语言模型的私有化部署——简单来说,就是在企业内部,部署一个属于自己的“ChatGPT”,对于本行业/专业知识,以及企业独有的产品和技术信息有充分的了解,并且提供用户接口,通过自然语言交流,解答内外部用户的问题。

其实,在此前/此后的多次单点交流中,也有不同行业的朋友向我咨询相同问题。可见,任何人在体验过ChatGPT超强的语言能力后,都不难意识到,这种交互方式必将会成为未来非常重要的应用场景。

这段时间,我花了不少时间做调研;并且,由于我司主营AI计算设备及软件,也刚好具备相关技术背景,于是便近水楼台地与研发Lead和产品经理分别进行交流,看看是否有机会率先实施并落地一个内部应用。

在此梳理一下相关脉络,做一个简单的分享,希望可以给到有相同问题的朋友一点启发。

关于语言模型私有化部署的讨论 | AIGC实践

主题图Prompt:Privatization Deployment of Large Language Models. technological style. --ar 16:9

基本分析

语言模型私有化部署的应用场景,可谓显而易见。

典型场景包括:

  • 内部知识库:提供企业内部的知识共享平台。

  • 智能客服机器人:提供获取产品/技术信息的用户接口。

  • 专家咨询机器人:提供医疗、律师等专业领域的咨询服务。

应用范围非常广泛,几乎可以涵盖所有专业咨询行业,以及所有对外输出产品和服务的企业。应用价值就更不必说了:

  • 技术革新,全面推进AI化进程。所谓的“第四次工业革命”,具有划时代意义;

  • 降本增效。既然AI可以又快又好地完成任务,自然也就不需要付出人工成本。

实现部署的相关资源包括:

  • 硬件:LLM对算力有比较高的要求。

  • 模型:可采用免费的开源模型。

  • 语料库:包括但不限于行业/专业信息;以及企业的产品/技术信息。

  • 算法:需要比较专业的算法工程师参与进行模型训练/微调。

研发观点

从研发的角度来看,实现语言模型私有化部署,还是非常有希望的。

实现语言模型私有化部署的系统架构,主要包括:

  • LLM:语言模型;

  • KB:知识库;

  • 框架:将LLM和KB建立联系;

  • UI:用户界面。

关于语言模型私有化部署的讨论 | AIGC实践

其中,LLM可采用2种方式实现:

  • 使用公共模型:通过调用API接口使用OpenAI GPT-3.5

  • 使用开源模型:使用开源模型ChatGLM,但开源不能商用。参考:
    https://github.com/imClumsyPanda/langchain-ChatGLM

部署逻辑分别为:

关于语言模型私有化部署的讨论 | AIGC实践

使用公共模型部署逻辑

关于语言模型私有化部署的讨论 | AIGC实践

使用开源模型部署逻辑

KB的输入是语料库,然后经过一系列处理,成为可被LLM调取的知识。

语料库的准备比较简单,只需要保证:内容是以TXT或者Markdown等格式存储的纯文本信息(不包含样式)。

也就是说,如果采用xml类型的内容系统,应该可以比较容易做系统集成;如果采用Word类型的文档,需要转换成不包含样式的纯文本信息,并做必要的数据清洗,避免在转换后出现异常。

产品观点

产品经理的意见,与研发Lead有很大不同,会比较偏向于相对悲观的观点。在他看来:

现有ChatGPT和文心一言采用的语言模型,具有巨大数量的权重参数,并且在语料库上投入了巨大的开发成本——这绝对是开源模型和数据集,无法比拟的。

即便如此,ChatGPT与文心一言在回答问题时,表现出的实际效果,也不完全令人满意;何况是企业基于开源模型自行开发的应用。

第三,语料库的开发也会牵扯到比较大的投入成本,切不说是行业内的专业信息,即便是聚焦在企业产品和技术上的信息,也可能需要投入非常大的工作量。

所以,投入成本与实现效果决定了,可能不太值得去做这样的尝试。

未来,企业比较有希望实现落地的方式是,当文心一言或其他类似应用,最终达到了一个比较好的输出效果后,可能会对外输出toB业务支持,当然,是需要付费的。对于普通企业而言,这可能是相对比较经济的方式。

总结

以上内容基于本人有限的眼界和理解,仅供参考。如果你的企业找到了低成本、高收益的解决方案,实施并落地了应用,也非常期待听到你的分享。

相关文章:#AIGC实践

其他推荐:

实施:GitHub + MarkDown 文档系统的工作环境部署及工作流程说明 | 技术传播

关于语言模型私有化部署的讨论 | AIGC实践

技术传播是一片蓝海 | 技术传播

访谈:TC无处不在,只是我们没有发觉 | 技术传播

这次他们说好要“讲真的” | 传播

在座都别吵了,你们还有我 | 技术传播

一本培养强迫症患者的说明书 | 技术传播

就像用心做好日本料理 | 技术传播

顽固的老头子与无聊的说明书 | 技术传播

转战新媒体 | 技术传播

评测:王者荣耀的用户帮助系统 | 技术传播

让爸爸妈妈也能享受到科技发展带来的便利 | 技术传播

企业级信息管理系统初创方案构思 | 技术传播

 关于语言模型私有化部署的讨论 | AIGC实践

睿齐

技术传播从业者

品牌内容策划

自由摄影师

自由撰稿人

汪力迪

公众号:techcomm / htstory

微信号:bgrichi

邮箱:hash_0813@163.com文章来源地址https://www.toymoban.com/news/detail-514104.html

到了这里,关于关于语言模型私有化部署的讨论 | AIGC实践的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Windows11下私有化部署大语言模型实战 langchain+llama2

    CPU:锐龙5600X 显卡:GTX3070 内存:32G 注:硬件配置仅为博主的配置,不是最低要求配置,也不是推荐配置。该配置下计算速度约为40tokens/s。实测核显笔记本(i7-1165g7)也能跑,速度3tokens/s。 Windows系统版本:Win11专业版23H2 Python版本:3.11 Cuda版本:12.3.2 VS版本:VS2022 17.8.3 lan

    2024年02月03日
    浏览(224)
  • 私有化部署大模型:5个.Net开源项目

    从零构建.Net前后端分离项目 今天一起盘点下,10月份推荐的5个.Net开源项目(点击标题查看详情)。 1、BootstrapBlazor企业级组件库:前端开发的革新之路 BootstrapBlazor是一个用于构建现代Web应用程序的开源框架,它基于Blazor框架,采用Bootstrap的UI样式。Blazor框架允许使用C#代替

    2024年02月05日
    浏览(62)
  • C#开源项目:私有化部署LLama推理大模型

    推荐一个C#大模型推理开源项目,让你轻松驾驭私有化部署! 01 项目简介 LLama是Meta发布的一个免费开源的大模型,是一个有着上百亿数量级参数的大语言模型,支持CPU和GPU两种方式。 而LLamaSharp就是针对llama.cpp封装的C#版本,让方便我们基于C#开发应用,让我们不需要自己编译

    2024年02月03日
    浏览(65)
  • 开源支持私有化部署一分钟构建大模型机器人

    Dify 是一款 中国开源 的大语言模型(LLM) 应用开发平台。使开发者可以快速搭建生产级的生成式 AI 应用。即使你是非技术人员,也能参与到 AI 应用的定义和数据运营过程中。Dify 提供了更接近生产需要的完整方案, Dify 好比是一套脚手架 ,并且经过了精良的工程设计和软件测

    2024年04月16日
    浏览(55)
  • 【码银送书第六期】《ChatGPT原理与实战:大型语言模型的算法、技术和私有化》

    2022年11月30日,ChatGPT模型问世后,立刻在全球范围内掀起了轩然大波。无论AI从业者还是非从业者,都在热议ChatGPT极具冲击力的交互体验和惊人的生成内容。这使得广大群众重新认识到人工智能的潜力和价值。对于AI从业者来说,ChatGPT模型成为一种思路的扩充,大模型不再是

    2024年02月09日
    浏览(75)
  • 支撑开源LLM大模型的私有化部署,需要单机多个不同型号GPU混合使用的同学看过来

    有2台深度学习的工作站,分别有2张3090和2张4090,Qwen-14B-Chat轻松跑起,知识库检索等应用效果还可以,想提升到Qwen-72B-int4(官方要求最低48G显存),于是把4张卡集中到同一台机器(多级多卡也是可以的,但不是每个框架都支持分布式GPU),过程中遇到一些坑,度娘无混卡的

    2024年02月01日
    浏览(56)
  • Chatgpt私有化部署(全流程)

      当下使用chatgpt来帮助完成工作已然成为主流,但想访问必须先面对地区的封锁,所以使用openai官方提供的API来部署至本地服务器从而更加便利的使用chatgpt。本文章主要介绍如何部署私有聊天机器人。 公网服务器一台(可选阿里云、腾讯云等) openai账号,用于获取私人的

    2023年04月20日
    浏览(119)
  • 安装Joplin Server私有化部署(docker)

    前言: 老规矩官方文档链接 1. 首先拥有一个自己的云服务器(如果没有外网访问需求的话就随意吧) 安装docker安装方式 这里Joplin是使用PostgreSQL数据库的形式, 如果没有PostgreSQL库的话, Joplin默认使用的是SQLLite数据库 我这里使用的是docker-compose部署用的是官网的demo.yml所以就直接也

    2024年02月21日
    浏览(63)
  • Sealos 云操作系统私有化部署教程

    Sealos 私有云已经正式发布了,它为企业用云提供了一种革命性的新方案。Sealos 的核心优势在于,它允许企业 在自己的机房中一键构建一个功能与 Sealos 公有云完全相同的私有云 。这意味着企业可以在自己的控制和安全范围内,享受到公有云所提供的灵活性和扩展性。这对于

    2024年02月05日
    浏览(70)
  • 可私有化部署的车牌识别API接口

    车牌OCR识别 的出现为企业提供了一种高效、准确的车牌识别和信息提取解决方案。通过图像预处理、区域定位、字符分割和字符识别等步骤,将获取的车牌图片或视频中的车牌信息瞬时输出,可提供车牌识别API接口做二次开发,该 API 能够自动识别车牌中的段信息,并

    2024年02月11日
    浏览(60)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包