PrimiHub 联邦学习大模型开源,打破数据限制,保护数据隐私安全

这篇具有很好参考价值的文章主要介绍了PrimiHub 联邦学习大模型开源,打破数据限制,保护数据隐私安全。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

ChatGPT 掀起的大模型热潮,让各界人士对人工智能大模型的关注度极速提高。

什么是大模型?大模型是指具有大量参数的深度神经网络模型,它们通常可以提供更强大的表达能力和泛化能力,从而提升各种智能服务的性能和质量。大模型在训练的过程中,会面临一个重大挑战:如何获取更多的数据进行训练以及如何保护训练数据的数据隐私?

联邦学习是一种分布式的机器学习范式,能够在保护各自数据隐私的同时,有效地利用用户设备上的海量数据,为大模型提供更丰富和更多样的训练数据。其核心过程是参数的传递,即参与者将自己设备上训练得到的模型参数发送给中心服务器,中心服务器将所有参与者的参数进行聚合和平均,然后将更新后的参数返回给参与者,以此循环进行模型的训练和更新,以实现在保护用户数据隐私和安全的前提下,完成大模型的分布式训练和更新,提高了大模型的训练效率和可持续性。

原语科技开源 PrimiHub 联邦学习大模型

基于此,今日,原语科技在 PrimiHub 上开源了联邦学习大模型,实现了基于联邦学习的大模型训练和预测,它允许多个参与者在保护各自数据隐私的同时,共同训练一个大型的深度神经网络模型。 PrimiHub 联邦学习大模型是一个多模态、多任务、多领域的联邦预训练模型,它可以理解和生成文本,并支持多种语言和场景,并且可以应用于搜索、推荐、对话、翻译、摘要、创作等多个领域,为用户提供更丰富、更精准、更个性化的内容和服务。

PrimiHub 联邦学习大模型是基于 ChatGLM6B,实现了在 PrimiHub 框架中的联邦大模型。ChatGLM6B 是一个多模态、多任务、多领域的预训练模型,它可以理解和生成文本、图像、音频、视频等各种类型的数据,并支持多种语言和场景。PrimiHub 可以让用户在自己的设备上参与联邦学习,保护数据隐私和安全,同时享受大模型带来的智能服务。

通过下方链接即可直接体验:

  • 项目地址:https://github.com/primihub/primihub

  • 使用指引:https://docs.primihub.com/docs/advance-usage/create-tasks/fedreated-learning/chatglm/

PrimiHub 联邦学习大模型技术亮点

  1. PrimiHub 联邦学习大模型基于 ChatGLM6B,其参数量多,效果好。它具有超过60亿个参数,是目前最大的中文预训练模型之一,也是目前最先进的多模态预训练模型之一,在各种自然语言处理、计算机视觉、语音识别等任务上都取得了优异的性能和质量,为用户提供了更丰富、更精准、更个性化的内容和服务。

  2. 通过 Ptuning 技术,实现通过调整一部分权重,来实现和调整全部参数一样效果的模型调参,降低了联邦学习的计算和资源开销。Ptuning 是一种新颖的模型微调技术,它可以在保持大部分参数固定的情况下,通过调整一小部分参数(如1%),来实现和调整全部参数一样效果的模型优化,从而显著降低了模型训练和更新所需的通信和计算资源。让用户能够在消费级的显卡就能体验联邦大模型的流程。PrimiHub 联邦学习大模型可以让用户在消费级的显卡(如NVIDIA GeForce RTX 3070)上轻松地进行联邦学习,无需高端的服务器或云平台,降低了用户参与联邦学习的门槛和成本。

  3. 基于新的 PrimiHub SDK,仅需一行命令,即可实现基于联邦学习的大模型的训练。使用户能够简单上手。PrimiHub SDK 是一个开源的、易用的、高效的联邦学习软件开发工具包。它可以让用户在自己的设备上参与联邦学习,保护数据隐私和安全,同时享受大模型带来的智能服务,只需要用户输入一行命令,就可以自动完成大模型在联邦学习中的分布式训练和更新,无需复杂的配置和编程,提高了用户参与联邦学习的便利性和体验。

PrimiHub 联邦学习大模型具体训练参数:

  • 场景:横向联邦场景

  • 任务数据:Chinese MedDialog Dataset(医疗文本问答,110w)、ADGEN 数据集(服装标签分类,11w)

  • 参数方:两个参与建模方,一个聚合服务方

  • 环境:3070 8GB x 2

  • 模型参数量:60亿 (6b, 6000M)

未来我们还想做什么?

PrimiHub 联邦大模型也会持续进行迭代。未来 PrimiHub 开源社区还将针对 PrimiHub 联邦大模型在模型种类上进行持续迭代,提供在线大模型服务等降低大模型的使用门槛。

随着数字化发展,医疗数据的流通,一方面可以推动智慧诊疗、新药研发等产业的发展,另一方面也可以促进现代化医学研究、公共卫生防疫以及临床医疗应用等生物科学技术的一些进步。但是医疗数据又具有极强的隐私属性,对隐私保护和数据安全的需求更为强烈。通过联邦学习大模型与医疗行业数据结合,能够在保证数据充分流通的同时不泄露用户隐私、合规合法地使用数据以推动数字医疗的发展。

在金融行业中,数据同样重要,其作为数字化风控的“血液”,但随着银行对数据共享的需求不断增加及监管对数据安全和隐私保护的严格要求,大大增加了其与外部机构之间数据共享的技术难度和成本。通过联邦学习大模型与金融数据的结合,则能在满足安全性的前提下,打破“孤岛效应”,通过数据资源的有效开发利用,实现风险的全面准确评估,从而推动业务快速发展。

未来,PrimiHub 联邦学习大模型也将在金融、医疗、互联网等多个行业深度结合带来行业数字化新形态,同时,基于 GPT+隐私计算的私人助理也有巨大想象空间。通过隐私计算则可实现敏感数据价值的可控使用,这将成为特定领域大模型的必由之路。文章来源地址https://www.toymoban.com/news/detail-559429.html

到了这里,关于PrimiHub 联邦学习大模型开源,打破数据限制,保护数据隐私安全的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 隐私保护联邦学习之差分隐私原理

    什么是隐私 讲差分隐私前,说一下什么是隐私 其实隐私这个定义,各家有各家的说法,而且各人有各人不同的考量。目前普遍比较接受的是:“单个用户的某一些属性” 可以被看做是隐私。这个说法里所强调的是:单个用户。也就是说,如果是一群用户的某一些属性,那么

    2024年01月17日
    浏览(29)
  • Android14实战:打破音频默认重采样的限制(五十二)

    简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏: Audio工程师进阶系列 【 原创干货持续更新中…… 】🚀 优质专栏: 多媒体系统工程师系列 【 原创干货持续更新中…… 】🚀 人生格言: 人生从来没有捷径

    2024年01月20日
    浏览(33)
  • 微信公众号模板消息源码实现,打破服务号群发推送次数限制

    公众号服务号每个月只能群发推送四次文章,我们可以使用模板消息为公众号粉丝推送信息 下面是使用golang实现的模板消息发送类库封装,轻松实现模板消息发送 wechat.go 我们的使用方式 推送的效果如图所示,点击模板就能跳转到我们自定义的url上 我在自己客服系统中也是

    2024年02月15日
    浏览(43)
  • 解密JavaScript的异步机制:打破单线程限制,提升性能与用户体验

     🎬 江城开朗的豌豆 :个人主页  🔥 个人专栏  :《 VUE 》 《 javaScript 》  📝  个人网站  :《 江城开朗的豌豆🫛 》  ⛺️ 生活的理想,就是为了理想的生活 !   目录 一、JavaScript的异步编步机制 二、事件循环(Event Loop)和任务队列(Task Queue) 三、宏任务和微任务

    2024年02月08日
    浏览(33)
  • 大模型的数据隐私问题有解了,浙江大学提出联邦大语言模型

    作者 | 小戏、Python 理想化的 Learning 的理论方法作用于现实世界总会面临着诸多挑战,从模型部署到模型压缩,从数据的可获取性到数据的隐私问题。 而面对着公共领域数据的稀缺性以及私有领域的数据隐私问题,联邦学习(Federated Learning)作为一种分布式的机器学习框架吸

    2024年02月13日
    浏览(28)
  • AnyGo for Mac最新激活版:位置模拟软件打破地域限制

    AnyGo for Mac,一款专为Mac用户打造的位置模拟软件,让您能够轻松打破地域限制,畅享无限可能。 软件下载:AnyGo for Mac v7.0.0最新激活版 通过AnyGo,您可以随时随地模拟出任何地理位置,无论是国内热门景点还是国外异域风情,都能一键实现。无需担心实际位置的限制,AnyGo让

    2024年04月14日
    浏览(26)
  • 数据聚合和联邦学习,常见的聚合有三类

    目录 数据聚合和联邦学习 数据仓库方法 常见的聚合有三类:

    2024年02月07日
    浏览(31)
  • 华锐视点为广汽集团打造VR汽车在线展厅,打破地域限制,尽享购车乐趣

    随着科技的飞速发展,我们正在进入一个全新的时代——元宇宙时代。元宇宙是一个虚拟的世界,它不仅能够模拟现实世界,还能够创造出现实世界无法实现的事物。而汽车行业作为人类生活的重要组成部分,也在积极探索与元宇宙的融合,以开启新的未来。 华锐视点 为 广

    2024年01月19日
    浏览(36)
  • 打破限制,随时随地练习K8S!在线Kubernetes平台开启你的技术之旅!

    是不是有很多小伙伴想学习k8s,但是又没有机器去练习。使用自己的笔记本电脑或者主机只能搭建单机版本的k8s来练习。 现在福利来了,给大家介绍一个在线多节点k8s练习平台:Play with Kubernetes。 Play with Kubernetes 一个提供了在浏览器中使用免费 CentOS Linux 虚拟机的体验平台,

    2024年04月14日
    浏览(36)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包