ChatGPT 火了,一大批开源平替也来了

这篇具有很好参考价值的文章主要介绍了ChatGPT 火了,一大批开源平替也来了。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

ChatGPT 凭一己之力让全球为 AI 沸腾,引发了科技巨头之间的聊天机器人军备竞赛。
众所周知,ChatGPT 的背后技术是 GPT(Generative Pre-trained Transformer)模型。GPT 是一种基于 Transformer 模型的自然语言处理模型,由 OpenAI 公司开发。它可以通过学习大量的自然语言数据来生成自然流畅的文本,例如文章、对话等。
2019 年 11 月,OpenAI 开源了 GPT-2 语言模型的完整版本(有 15 亿个参数)。GPT-2 是作为 OpenAI 2018 年 GPT 模型的 "直接扩展" 而创建的,其参数和训练数据集的大小都增加了 10 倍。
在 GPT-2 之后,OpenAI 又推出了 1750 亿个参数的 GPT-3,只是其源代码从未被公开。OpenAI 认为 GPT-3 可能被滥用,因此不应开源。包括后来的 GPT-3.5、GPT-4 都没有开源。目前,公开免费版 ChatGPT 仍然基于 GPT-3.5,不过按月订阅 “ChatGPT Plus” 的用户能够试用由 GPT-4 提供支持的更新版本的 ChatGPT。
尽管 ChatGPT 没有开源,但趁着这波热度,还是有不少类似的开源项目出现,GitHub 已经有人做个了 替代 ChatGPT 的开源项目列表。

lucidrains/PaLM-rlhf-pytorch

这是一个类似于 ChatGPT 的模型,但使用的是 PaLM 架构。在 PaLM 架构之上实现了 RLHF(人类反馈强化学习)。

注:只有源代码,没有数据,没有模型权重,没有聊天系统。

togethercomputer/OpenChatKit

OpenChatKit 提供了一个强大的开源基础,可以为各种应用程序创建专用和通用聊天机器人。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。文章来源地址https://www.toymoban.com/news/detail-419566.html

oobabooga/text-generation-webui

它是一个用于运行 GPT-J 6B、OPT、GALACTICA、LLaMA 和 Pygmalion 等大型语言模型的 gradio web UI。其目标是成为文本生成领域的 AUTOMATIC1111/stable-diffusion-webui。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

KoboldAI/KoboldAI-Client

这是一个基于浏览器的前端,用于使用多个本地和远程 AI 模型进行 AI 辅助写作。它提供一系列标准工具,包括内存、作者笔记、世界信息、保存和加载、可调整的 AI 设置、格式化选项,以及导入现有 AI Dungeon 冒险的能力。您还可以打开冒险模式并像 AI Dungeon Unleashed 一样玩游戏。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

LAION-AI/Open-Assistant

OpenAssistant 是一个基于聊天的助手,可以理解任务,可以与第三方系统交互,并为此动态检索信息。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

tatsu-lab/stanford_alpaca

这是 Stanford Alpaca 项目的 repo,该项目旨在构建和共享指令遵循的 LLaMA 模型。

注:半开源、非真正开源、基于封闭模型等...

BlinkDL/ChatRWKV

ChatRWKV 类似于 ChatGPT,但由 RWKV(100% RNN)语言模型提供支持,并且是开源的。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

THUDM/ChatGLM-6B

ChatGLM-6B 是一个基于通用语言模型(GLM)框架的开放式双语语言模型,拥有 62 亿个参数。借助量化技术,用户可以在消费级显卡上进行本地部署(INT4 量化级别仅需 6GB GPU 显存)。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

bigscience-workshop/xmtf

此存储库概述了用于创建 BLOOMZ & mT0 和 xP3 的所有组件,这些组件在通过多任务微调进行跨语言泛化一文中介绍。

注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。

carperai/trlx

这是一个用于通过人类反馈(RLHF)进行语言模型分布式训练的代码库,用于微调 GPT 模型以生成聊天文本的工具,支持在线 RL 训练多达 20 亿个参数的模型,以及离线 RL 训练更大的模型。

注:注:只有源代码,没有数据,没有模型权重,没有聊天系统。

databrickslabs/dolly

该模型基于 pythia-12b 进行训练,使用了约 15,000 条指令 / 响应微调记录,这些记录是由 Databricks 员工在 InstructGPT 论文的能力领域中生成的 databricks-dolly-15k。

注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。

LianjiaTech/BELLE

本项目的目标是推动中文大型会话模型开源社区的发展。该项目在原有的 Stanford Alpaca 基础上优化了中文性能。模型微调仅使用通过 ChatGPT 生成的数据(没有其他数据)。此 repo 包含 175 个用于生成数据的中文种子任务、用于生成数据的代码、用于微调模型的 0.5M 生成数据等等。

注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。

ethanyanjiali/minChatGPT

这个示例演示了如何使用 RLHF 技术对齐语言模型,使其能够生成类似于 ChatGPT 的聊天文本。

注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。

cerebras/Cerebras-GPT

7 个开源 GPT-3 样式模型,参数范围从 1.11 亿到 130 亿,使用 Chinchilla 公式 训练。模型权重已在宽松许可下发布(特别是 Apache 2.0 许可)。

注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。

TavernAI/TavernAI

一款主题风格是冒险和探险的聊天机器人,默认 AI 语言模型是 Pygmalion,还包括其他语言模型,比如 KoboldAI、ChatGPT、GPT-4 等。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

Cohee1207/SillyTavern

SillyTavern 是 TavernAI 1.2.8 的一个分支,目前正在积极开发中,并添加了许多主要功能。现在,它们可以被视为完全独立的程序。Tavern 是一个用户界面,它需要与一个 AI 系统后端配合使用,才能发挥作用。有多种支持的后端可供选择,包括 OpenAPI API(GPT)、KoboldAI(可以在本地运行或在 Google Colab 上运行)等。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

ChatGPT 这阵风刮得这么猛,GOTC 2023 怎会错过?
5 月 27 日至 28 日,GOTC 2023 将在上海召开, AIGC (AI Generated Content,AI 生成内容) 将成为本次大会的重头戏。尤其是在 “AI is Everywhere” 分论坛上,诸多 AI 专家将深入探讨 AIGC 背后的技术。
ChatGPT 火了,一大批开源平替也来了
全球开源技术峰会(Global Open-source Technology Conference),简称 GOTC,是由开放原子开源基金会、 Linux 基金会亚太区、上海浦东软件园和开源中国联合发起的,面向全球开发者的一场盛大开源技术盛宴。 5 月 27 日至 28 日,GOTC 2023 将于上海举办为期 2 天的开源行业盛会。大会将以行业展览、主题发言、特别论坛、分论坛的形式展现,与会者将一起探讨元宇宙、3D 与游戏、eBPF、Web3.0、区块链等热门技术主题,以及开源社区、AIGC、汽车软件、开源商业化、开源教育培训、云原生等热门话题,探讨开源未来,助力开源发展。
GOTC 2023   报名通道现已开启,诚邀全球各技术领域开源爱好者共襄盛举!
参会报名,请访问:   https://www.bagevent.com/event/8387611

到了这里,关于ChatGPT 火了,一大批开源平替也来了的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • ChatGPT开源平替(2)llama

            最近,FacebookResearch 开源了他们最新的大语言模型 LLaMA,训练使用多达14,000 tokens 语料,包含不同大小参数量的模型 7B、13B 、30B、 65B,研究者可以根据自身算力配置进行选择。         经过测试,(1)在算力要求上, 7B的模型,需要19G显存要求 ,单卡

    2024年02月01日
    浏览(27)
  • ChatGPT开源平替(1)——ChatGLM

    ChatGLM-6B  由清华大学唐杰团队开发的是一个开源的、支持中英双语的对话语言模型,基于  General Language Model (GLM)  架构,具有 62 亿参数。结合模型量化技术,用户 可以在消费级的显卡上进行本地部署 (INT4 量化级别下最低只需 6GB 显存)。ChatGLM-6B 使用了和 ChatGPT 相

    2024年02月05日
    浏览(32)
  • 狂追ChatGPT:开源社区的“平替”热潮

    目前,不少优质的类ChatGPT模型都只能通过API接入,而一些开源LLM的效果与ChatGPT相比差距不小。不过,近期开源社区开始密集发力了。 其中,Meta的LLaMA模型泄漏是开源“ChatGPT”运动的代表性事件。基于LLaMA模型,开源社区近期接连发布了ChatLLaMa、Alpaca、Vicuna、Koala等模型,效

    2023年04月25日
    浏览(31)
  • ChatGPT/GPT4开源“平替”汇总

    寻找那些ChatGPT/GPT4开源“平替”们。 ChatGPT爆火出圈,国内很多高校、研究机构和企业都发出类似ChatGPT的发布计划。ChatGPT没有开源,复现难度极大,即使到现在GPT3的完全能力也没有任何一个单位或者企业进行了复现。刚刚,OpenAI又官宣发布了图文多模态的GPT4模型,能力相对

    2023年04月16日
    浏览(33)
  • 百度文心一言GPT免费入口也来了!!!

    文心一言入口地址:文心一言能力全面开放 文心一言是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。 文心一言的技术特色: 基于飞桨深度学习平台和文心知识增强大模

    2024年02月10日
    浏览(36)
  • 大批量数据导出csv,平替导出excel性能优化解决方案封装工具类

            有些业务逻辑需要在导出非常大量的数据,几百甚至几千万的数据这个时候再导出excel来对于性能都不是很友好,这个时候就需要替换实现思路来解决这个问题。         本文章提供了两种解决的方案,也是两种从数据库中拿取数据的方式一种是原生的jdbc一种是使用

    2024年01月16日
    浏览(43)
  • 微软提出AIGC新“玩法”,图灵奖得主Yoshua Bengio也来了!

    在AIGC取得举世瞩目成就的背后,基于大模型、多模态的研究范式也在不断地推陈出新。微软研究院作为这一研究领域的佼佼者,与图灵奖得主、深度学习三巨头之一的Yoshua Bengio一起提出了AIGC新范式——Regeneration Learning。这一新范式究竟会带来哪些创新变革?本文作者将带来

    2023年04月09日
    浏览(31)
  • ChatGPT全球最大开源平替OpenAssistant:基于Pythia和LLaMA微调而来

    论文地址:https://drive.google.com/file/d/10iR5hKwFqAKhL3umx8muOWSRm7hs5FqX/view 项目地址:https://github.com/LAION-AI/Open-Assistant 数据集地址:https://huggingface.co/datasets/OpenAssistant/oasst1 体验地址:https://open-assistant.io/chat 观看公告视频:https://youtu.be/ddG2fM9i4Kk OpenAssistant介绍 最近火爆的ChatGPT使用如

    2024年02月15日
    浏览(32)
  • 开发者笑疯了! LLaMa惊天泄露引爆ChatGPT平替狂潮,开源LLM领域变天

    来源: 新智源  微信号:AI-era Meta的LLaMA模型开源,让文本大模型迎来了Stable Diffustion时刻。谁都没想 谁能想到,一次意外的LLaMA泄漏,竟点燃了开源LLM领域最大的创新火花。 一系列表现出色的ChatGPT开源替代品——「羊驼家族」,随后眼花缭乱地登场。 开源和基于 API 的分发之

    2024年02月10日
    浏览(71)
  • 【Segment Anything】CV的大模型Segment Anything也来了,强人工智能的时代究竟还有多远?

    论文链接:https://arxiv.org/pdf/2304.02643.pdf 论文解读后续更新…… 官方文档:https://ai.facebook.com/blog/segment-anything-foundation-model-image-segmentation/ 项目地址:https://github.com/facebookresearch/segment-anything demo地址:https://segment-anything.com/demo 我自己上传了一张图片,结果还是挺好的(我上传

    2023年04月17日
    浏览(50)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包