100% RNN language model ChatRWKV 相关开源项目

这篇具有很好参考价值的文章主要介绍了100% RNN language model ChatRWKV 相关开源项目。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

    RWKV(读作RwaKuv)借鉴了RNN的移动平均模型(MA),将transformer的 O ( T 2 d ) O(T^2d) O(T2d)复杂度降低到 O ( T d ) O(Td) O(Td),同时保持较好的结果表现。RWKV也是一个开源模型,甚至其介绍主页的html代码都有开源。以下为发现的与RWKV相关的开源项目,其中包括模型结构,任务扩展,微调训练,模型加速,服务化等几个部分。

模型结构

  • https://www.bilibili.com/video/BV1b8411Z7Df/?
  • http://export.arxiv.org/pdf/2305.13048
  • https://github.com/RWKV/RWKV-wiki
  • Trying to make the code in RWKV more easily understoodhttps://github.com/cooljoseph1/rwkv-simple
  • https://www.zhihu.com/question/602564718

100% RNN language model ChatRWKV 相关开源项目,深度学习,rnn,语言模型,人工智能

100% RNN language model ChatRWKV 相关开源项目,深度学习,rnn,语言模型,人工智能
100% RNN language model ChatRWKV 相关开源项目,深度学习,rnn,语言模型,人工智能
100% RNN language model ChatRWKV 相关开源项目,深度学习,rnn,语言模型,人工智能
100% RNN language model ChatRWKV 相关开源项目,深度学习,rnn,语言模型,人工智能

100% RNN language model ChatRWKV 相关开源项目,深度学习,rnn,语言模型,人工智能

  • 【群主】Bo 2023/3/1 16:52:48 RWKV pip package https://pypi.org/project/rwkv/ 做了 pip 包,大家可以直接 inference 了

  • 用150行python独立实现RWKV算法和文字生成,以及RWKV pip package https://zhuanlan.zhihu.com/p/610489720

数据集

  • https://huggingface.co/datasets/codeparrot/github-code

  • https://huggingface.co/datasets/allenai/c4

  • https://registry.opendata.aws/

  • https://www.luge.ai/#/

  • https://pile.eleuther.ai/

任务扩展

  • This is a project to train classification model using RWKV model from Huggingface transformers library https://github.com/yynil/RWKV-Classification
  • 使用 RWKV 预测股票调整后的收盘价https://github.com/tomer9080/Stock-Prediction-Using-RWKV
  • 植物花卉数据集[PlantFlower Datasets]基于RWKV大模型RWKV World模型数据集https://github.com/lovebull/PlantFlowerDatasets
  • 最佳开源AI作曲模型,基于RWKV,全部开源免费

微调训练包

  • 基于GO语言的深度学习框架的rwkv
    https://github.com/harrisonvanderbyl/godot-rwkv: The Godot Engine is a free, all-in-one, cross-platform game engine that makes it easy for you to create 2D and 3D games.

  • 将RWKV World/World-CHN系列模型由原生pth转为HF格式,并进行基于peft库的Lora增量微调+Alpaca全量微调https://github.com/StarRing2022/HF-For-RWKVWorld-LoraAlpaca

cpu 加速,手机加速,amd intel 卡加速,重写 cuda 加速

  • The CUDA version of the RWKV language model ( https://github.com/BlinkDL/RWKV-LM ) https://github.com/BlinkDL/RWKV-CUDA
  • https://github.com/npk48/rwkv_cuda
  • A torchless, c++ rwkv implementation using 8bit quantization, written in cuda/hip/vulkan for maximum compatibility and minimum dependencieshttps://github.com/harrisonvanderbyl/rwkv-cpp-accelerated
  • LLaMa/RWKV onnx models, quantization and testcase
  • https://github.com/harrisonvanderbyl/rwkv-cpp
  • INT4/INT5/INT8 and FP16 inference on CPU for RWKV language model
  • https://github.com/ZTMIDGO/RWKV-Android:使用Android cpu 运行 RWKV V4 ONNX
  • Run ONNX RWKV-v4 models with GPU acceleration using DirectML [Windows], or just on CPU [Windows AND Linux]; Limited to 430M model at this time because of .onnx 2GB file size limitation
  • https://github.com/tensorpro/tpu_rwkv
  • https://github.com/ZeldaHuang/rwkv-cpp-server

服务化

  • 使用Gradio制作的基于RWKV的角色扮演的webui
  • https://github.com/cgisky1980/ai00_rwkv_server
  • https://github.com/cgisky1980/ai00_rwkv_server

CG

  • Large-scale Self-supervised Pre-training Across Tasks, Languages, and Modalities

  • https://github.com/amazon-science/mm-cot 试试亚马逊的mm-cot

  • Meta 的大语言模型 LLaMA 最近引起了广泛关注,它的一大优势是参数规模更小但性能强于 OpenAI 的 GPT-3 模型,而且能运行在单张显卡上,让普通消费者的硬件也有可能提供类似 ChatGPT 性能的 AI 聊天机器人。LLaMA 是一组大语言模型的集合,其参数规模从 70 亿到 650 亿,它最新的 LLaMA-13B 模型有 130 亿个参数,不到 GPT-3 模型 1750 亿个参数的十分之一。现在 Nebuly AI 推出了首个基于人类反馈强化学习的 LLaMA AI 聊天机器人开源实现 ChatLLaMA。https://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/chatllama

  • https://view.inews.qq.com/k/20230117A03EVJ00

  • https://arxiv.org/abs/2302.14045

  • 链接:https://pan.baidu.com/s/1Jkc60TPzc4ArMN530NlZWg?pwd=c8lj
    提取码:c8lj
    –来自百度网盘超级会员V2的分享

  • https://www.bilibili.com/video/BV1m8411P7v7/

  • GPT-3 + RL 全流程训练开源整理:https://zhuanlan.zhihu.com/p/608705255?utm_id=0
    https://zhuanlan.zhihu.com/p/609003237?utm_id=0

  • Accelerating PyTorch with Intel® Extension for PyTorch*

  • https://github.com/karpathy/llama2.c

  • https://github.com/facebookresearch/llama文章来源地址https://www.toymoban.com/news/detail-613943.html

到了这里,关于100% RNN language model ChatRWKV 相关开源项目的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 深入理解深度学习——BERT派生模型:跨语言模型XLM(Cross-lingual Language Model)

    分类目录:《深入理解深度学习》总目录 BERT本应在语义理解上具有绝对优势,但其训练语料均为英语单语,受限于此,早期的BERT只在英语文本理解上有优势。随着全球化进程的加速,跨语言的预训练语言模型也具有非常重要的应用场景。为了探究BERT在跨语言场景中的性能,

    2024年02月10日
    浏览(51)
  • 一个开源的大型语言模型LLaMA论文简单解读,LLaMA: Open and Efficient Foundation Language Models

    返回论文和资料目录 LLaMA 是 Meta AI 发布的包含 7B、13B、33B 和 65B 四种参数规模的基础语言模型集合,LLaMA-13B 仅以 1/10 规模的参数在多数的 benchmarks 上性能优于 GPT-3(175B),LLaMA-65B 与业内最好的模型 Chinchilla-70B 和 PaLM-540B 比较也具有竞争力。开源的代码在github上可以很方便获得

    2024年02月09日
    浏览(47)
  • 扩散模型DDPM开源代码的剖析【对应公式与作者给的开源项目,diffusion model】

    论文地址:https://proceedings.neurips.cc/paper/2020/hash/4c5bcfec8584af0d967f1ab10179ca4b-Abstract.html 项目地址:

    2023年04月08日
    浏览(37)
  • 大数据相关开源项目及组件汇总

    花了一点时间,整理了大数据相关开源项目、组件和官网地址。按照实际应用功能的不同,分为以下10个部分,并在目录图中进行归纳,后续章节的内容则是分别介绍各组件的背景及应用场景。 调度与管理服务 文件系统 数据搜集 消息系统 内存技术 数据处理 查询引擎 分析和

    2024年02月07日
    浏览(36)
  • 语言模型(language model)

    语言模型是一种用于预测文本序列中下一个词或字符的概率分布的模型。它可以捕获语言结构的某些方面,如语法、句式和上下文信息。传统的语言模型通常使用N-gram方法或隐藏马尔可夫模型,但这些模型往往不能捕捉到长距离依赖和复杂的语义信息。 通俗来讲 语言模型评

    2024年02月11日
    浏览(37)
  • Backpack Language Models

    本文是LLM系列的文章,针对《Backpack Language Models》的翻译。 我们介绍了Backpacks:一种新的神经架构,它将强大的建模性能与可解释性和控制性的接口结合在一起。背包为词汇表中的每个单词学习多个非上下文意义向量,并将序列中的一个单词表示为该序列中意义向量的上下文

    2024年02月11日
    浏览(34)
  • rnn相关

    比之前多了一个圈 这个圈包含t时刻之前的数据特征,主要用在NLP自然语言处理中。 只用最后一个结果ht,前面的当做中间结果 会把之前看到的都记下来,但第n句话和第一句话之间联系不太大,没必要 考虑词的 前后顺序和相关性 构建词向量,不断向后滑动学习 cbow输入上下

    2024年01月22日
    浏览(38)
  • 嵌入式相关开源项目、库、资料------持续更新中

    学习初期最难找的就是找学习资料了,本贴精心汇总了一些嵌入式相关资源,包括但不限于编程语言、单片机、开源项目、物联网、操作系统、Linux、计算机等资源,并且在不断地更新中,致力于打造全网最全的嵌入式资料库。有好的嵌入式相关资源的朋友欢迎做贡献,利人

    2024年02月02日
    浏览(43)
  • 【NLP相关】开源中文NLP大模型及项目集合

    ❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️ 👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)👈 自然语言处理领域存在很多开源模型和项目,这也使得自然语言处理的相关

    2023年04月24日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包