AI领域常用大模型地址及下载方法(持续更新)

这篇具有很好参考价值的文章主要介绍了AI领域常用大模型地址及下载方法(持续更新)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、计划

现在大模型比较多,平时需要调试对比,就把这些大模型简单一个收集。
不断收集,不断学习
目前,开原模型较多,一些能力弱的,没啥意义

基座模型通常指的是一个通用的、预先训练好的语言模型,如GPT-3.5。这种模型在各种自然语言处理任务中表现出色,可以用作其他更具体任务的基础。对话模型则是专门针对对话系统设计的模型,用于理解和生成对话。这些模型通常会在大规模对话数据上进行预训练,以便更好地理解和生成自然对话。

在实际场景中,通常会使用基座模型进行微调,以适应特定的任务或领域。基座模型已经在大规模的通用语言数据上进行了预训练,因此可以作为一个良好的起点,然后通过微调来使其适应特定的应用场景。

对话模型通常已经在对话数据上进行了预训练,因此在构建对话系统或进行对话相关的任务时,可以使用对话模型进行微调,以使其更好地理解和生成自然对话。

无论是使用基座模型还是对话模型进行微调,都需要根据具体的应用场景和任务需求来选择合适的模型,并进行相应的微调工作

二、模块划分

github大模型汇总项目

目前主流大模型汇总
简介:整理开源的中文大语言模型,以规模缩小、可试点化部署、成本降低的模型为主,包括基础模型、垂直领域调整及应用、数据集与等教程。

1. nlp领域

(1). ChatGLM-6B

  1. ChatGLM-6B
  2. ChatGLM2-6B
  3. GLM2-6b 的第三方下载地址
  4. GLM2-6b int4 第三方下载
  5. GLM2-6b-32k 第三方下载
  6. GLM2-6b-32k-int4 下载
  7. GLM-6b 的第三方下载地址
  8. GLM-6b-int8 的第三方下载地址
  9. GLM-6b-int4 的第三方下载地址

ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B 引入了如下新特性:

GLM 多卡部署

(2). LLaMA

mata官方地址
Chinese-LLaMA-Alpaca

Chinese-Llama-2系列-三方下载
Atom-7B-Chat-三方下载
Chinese-7b-Chat-三方下载
Llama2-Chinese-13b-Chat-三方下载
Llama2-Chinese-13b-Chat-4bit

本项目开源了中文LLaMA模型和指令精调的Alpaca大模型,以进一步促进大模型在中文NLP社区的开放研究。这些模型在原版LLaMA的基础上扩充了中文词表并使用了中文数据进行二次预训练,进一步提升了中文基础语义理解能力。同时,中文Alpaca模型进一步使用了中文指令数据进行精调,显著提升了模型对指令的理解和执行能力。

LLMA 安装部署

(3). Mistral 7B

号称:目前为止最好的 7B 模型
Mistral 7B

(4).Mistral-8x7B

性能超越 Llama2-65B
A微调Mistral-8x7B

(5)BAAI/bge-reranker-base

特征向量提取器,特别是在向量检索,相似度匹配等领域的表现,目前是最先进的模型
BAAI/bge-reranker-base
github网址

2. 知识图谱

(1.)信息抽取

  1. 通用信息抽取 UIE(Universal Information Extraction)
    UIE(Universal Information Extraction):Yaojie Lu等人在ACL-2022中提出了通用信息抽取统一框架UIE。该框架实现了实体抽取关系抽取事件抽取情感分析等任务的统一建模,并使得不同任务间具备良好的迁移和泛化能力。为了方便大家使用UIE的强大能力,PaddleNLP借鉴该论文的方法,基于ERNIE 3.0知识增强预训练模型,训练并开源了首个中文通用信息抽取模型UIE。该模型可以支持不限定行业领域和抽取目标的关键信息抽取,实现零样本快速冷启动,并具备优秀的小样本微调能力,快速适配特定的抽取目标。
  2. 开放域文本理解大模型
    SeqGPT是一个不限领域的文本理解大模型。无需训练,即可完成实体识别文本分类阅读理解等多种任务。该模型基于Bloomz在数以百计的任务数据上进行指令微调获得。模型可以在低至16G显存的显卡上免费使用。
    github地址

(2.)实体识别关系抽取数据集

多领域数据集

(3.)一些较为完成的图谱项目

项目地址

(4.)阿里藏经阁

藏经阁
在商业知识图谱数据开放基础之上,我们还开放了部分知识图谱技术平台能力,开源了若干知识图谱构建、融合、推理和应用工具,以促进知识图谱技术社区的发展。

  1. DeepKE
    DeepKE 是一个支持低资源、长篇章的知识图谱抽取工具,用户可以定制输入的数据集和模型实现命名实体识别、关系抽取、属性抽取等知识图谱构建功能。

  2. NeuralKG
    是一个通用的知识图谱神经网络表示学习工具,其包含常用的知识图谱嵌入模型、基于图神经网络的图谱推理模型,以及多个规则增强推理模型

  3. OpenUE
    OpenUE是一个轻量级知识图谱抽取工具,其实现了在一个统一通用的框架下实现实体关系、事件识别、以及槽位和意图抽取等多种知识图谱构建任务。

  4. PromptKG
    PromptKGC(Incoming)是一个基于Pretrain-Prompt-Fitune预训练范式的知识图谱抽取和补全工具,支持文本生成等多种应用和任务。

  5. FastKGE
    是一个轻量级知识图谱表示学习框架,其通过知识图谱蒸馏等方法,实现快速、高效的实体向量学习,可支持知识图谱模型的快速部署,以及在移动、边缘设备应用部署。

(5.)构建知识图谱大模型 东北大学

构建知识图谱大模型

TechGPT是“东北大学知识图谱研究组”发布的垂直领域大语言模型。目前在HuggingFace🤗: TechGPT-7Bneukg/TechGPT-7B开源了全量微调的7B版本。
TechGPT主要强化了如下三类任务:

以“知识图谱构建”为核心的关系三元组抽取等各类信息抽取任务
以“阅读理解”为核心的各类智能问答任务。
以“文本理解”为核心的关键词生成等各类序列生成任务。
摘要缩写,标题扩写

3. 语音识别

(1).Whisper

是一个通用的语音识别模型,可以执行多语言语音识别、语音翻译和语音识别
Whisper

4. 文本生成3D

(1). Shap-E

以文本或者图像为基础生成3D

Shap-E

5. 本地知识库相关

5.1 Langchain-Chatchat(原Langchain-ChatGLM)基于 Langchain 与 ChatGLM 等语言模型的本地知识库问答

本地知识库问答

6. 图像领域

6.1 一键换装

模特一件换装

5.2 ChatYuan-large-v2 大语言模型进行基于知识库的问答

ChatYuan-large-v2 大语言模型进行基于知识库的问答
nlp_bert_document-segmentation_chinese-base 语义分割模型对文本进行拆分
text2vec-large-chinese 模型 对文本向量化
faiss进行向量检索
langchain 进行各个模块的组合,并完成基于知识库的问答
项目结构

大语言模型进行基于知识库的问答

二、模型下载的常见方法

因为大模型动辄十几GB的大小,因为对于开发人员来说,环境搭好了,模型还要好几个小时。

模型下载的四种方式:

1、Hugging http://face.cn上手动下载模型及其文件,

因为国内对该网站不开放,需挂vpn下载,因为外网下载,所以速度依赖于你的外网网速

下载地址

2、阿里的modelscope上下载,

无需vpn,如果你的网速还行,建议这种方式,首先需要安装modelscope:pip install modelscope

# 从modelscope上下载模型
from modelscope.hub.snapshot_download import snapshot_download
model_dir = snapshot_download('baichuan-inc/baichuan-7B', cache_dir='./model', revision='master')
如果你网速很好,下载就很快,如果是kb/s,那么大文件下载会失败。

3、huggingface的镜像网站aliendao网站下载,

无需vpn,非开发者需手动下载互链高科 (非开发者或者怕麻烦可以直接去网站手动下载)

开发者在aliendao的下载器上下载 下载地址

# 开发者可以直接看这里,这里的操作是在你已经有了一个python3.7以上的环境下,可以直接下述操作
# 如果你没有的话,移步 https://github.com/git-cloner/aliendao
git clone https://github.com/git-cloner/aliendao
cd aliendao
pip install -r requirements.txt -i https://pypi.mirrors.ustc.edu.cn/simple --trusted-host=pypi.mirrors.ustc.edu.cn


# 带上mirror参数,优先从aliendao.cn镜像下载
python model_download.py --mirror --repo_id baichuan-inc/Baichuan2-13B-Chat-4bits
让公司的运维测了,aliendao的带宽很慢,即便你的网速很快,速度也非常一般,而且这个网站模型不全。

4、huggingface的镜像网站

镜像网址

网速很快,公司运维有测到4M/s,非常推荐用这个网站直接下载

备注:huggingface的镜像网站下载llama2系列模型如何加认证的信息
huggingface access token 就可以下载,wget --header="Authorization: Bearer <hf_token>" url ,如果是git clone,则提示输密码时输入access token文章来源地址https://www.toymoban.com/news/detail-770321.html

到了这里,关于AI领域常用大模型地址及下载方法(持续更新)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • java8 Stream流常用方法(持续更新中...)

    操作对象 模拟数据 操作 打印结果 打印结果 注意:异常自己捕捉,就比如这里String转Intger就可能出现NumberFormatException异常 打印结果 打印结果 断点查看 打印结果 断点查看 持续更新中…

    2024年04月28日
    浏览(51)
  • PyQt5常用控件大全(详尽方法 + 实例操作,持续更新中…)

    1.1 简介         标签控件主要用于显示用户不能编辑的文本,标识窗体上的对象(例如:给文本框、列表框添加,描述信息等)。它对应PyQt5中的QLabel类,Label控件在本质上是QLabel类的一个对象。         在Qt Designer设计器中,它的图标如下图所示: 1.2 设置标签文本

    2024年02月02日
    浏览(46)
  • 解决GitHub下载速度太慢问题的方法汇总(持续更新,建议收藏)

    Github上下载仓库或者克隆仓库,速度基本稳定在 20k 以下,当克隆一些大的仓库时,以这乌龟速度,很容易出现克隆超时的错误,等了几十分钟的下载一夜回到解放前,那种感觉我猜各位或多或少都经历过。本博客汇总了几种亲测可用的方案,很大地提升下载速度,一个大的

    2024年02月07日
    浏览(43)
  • 【持续更新】汇总了一份前端领域必看面试题

      有时候一些其他领域的小伙伴,会私信问一些非博主领域相关触及知识盲区的问题,什么C++,C#,大前端… 其中有很多朋友问面试相关的,我之前的文章内有一篇关于Python领域面经汇总的置顶文章,那篇文章在我有空的时候,有价值的问题也会持续更新收录进去,感兴趣

    2024年02月05日
    浏览(30)
  • 电气领域相关数据(目标检测,分类图像数据及负荷预测,持续更新)

    可下载版,持续更新 1. 电力设备红外图像与可见光图像配准数据集(103对图像,绝缘套管)    下载地址:电力设备红外图像与可见光图像配准数据集(103对图像) 2.变电站红外图像数据集(电压电流互感器,VOC标签,889张) 下载地址: 变电站红外图像数据集(电压电流

    2024年02月07日
    浏览(39)
  • AI绘画——本地配置webui启动器教程,支持一键启动/修复/更新/模型下载管理+Lora模型推荐

    秋葉aaaki的个人空间_哔哩哔哩_bilibili https://space.bilibili.com/12566101/?spm_id_from=333.999.0.0 感谢 秋葉aaaki大佬の免费开源 目录 1.获取资源整合包 2. 下载并配置webui启动器  3.启动器功能  4.一键启动,开始实战 5.效果演示  露出鸡脚哩  幻想景色加上lora模型xiaorenshu  刘亦菲图生图

    2024年02月03日
    浏览(47)
  • 汇编常用指令(持续更新)

    逻辑与指令: and dest,src将目标与源做与操作 or dest,src将目标与源做或操作 add 加得数的值超出范围即会溢出 inc 汇编语言中的自增指令,相当于++ div指令 不会给出被除数 切记提前在默认的寄存器中设置好被除数,且默认寄存器不做别的用处 dup设置内存空间,与db、dw、dd等数

    2024年02月05日
    浏览(32)
  • Armbian常用命令(持续更新)

    1、更新内核的命令: 2、图形化配置界面 3、创建虚拟内存 4、安装常用软件 5、docker相关命令 6、挂载U盘 磁盘设备命名一般规则: 在Linux中,设备名称通常都保存在/dev里,/dev下的文件是特殊的设备文件,和特定的驱动程序相关联。而这些设备的命名有一定的规则,可以使用“

    2024年03月15日
    浏览(52)
  • 常用的一些蓝图(持续更新)

    Apply Damage Apply Damage : 对指定的actor应用伤害。 Add Mapping Context Add Mapping Context : 添加控制映射上下文。 Add Movement Input Add Movement Input :沿着给定的由 ScaleValue 改变大小后的世界方向向量(通常是标准化的)添加移动输入。 Add Actor World Rotation Add Actor World Rotation : Bind Event to On Rea

    2024年02月15日
    浏览(29)
  • python常用函数(持续更新)

    abs是 absolute 的缩写,它会返回数字的绝对值。 any()函数用于判断给定的可迭代参数是否全部为False。如全为False则返回False;如有一个为True,则返回True。 eval()函数用来执行一个字符串表达式,并返回表达式的值。其语法格式如下图所示: python2.5版本之前,我们使用的是老式

    2024年02月07日
    浏览(34)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包