git lfs使用(huggingface下载大模型文件)

这篇具有很好参考价值的文章主要介绍了git lfs使用(huggingface下载大模型文件)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一. git lfs使用(huggingface下载大模型文件)

Git LFS:(Large File Storage,解决git大文件存储问题)把音乐、图片、视频等指定的任意文件存在 Git 仓库之外,而在 Git 仓库中用一个占用空间 1KB 不到的文本指针来代替文件的存在,通过把大文件存储在 Git 仓库之外,可以减小 Git 仓库本身的体积,使克隆 Git 仓库的速度加快,也使得 Git 不会因为仓库中充满大文件而损失性能。

1. 安装

Linux安装步骤:

curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash
sudo apt-get install git-lfs
git lfs install

windows安装:

git lfs install

2. 下载HuggingFace文件

最近在看BLOOM,但是Huggingface的仓库里除了我想要的pytoch_model_xxxxx.bin,放了一些别的格式的checkpoints,全部下载的话太大了,而且很慢很慢

2.1 首先通过git下载小文件
git lfs install
GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/bigscience/bloom-7b1

需要注意,GIT_LFS_SKIP_SMUDGE=1和后面的git clone必须在同一行才能生效,表示不下载大文件(小文件、大文件的区分依据是有没有使用git lfs)。

此时git会下载所有的小文件,比如tokenizer.json ,但是对于git lfs存储的大文件,只会存储一个文本的pointer file.

2.2 手动pull需要的大文件

由于我只需要仓库里的pytorch_model-00001-of-00002.bin和pytorch_model-00002-of-00002.bin ,所以可以这样写:
注意:此处需要进入到下载的文件夹中:

cd bloom-7b1
git lfs pull --include="*.bin"

此时*.bin会匹配这两个文件,然后等着他下载完毕就可以了。

如果你只想要单个文件,写文件名就可以。

3. 另外一种方式:下载HuggingFace全部文件(包括大小文件)

命令:

git lfs install
git clone https://huggingface.co/bigscience/bloom-7b1

好像使用这个方式下载大文件没有什么进度(但是确实正在下载,只不过要等全部下载下来后,文件才能看到)

另外一种方式命令(大小文件的进度以及下载速度都能看到):

git lfs install
git lfs clone https://huggingface.co/bigscience/bloom-7b1

4. git lfs 下载中断了,继续下载的命令

git lfs fetch

参考:文章来源地址https://www.toymoban.com/news/detail-474043.html

# 1. 安装完成后,首先先初始化;如果有反馈,一般表示初始化成功
git lfs install# 2. 如果刚刚下载的那个项目没啥更改,重新下一遍,不算麻烦事(因为下载大文件,一般会比较慢)
git lfs clone https://github.com/AABBBCC/aaa.git
# 在下载的过程中,你也可以查看一下,你刚刚无法解析的那个pkl大文件,是不是在这个项目中,(进入项目目录)使用如下指令:
cd aaa
git lfs track
​
# 3. 如果不想重新下载整个项目,可以使用如下命令,单独下载需要使用lfs下载的大文件。
git lfs fetch
git lfs checkout
#(备选:git lfs pull),不建议

4. 参考链接

  1. 如何优雅的下载huggingface-transformers模型
  2. 如何从Huggingface仓库中选择性地下载文件 / Git LFS的pull --include用法
  3. git-lfs使用笔记
  4. 使用Git LFS使用下载Huggingface的预训练模型到本地
  5. git lfs:Github 中大文件被这样上传和下载
  6. git lfs:Github 中大文件被这样上传和下载

到了这里,关于git lfs使用(huggingface下载大模型文件)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【工程实践】使用git clone 批量下载huggingface模型文件

            经常需要下载模型到服务器,使用git clone方法可以快速实现模型下载。         以下载moka-ai/m3e-base为例,切换到Files and versions。         如上图所示,当前要下载模型网页的url为:         只需要将url中的/tree/main改为git即可,更改后的命令如下所示:      

    2024年02月08日
    浏览(59)
  • 使用Git LFS下载大文件到本地(Linux)

    很多时候我们想要从huggingface中下载模型文件,若直接clone往往下载不完全. 下载文件后可通过以下命令来查看该文件各个文件的大小   如下图,第一行total显示整个目录的文件大小,下面即为每个文件的大小 尤其是对于GB级文件而言,很多时候都无法完全clone,且由于直接git会不

    2024年02月07日
    浏览(33)
  • 【Git LFS】huggingface 断点续传

    这里有个很好的介绍:https://stackoverflow.com/questions/72610494/what-is-the-difference-between-git-lfs-fetch-git-lfs-fetch-all-and-git 提供的信息是关于如何作为普通用户使用Git LFS(Large File Storage),涵盖了各种Git LFS命令以及它们的解释。以下是关键要点的总结: git lfs fetch : 从指定的远程下载

    2024年02月02日
    浏览(25)
  • huggingface如何使用ssh命令,下载数据集或者模型 比如:git clone git@hf.co:openchat/openchat_8192

    今天抽空整理了一下笔记。 #linux服务器中,使用ssh下载huggingface模型或者数据集 1.访问huggingface个人主页(profile)里的settings https://huggingface.co/settings/profile 2.点击左侧:SSH AND GPG keys 先开始准备工作: 准备工作:https://huggingface.co/docs/hub/security-git-ssh#generating-a-new-ssh-keypair 准备

    2024年02月12日
    浏览(34)
  • 通过git clone批量下载huggingface模型和数据集

    想要下载huggingface的模型,却发现只能一个个文件下载非常不方便,又或者官方提供的api不好用或者下载不下来,这里提供一个通过git clone一次性下载整个数据集/模型下来的高效方法。 如果不使用代理clone非常慢,可以选择先配置git全局代理。在terminal中执行如下命令: 或在

    2024年02月11日
    浏览(73)
  • 如何用Git-LFS上传与下载大文件资源

    1.下载Git-LFS 2.安装到git目录下(根据你自己的git目录选择,若未安装git,先安装git) 2.1注册github完成访问网址,点击头像 点击个人简介即可进入进入个人主页  个人主页会显示仓库,点击右上角头像 2.2点击Your repositories 2.3点击NEW 2.4填写项目名称,描述,并添加README 点击创

    2024年04月22日
    浏览(26)
  • 上传、下载huggingface仓库文件(模型、数据等)

    例如,想要从huggingface hub下载llama-13b模型文件到本地: 可以用如下命令, local_dir 就是你想要下载到的本地文件夹: 上述命令等价于 git clone ,更多参数, 例如过滤、指定文件,建立符号链接等,详见官网教程: Download files from the Hub 想要上传文件,例如模型权重的话,首先得

    2024年02月12日
    浏览(83)
  • 如何下载github上用git-lfs工具下载的大文件

    要下载 GitHub 上使用 Git LFS 工具存储的大文件,您可以进行以下步骤: 安装 Git LFS:如果您的系统上没有安装 Git LFS,请先安装它。可以通过终端或命令行进行安装。 克隆存储库:使用以下命令克隆项目存储库到本地: 下载大文件:进入存储库目录,并使用以下命令下载大文

    2024年02月12日
    浏览(46)
  • [NLP]Huggingface模型/数据文件下载方法

    作为一名自然语言处理算法人员,hugging face开源的transformers包在日常的使用十分频繁。在使用过程中,每次使用新模型的时候都需要进行下载。如果训练用的服务器有网,那么可以通过调用from_pretrained方法直接下载模型。但是就本人的体验来看,这种方式尽管方便,但还是会

    2024年02月16日
    浏览(46)
  • Github上git lfs oid sha256文件无法下载的解决方案

    当我克隆Github上的一个库时,其中有一个包的内容格式如下: version https://git-lfs.github.com/spec/v1 oid sha256:一堆数字和字母 size 一堆数字 这堆东西类似百度网盘的下载链接和密码,并不是一个完整文件,只是一个链接。 使用Git lfs重新clone这个项目时,仍然没有解决这个问题,因

    2024年02月09日
    浏览(34)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包