Linux系统中已知SRR号如何从NCBI上下载SRA数据到服务器中

这篇具有很好参考价值的文章主要介绍了Linux系统中已知SRR号如何从NCBI上下载SRA数据到服务器中。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

       高通量组学数据目前已经成为生物研究的重要板块,对于一些文章中出现的数据的挖掘尤其是人体数据的再利用也成为探究科学问题的重要前沿组成。通常情况下文章的高通量数据需要上传到NCBI的SRA(Sequence Read Archive)供大家下载学习,而我们也可以通过多种方法对数据进行下载再挖掘。在此介绍一种下载NCBI SRA数据的最佳方法。 

        首先,我们在下面的网址中进入SRA Toolkit下载的官网。Downloading SRA Toolkit · ncbi/sra-tools Wiki · GitHub https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit

       其次选择点击"CentOS Linux 64 bit architecture"下载Linux版本的软件压缩包。

怎么批量下载sra数据,linux

       将压缩包下载完成以后,通过Xshell上传到服务器的指定文件夹,我个人一般喜欢建一个software的文件夹用于安装各类软件工具。

怎么批量下载sra数据,linux

       通过“tar -zxvf ”指令对压缩包进行解压。

tar -zxvf sratoolkit.3.0.6-centos_linux64.tar.gz

       然后在PATH中加入fastq-dump命令,此时需要编辑Shell配置文件(例如bash的配置文件为~/.bashrc或~/.bash_profile),例如,在bash中使用以下命令打开~/.bashrc:

vi ~/.bashrc

       在配置文件中添加以下行,将sra-toolkit的bin目录路径加入到PATH中:

export PATH=$PATH:/home/Guo_Jian/software/sratoolkit/sratoolkit.3.0.6-centos_linux64/bin

        按“Esc”再“:wq”保存文件并关闭编辑器。然后为使修改生效,可以重新启动终端,或者在当前终端中运行以下命令:

source ~/.bashrc

       最后可以尝试在终端中运行fastq-dump命令,看看是否成功启动。如果成功,将显示fastq-dump的帮助信息。如果仍然出现问题,请再次检查PATH设置是否正确,并确保在PATH中包含了sra-toolkit的bin目录。如下所示即为安装成功,随后我们便可以开始数据的下载了。

怎么批量下载sra数据,linux

       我们在NCBI上找到我们需要的数据的SRA Run Selector界面,点击"Accession List "获得我们所需要的下载的SRR序号List,其文件命名通用为“SRR_Acc_List .txt”:

怎么批量下载sra数据,linux

怎么批量下载sra数据,linux​        可使用如下命令在后台进行批量下载:

nohup prefetch -O . $(<SRR_Acc_List.txt) &

        下载结束后,可使用如下命令进行批量解压:

for f in *.sra
do
nohup fastq-dump --split-3 $f &
done

         如此,数据下载和转换就完成了。文章来源地址https://www.toymoban.com/news/detail-763624.html

到了这里,关于Linux系统中已知SRR号如何从NCBI上下载SRA数据到服务器中的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Linux系统如何查看服务器带宽及网络使用情况?

    要查看Linux服务器的带宽和网络使用情况,可以使用以下命令和工具: ifconfig命令:ifconfig命令用于显示和配置网络接口信息,包括带宽和网络使用情况。 使用以下命令查看所有网络接口的信息: 该命令将显示每个网络接口的详细信息,包括接收和发送的数据包数量以及网络

    2024年02月16日
    浏览(49)
  • Linux系统下如何查看服务器的带宽和网络使用情况

    要在Linux系统下查看服务器的带宽和网络使用情况,可以使用一些命令行工具和系统工具来获取相关信息。下面将介绍几种常用的方法。 使用ifconfig命令 ifconfig命令可以用来查看网络接口的配置和状态信息,包括接口的IP地址、MAC地址、传输速率等。要查看服务器的带宽和网络

    2024年02月08日
    浏览(62)
  • Linux如何在Ubuntu系统服务器上安装 Jenkins?【详细教程】

    1. 更新 Ubuntu 软件包列表 ``` sudo apt-get update ``` 2. 安装 Java 运行环境 ``` sudo apt-get install openjdk-8-jdk ``` 3. 导入 Jenkins GPG 密钥 ``` wget -q -O - https://pkg.jenkins.io/debian-stable/jenkins.io.key | sudo apt-key add - ``` 4. 添加 Jenkins 软件包仓库 ``` sudo sh -c \\\'echo deb https://pkg.jenkins.io/debian-stable binary/ /

    2023年04月09日
    浏览(57)
  • linux系统下如何使用nginx作为高性能web服务器

    ✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN新星创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开

    2024年04月14日
    浏览(47)
  • 在 Linux 系统上下载 Android SDK

    使用ubuntu系统进行车机开发,今天开始配置环境,首先是下载android studio,然后下载android sdk,这里需要注意的是linux系统不能使用windows系统下的Android sdk,亲测会出现各种问题。 常规思路,下载sdk,安装之后修改环境。打开官网已经没有了sdk各个版本的下载资源 现在可以通

    2024年02月13日
    浏览(48)
  • SQLServerException: 服务器主体 “dwCDC“ 无法在当前安全上下文下访问数据库 “dw“

    在Debezium使用过程中,有时候会遇到各种各样的错误和异常。其中之一是\\\"SQLServerException: 服务器主体 ‘dwCDC’ 无法在当前安全上下文下访问数据库 ‘dw’\\\"。本文将详细介绍这个错误的原因和解决方法,并提供相应的源代码示例。 这个错误通常发生在使用Debezium连接到SQL Serv

    2024年02月03日
    浏览(45)
  • 如何使用FinalShell远程连接工具优雅的远程连接Linux操作系统的服务器

            随着互联网的发展,越来越多的人需要远程访问和管理远程服务器或计算机。远程连接工具应运而生,以满足人们的远程访问需求。远程连接工具可以让用户远程登录到其他计算机或服务器,并执行各种操作,而无需身处物理位置。这极大地便利了用户,节省了时

    2024年02月03日
    浏览(67)
  • 如何将linux数据从一个服务器复制到另外一个服务器

    首先先要确定两台服务器之间可以通讯 可以使用ping 服务器的地址查看是否通信 然后使用下面的步骤进行通讯 可以使用scp命令来在Linux系统中将文件或目录从一台服务器复制到另一台服务器。 语法为:scp [选项] 源路径 目标地址 其中,[选项]包括但不限于: 命令参数: 示例

    2024年01月19日
    浏览(46)
  • Linux系统管理、服务器设置、安全、云数据中心

    前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家 :https://www.captainbed.cn/z chatgpt体验地址 本文以服务器最常用的CentOS为例 解释每个字符的含义如下: [:表示命令行提示符的开始。 root:表示当前用户为root用户。 @:表示分隔符,用于

    2024年02月04日
    浏览(54)
  • 服务器数据恢复-reiserfs文件系统损坏如何恢复数据?

    服务器数据恢复环境: 一台IBM X系列服务器,4块SAS硬盘组建一组RAID5阵列,采用的reiserfs文件系统。服务器操作系统分区结构:boot分区+LVM卷+swap分区(按照前后顺序)。LVM卷中直接划分了一个reiserfs文件系统,作为根分区。   服务器故障: 服务器在运行过程中由于未知原因瘫

    2024年02月10日
    浏览(48)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包