生信步骤|原核生物基因组注释--Prokka

这篇具有很好参考价值的文章主要介绍了生信步骤|原核生物基因组注释--Prokka。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

全基因组注释是鉴定生物基因组特征的过程。Prokka是一个适用于原核生物基因组注释工具,可以注释细菌,古菌和病毒基因组。Prokka在预测基因组CDS区域时采用了多种数据库,内置的三个核心数据库包括ISfinder数据库,NCBI细菌抗性数据库和UniprotKB数据库。

此外,prokka内置基因CDS预测工具prodigal引用量较高,是目前十分可靠的原核生物基因组快速注释工具。其结果不仅能够注释出基因的位置,亦能够给出注释基因的功能信息。


1.软件安装

$ conda install -c bioconda prokka -y

2.运行Prokka开始预测

Prokka核心运行命令非常简单,仅用一行即可。参数可以根据需求自行修改。

$ prokka genome.fna --outdir ./annotation --prefix test_bacteria --kingdom Bacteria
#第一个参数为待注释的基因组文件,格式为fasta。
#--outdir指定预测结果文件夹,请勿提前新建,否则会报错!
#--prefix指定预测结果前缀,此处指定前缀为test_bacteria。
#--kingdom指定待预测物种类型,共有四种:Archaea|Bacteria|Mitochondria|Viruses。

输出文件:
.txtprokka注释出的各类型序列统计信息。
.faa输出的氨基酸序列文件,包含了功能注释。
.gff输出的编码基因注释文件。
.fna输入的核苷酸序列文件。

该软件使用简单,运行快速。掌握上述常用命令可以满足大部分使用场景。如需调整参数或自定义注释蛋白库,可以参考Prokka在Github的主页:https://github.com/tseemann/prokka


###参考信息:文章来源地址https://www.toymoban.com/news/detail-444389.html

  1. Prokka Github. https://github.com/tseemann/prokka
  2. 原核生物基因组快速注释——Prokka。https://zhuanlan.zhihu.com/p/379981540

到了这里,关于生信步骤|原核生物基因组注释--Prokka的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 易基因:人类大脑的单细胞DNA甲基化和3D基因组结构|Science

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 高通通量表观基因组分析技术可用于阐明大脑中细胞复杂性的基因调控程序。5\\\'-甲基胞嘧啶 (5mCs)是哺乳动物基因组中最常见的修饰碱基,大多数5mCs发生在胞嘧啶-鸟嘌呤二核苷酸(CpGs)上。CG差异甲基化区

    2024年04月17日
    浏览(27)
  • 基于R做宏基因组的进化树ClusterTree分析

    同上一篇的PCoA分析,这个也是基于公司结果基础上的再次分析,重新挑选样本,在公司结果提供的csv结果表上进行删减,本地重新分析作图 表格预处理 在公司给的ClusterTree的原始表格数据里选取要保留的样本,同样保存为逗号分隔的csv文件 代码演示 无色版 上色版

    2024年02月13日
    浏览(26)
  • 基因组组装: 3D-DNA 染色体挂载

    本文将介绍基因组组装过程中,如何利用 HiC 测序数据,进行染色体级别基因组的组装。该过程主要利用 Juicer [1] 和 3D-DNA [2] 进行,有关第一步 Juicer 的过程,已经下方的文章中介绍了,本文主要介绍第二步: 3D-DNA 的安装与使用。 目前基因组组装的主要流程是,利用二代或者

    2024年02月13日
    浏览(23)
  • 高通量测序的数据处理与分析指北(二)-宏基因组篇

    之前的一篇文章已经从生物实验的角度讲述了高通量测序的原理,这篇文章旨在介绍宏基因组二代测序数据的处理方式及其原理。在正文开始之前,我们先来认识一下什么是宏基因组。以我的理解,宏基因组就是某环境中所有生物的基因组的合集,这个环境可以是下水道,河

    2023年04月16日
    浏览(27)
  • MetaHipMer2 - MHM2超算系统宏基因组短读长序列组装神器的介绍和使用

    berkeleylab / mhm2 / Downloads — Bitbucket 文章: Terabase-scale metagenome coassembly with MetaHipMer | Scientific Reports MetaHipMer (MHM) 是一种从头开始的宏基因组短读组装器。这是版本 2 (MHM2),完全用 UPC++、CUDA 和 HIP 编写,可以在单服务器和多节点超级计算机上高效运行,可以扩展以共同组装 te

    2024年01月19日
    浏览(26)
  • GEO生信数据挖掘(七)差异基因分析

    上节,我们使用结核病基因数据,做了一个数据预处理的实操案例。例子中结核类型,包括结核,潜隐进展,对照和潜隐,四个类别。本节延续上个数据,进行了差异分析。 加载数据 构建差异比较矩阵 计算差异基因指标 #绘制前40个基因在不同样本之间的热图 差异基因分析

    2024年02月07日
    浏览(33)
  • 【生信简单文章复现】差异分析+WGCNA+功能富集分析+PPI网络+Hub基因验证

    目录 WGCNA简介 两个假设 一般步骤  数据准备 差异分析 参数解释 Limma包差异分析  WGCNA分析 构建基因共表达网络 模块与临床特征的相关性分析 GO富集分析 KEGG富集分析 PPI分析 验证关键基因   写在最后​​​​​​​ WGCNA简介 Weighted Gene Co-Expression Network Analysis,加权基因共

    2024年01月19日
    浏览(31)
  • GEO生信数据挖掘(六)实践案例——四分类结核病基因数据预处理分析

    前面五节,我们使用阿尔兹海默症数据做了一个数据预处理案例,包括如下内容: GEO生信数据挖掘(一)数据集下载和初步观察 GEO生信数据挖掘(二)下载基因芯片平台文件及注释 GEO生信数据挖掘(三)芯片探针ID与基因名映射处理 GEO生信数据挖掘(四)数据清洗(离群值

    2024年02月07日
    浏览(46)
  • SNP注释神器——VEP(生信)

    二代测序发现的变异数量是巨大的,以人类基因组为例,1个人类基因组包含近3500000个SNV突变和1000个拷贝数变异,其中约20000-25000个变异是在编码区,10000个位点发生了氨基酸编码改变,仅有50-100个发生了蛋白截断或功能缺失,手动检查每个位点非常耗时且有些不切实际。 V

    2024年02月08日
    浏览(32)
  • GEO生信数据挖掘(十)肺结核数据-差异分析-WGCNA分析(900行代码整理注释更新版本)

    第六节,我们使用结核病基因数据,做了一个数据预处理的实操案例。例子中结核类型,包括结核,潜隐进展,对照和潜隐,四个类别。第七节延续上个数据,进行了差异分析。 第八节对差异基因进行富集分析。本节进行WGCNA分析。 WGCNA分析 分段代码(附运行效果图)请查

    2024年02月08日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包