GSEA富集分析结果详解

这篇具有很好参考价值的文章主要介绍了GSEA富集分析结果详解。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1. GSEA富集分析原理图

GSEA富集分析结果详解,生物信息,R,GSEA,生物信息

2. GSEA富集分析过程

1. 计算富集分数(ES)

富集分数:S 反应基因集(比如某个通路内的基因集)成员 s 在排序基因集 L(比如根据 logFC 排序的差异基因集,默认降序,所以上调基因在顶端)的两端富集的程度。富集得分 ES 最后定义为最大的peak值。正值ES表示基因集 S 在基因集 L 的顶部富集,负值ES表示基因集 S 在基因集 L 的底部富集。

2. 估计富集分数的显著性水平

因为每个基因集的大小不同,而 ES 又和基因集大小有关,因此需要对其进行 normalization。为了检验每个基因集的 NES 是否显著,将总基因集 L 随机打乱排列一定次数,每次都计算每个基因集的 NES(ES),得到每个基因集的 NES 在随机排序情况下的理论分布,从而计算其 p 值。

3. 矫正多重假设检验

FDR 则是对 p 值进行 BH 校正之后的 p 值。

3. GSEA富集分析结果

1. 富集结果表格解读
  • ID:通路名
  • Description:通路描述信息
  • setSize:该通路中包含表达数据集文中的基因数目(经过条件筛选后的值)
  • enrichmentScore:富集分数
  • NES:标准化后的富集分数
  • pvalue:是对 ES 的统计学分析,用来表征富集结果的可信度
  • p.adjust:是多重假设检验校正之后的 p-value
  • qvalues:是多重假设检验(FDR法)校正之后的 p-value,即对NES可能存在的假阳性结果的概率估计。GSEA 对显著性的定义为 p-value<5%,FDR q-val<25%
  • rank:当 ES 最大时,对应基因所在排序好的基因列表中所处的位置
  • leading_edge:tags 表示核心基因占该通路基因集的百分比;list 表示核心基因占所有基因的百分比;signal,将前 2 项统计值结合在一起计算出的富集信号强度
  • core_enrichment:核心富集基因集
2. 富集可视化图解读

GSEA富集分析结果详解,生物信息,R,GSEA,生物信息

富集图一共分为上中下 3 部分。如A_VS_B差异分析:

  • 第一部分 ES 折线图:显示了当分析沿着排序基因集按排序计算时,ES 值在计算到每个位置时的展示。最高峰处的ES得分 (垂直距离 0.0 最远)便是基因集的 ES 值。

  • 第二部分 hits 图,俗称条形码图,用线条或者 hit 标记了通路基因集(基因组所有)中成员出现在基因排序列表中的位置。如果基因集里的基因 集中在所有基因的前部分,就是在A组里面富集,如果集中在后面部分,就是在B组里面富集。leading edge subset 就是(0,0)到绿色曲线峰值 ES 出现对应的这部分基因(x轴0到虚线那部分)。所谓 Leading-edge subset,就是对富集得分贡献最大的基因成员。如果ES得分都是正值(如上图所示),那么Leading-edge subset就在峰值ES的左侧,反之则在右侧(底部富集 = A/B 下调表达 = B 组高表达)。那么根据本图我们很容易看出,该通路在 A 组高表达。

  • 第三部分是排序后所有基因 rank 值的分布,热图红色部分对应的基因在 A 组高表达,蓝色部分对应的基因在 B 组高表达,每个基因对应的信噪比(Signal2noise,前面选择的排序值计算方式)以灰色面积图展示。

参考:https://zhuanlan.zhihu.com/p/582401881文章来源地址https://www.toymoban.com/news/detail-635753.html

到了这里,关于GSEA富集分析结果详解的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 生信数据分析——GO+KEGG富集分析

    1.1 为什么要做功能富集分析? 转录组学数据得到的基因非常多,面对大量的基因无法做到挨个研究其功能,因此为了研究基因所具有的功能,将部分功能相似的基因进行归类,这样具有相似功能的基因就被放在一起,构成了一个通路,从而减少工作量,并可以实现功能和表

    2024年04月12日
    浏览(39)
  • GWAS分析中的GO和KEGG富集分析

    上一次,我们介绍如何根据显著性snp,使用bedtools根据上下游距离,根据gff文件注释基因。 这一次,介绍一下如何根据注释的基因,进行富集分析,主要是看一下GWAS定位的基因有没有某一个趋势,也算是一种验证的方法。比如籽粒大小找到的30个候选基因,如果都与籽粒发育

    2024年02月05日
    浏览(37)
  • Monocle2拟时基因富集分析

    ****Monocle2全部往期精彩系列 : 1、群成员专享:Monocle2更新(就是重新梳理一下) 2、一键跑完monocle2? 3、ggplot2个性可视化monocle2结果 4、ggplot修饰monocle2拟时热图:一众问题全部解决 5、Monocle2终极修改版 6、单细胞拟时分析:基因及通路随拟时表达变化趋势 Monocle2拟时分析及

    2024年02月08日
    浏览(35)
  • 生信学习之通路富集一(GO分析)

    富集分析 (Enrichment Analysis)是一种广泛应用于生物信息学研究的统计方法,主要用于检验一个基因集合中某些功能或特征的富集程度。富集分析的主要目的是从大量基因数据中找出有生物学意义的模式和功能。根据分析的目标和方法,富集分析可以分为以下几种类型: 基因

    2024年02月09日
    浏览(38)
  • 使用R语言绘制富集条形图,轻松分析基因表达数据

    富集分析(enrichment analysis)是一种生物信息学方法,它可以帮助我们识别基因或其他的生物实体在某个特定的类别中过度表示的趋势。通俗来说,富集分析通过将基因分类到特定的集合中,然后根据基因在集合中的分布和总体分布的比较,来寻找哪些集合与特定的生物过程、

    2024年02月11日
    浏览(49)
  • 【生信简单文章复现】差异分析+WGCNA+功能富集分析+PPI网络+Hub基因验证

    目录 WGCNA简介 两个假设 一般步骤  数据准备 差异分析 参数解释 Limma包差异分析  WGCNA分析 构建基因共表达网络 模块与临床特征的相关性分析 GO富集分析 KEGG富集分析 PPI分析 验证关键基因   写在最后​​​​​​​ WGCNA简介 Weighted Gene Co-Expression Network Analysis,加权基因共

    2024年01月19日
    浏览(47)
  • [系统安全] 四十九.恶意软件分析 (5)Cape沙箱分析结果Report报告的API序列批量提取详解

    终于忙完初稿,开心地写一篇博客。 您可能之前看到过我写的类似文章,为什么还要重复撰写呢?只是想更好地帮助初学者了解病毒逆向分析和系统安全,更加成体系且不破坏之前的系列。因此,我重新开设了这个专栏,准备系统整理和深入学习系统安全、逆向分析和恶意代

    2024年02月07日
    浏览(51)
  • 【R语言】——基因GO/KEGG富集分析!超级简单的保姆级教程!

    上期“ 干货预警——原来基因功能富集分析这么简单! ”和“ 【R语言】——基因GO/KEGG功能富集结果可视化(保姆级教程) ”介绍如何使用DAVID在线分析工具对基因进行GO/KEGG功能富集分析和使用R ggplot包对获得的基因GO/KEGG功能富集结果进行可视化。本期介绍使用R clusterPro

    2024年02月02日
    浏览(39)
  • KEGG更新后富集分析的问题,包括下载包以及enrichKEGG和可视化

    运行以下代码出现报错,探究原因: 出现以下报错: 进行解决,查到第一个解决方法是把阈值降低,即将 pvalueCutoff = 0.01,qvalueCutoff = 0.05, 修改为: pvalueCutoff = 0.2,qvalueCutoff = 0.2, 但是依旧有以上报错,不断尝试网上的方法依然有问题,发现还是clusterProfiler包的问题,昨天在进

    2024年02月10日
    浏览(37)
  • 生物信息-软件安装

    从终端进wsl: WSL2下安装conda 1.wget: unable to resolve host address解决方法 2.Windows中WSL2(子系统)设置默认root用户登入修改conf文件出现报错: E212: Can\\\'t open file for writing Press ENTER or type command to continue 原因: 1.当前用户的权限不足 2.此文件可能正被其他程序或用户使用。 一般错误原因

    2024年02月03日
    浏览(53)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包