GO富集绘图绘制方法,零基础教程,替换数据直接作图,完成版R语言脚本

这篇具有很好参考价值的文章主要介绍了GO富集绘图绘制方法,零基础教程,替换数据直接作图,完成版R语言脚本。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

速绘 丨 GO富集气泡图

本期分享一个快速绘制GO富集结果图的方法,主要使用R语言tidyverse包,只需导入数据即可一步出图,可以自定义显示的数目、颜色、筛选参数,从此以后绘制GO富集图只需1秒

前言介绍

下面是一个GO富集分析的结果数据表:
GO富集绘图绘制方法,零基础教程,替换数据直接作图,完成版R语言脚本,程序人生

  • ID:表示具体的GO条目
  • Description:GO条目的描述
  • RatioF:分子是富集到这个GO条目上的gene的数目,
    分母是所有输入的做富集分析的gene的数目
  • RatioB:分母是所有编码蛋白的基因中有GO注释的gene的数目,分子是注释到这个GO条目上面的gene数目
  • pvalue:富集的p值
  • p.adjust:校正之后的p值

通过以上数据可以绘制如下的气泡图,还可以进一步根据结果分成三类:

  • BP: biological process, 生物学过程
  • MF: molecular function, 分子功能
  • CC: cellular component, 细胞成分
    GO富集绘图绘制方法,零基础教程,替换数据直接作图,完成版R语言脚本,程序人生
    下面开始正式的绘图方法原理介绍

绘图方法

加载数据与参数

# 本脚本用于对TGT生成的GO结果作图
library(tidyverse)
rm(list=ls())
# 设置项目基本信息
file <- "GO-Table20230629105106.csv"  #数据文件名
job <- "20230629" #项目名称
out_info_num <- 30 #最大显示条目数
my_pvalue <- 1 #p值筛选条件
my_number <- 0 #数量筛选条件
color_1 <- c("blue","red") #颜色

将数据导入df变量中,然后修改colnames,使用管道操作符%>%对数据框进行筛选。首先,根据"Pvalue"列的值小于my_pvalue变量的值,保留满足条件的行。然后,继续筛选,仅保留"Number"列的值大于my_number变量的值的行。最终,经过筛选后的结果会存储回df数据框中。

df <- read.csv(file,header = T)
colnames(df) <- c("ID",
                  "Description",
                  "RatioF",
                  "RatioB",
                  "Pvalue",
                  "FDR",
                  "Number",
                  "Group",
                  "Gene")
df$Description <- factor(df$Description)

df <- df %>% filter(Pvalue < my_pvalue) %>% 
         filter(Number > my_number)

数据转换

调用分数转小数的函数,mixedToFloat相关介绍请见上一篇文章。

df$RatioF <- mixedToFloat(df$RatioF)
df$RatioB <- mixedToFloat(df$RatioB)

首先,根据"RatioF"列的值对df进行升序排序,并将结果存储在df_plot中。

然后,从df_plot中提取"Description"列的唯一值,并将其存储在leve_des变量中。

接下来,将df_plot中的"Description"列转换为因子类型,并按照leve_des中的顺序设置水平值(levels)。

随后,从df_plot中保留前out_info_num行的数据,并将结果重新赋值给df_plot。这样就实现了对df_plot的行数限制。

最后,使用管道操作符%>%对df_plot进行操作,将所有含有缺失值的行删除,并将结果重新赋值给df_plot。

df_plot <- df[order(df$RatioF),]
leve_des <- unique(df_plot$Description)
df_plot$Description <- factor(df_plot$Description,levels = leve_des)
df_plot <- df_plot[1:out_info_num,]
df_plot <- df_plot %>% drop_na()

另外,需要对Group列进行替换,生成新的分类标注信息“MF”,“CC”,“BP”

# 使用mutate函数替换Group列的值
df_plot <- df_plot %>% 
  mutate(Group = case_when(
    Group == "molecular_function" ~ "MF",
    Group == "cellular_component" ~ "CC",
    Group == "biological_process" ~ "BP",
    TRUE ~ Group
  ))

绘制图像

接下来,使用ggplot2绘制气泡图:

ggplot(df_plot)+
  geom_point(aes(RatioF,Description,
                 color = Pvalue,
                 size = Number))+
  labs(x="GeneRatio",y="GO description") + 
  labs(title="")+
  scale_color_gradient(low = color_1[1],high=color_1[2],name="Pvalue")+
  theme_bw()+
  facet_grid("Group",scales = "free_y",space = "free_y")
ggsave(str_c("Fig_GO_plot_",job,".pdf"),
       width = 8,height = 8)

首先,使用geom_point函数在散点图中绘制数据点。散点的x轴表示RatioF,y轴表示Description。点的颜色基于Pvalue列的值,大小基于Number列的值。

接下来,使用labs函数设置x轴和y轴的标签文本,以及图表的标题。

然后,使用scale_color_gradient函数设置Pvalue颜色的渐变范围,并命名为"Pvalue"。
调用theme_bw函数将图表的主题样式设置为黑白。

最后,使用facet_grid函数创建一个分面图,根据"Group"列的值将图表分为多个子图。scales参数设置y轴的刻度尺和标签自由缩放,space参数设置y轴的间距。

最终,使用ggsave函数将生成的图表保存为PDF文件,文件名由"Fig_GO_plot_“、job和”.pdf"拼接而成,指定了输出文件的宽度和高度。

参考资料:
https://zhuanlan.zhihu.com/p/383654316
http://wheat.cau.edu.cn/TGT/m.html?navbar=GOEnrichment

**“速绘”**系列专注于分享便捷实用的作图脚本,低代码实现精美科研作图。主打的就是可重复使用,换套数据一行代码即可出图!本篇文章的绘图脚本已上传至后台,回复“GO29”即可获得。

本文由mdnice多平台发布文章来源地址https://www.toymoban.com/news/detail-517113.html

到了这里,关于GO富集绘图绘制方法,零基础教程,替换数据直接作图,完成版R语言脚本的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【Win32绘图编程,GDI绘图对象】绘图基础,位图处理,绘图消息处理,画笔,画刷,文本绘制

    这一篇文章分享本人学习win32绘图编程,其中包括GDI绘图对象,绘图基础,基本图形的绘制,画笔画刷的使用,文本绘制,以及文本字体的更改。 绘图设备DC(Device Context),有时也叫做绘图上下文/绘图描述表/显示设备上下文 HDC-DC句柄,表示绘图设备 GDI-Windows graphics device

    2024年02月07日
    浏览(42)
  • 【MATLAB基础绘图第5棒】绘制气泡图

    MATLAB绘制气泡图可用来对比不同数据组数据、评估指标权重可视化等,需基于MATLAB2021a及以上版本进行绘制,该2021a之前版本无气泡图函数。 以评估指标权重可视化为例,AHP法经专家赋权后获得的判断矩阵如图1,现利用气泡图来将其可视化,更直观的给审稿人印象,绘制步骤

    2024年02月14日
    浏览(44)
  • 【MATLAB基础绘图第7棒】绘制各式柱状图

    绘制分组数据,并对 数据格式和边框 等进行设置,成图如下所示: MATLAB绘制代码如下: 图源:J2022-Observed decrease in light precipitation in part due to urbanization-Scientific Reports 成图如下: MATLAB代码如下: 区间范围柱状图 是柱状图的一种,能够更加清晰地展示各类目数据区间范围分布

    2024年02月09日
    浏览(43)
  • 【MATLAB基础绘图第2棒】绘制柱状/饼图填充图

    带填充纹理的堆叠图是通过在原始堆叠图的基础上添加不同的纹理得到的,可以很好地解决由于 颜色区分不够 而导致的对象识别困难问题。 由于Matlab中未收录提供填充纹理选项,因此需要大家自行设法解决。本博客介绍三种填充方法。 MATLAB官网-Hatchfill2(Kesh Ikuma. Matlab Ce

    2024年02月03日
    浏览(40)
  • 【MATLAB基础绘图第4棒】绘制椭圆形相关系矩阵图

    数据及代码下载: 下载专区-《MATLAB统计分析与应用:40个案例分析》程序与数据 绘图函数: 数据如下: MATLAB代码如下: 运行上述命令得出变量间的相关系数矩阵R、线性相关性检验的p值矩阵P以及相关系数矩阵图。成图如下所示: 图形参数修改可根据需要对 matrixplot函数 进

    2024年02月04日
    浏览(64)
  • 生信学习之通路富集一(GO分析)

    富集分析 (Enrichment Analysis)是一种广泛应用于生物信息学研究的统计方法,主要用于检验一个基因集合中某些功能或特征的富集程度。富集分析的主要目的是从大量基因数据中找出有生物学意义的模式和功能。根据分析的目标和方法,富集分析可以分为以下几种类型: 基因

    2024年02月09日
    浏览(34)
  • 【MATLAB基础绘图第9棒】绘制截断坐标轴(Broken Axis)

    有时候,用MATLAB绘制坐标图时会出现有的曲线值都特别大,有的曲线值都很小,但是又想在同一幅图中将他们展示出来,于是需要截断坐标轴的刻度或者改变纵轴的刻度,使其不均匀。此时,就需要对横坐标或纵坐标进行截断。 参考:博客-MATLAB实例:截断坐标轴(Broken Axis)

    2024年02月06日
    浏览(47)
  • GWAS分析中的GO和KEGG富集分析

    上一次,我们介绍如何根据显著性snp,使用bedtools根据上下游距离,根据gff文件注释基因。 这一次,介绍一下如何根据注释的基因,进行富集分析,主要是看一下GWAS定位的基因有没有某一个趋势,也算是一种验证的方法。比如籽粒大小找到的30个候选基因,如果都与籽粒发育

    2024年02月05日
    浏览(33)
  • 使用c#实现一个简单绘图软件(绘制矩形、多边形,画笔、橡皮擦功能)的完整教程

    c#是微软提供的用于开发windows软件的开发语言,可以使用其快速的实现windows桌面软件的开发。这里基于C#开发了一款简单的绘图软件,可以用于绘制矩形、多边形的绘制(基于这些可以实现自己的数据标注软件),还实现了画笔、橡皮擦功能。开发C#软件通常使用Visual Studio软

    2024年02月03日
    浏览(60)
  • R语言绘图丨论文中最常用箱线图绘制教程,自动进行显著性检验和误差线标注

    在科研论文绘图中,对于多组数据进行比较一般采用箱线图的方法,今天分享一下这个经典数据可视化方法,从零开始绘制一张带 误差棒 并自动计算 显著性 比较结果的 箱线图 。 数据分布信息: 箱线图能够直观地展示数据的分布情况,包括数据的中位数、上下四分位数和

    2024年02月12日
    浏览(48)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包