Same Symbol | 哇咔咔!!!盘点一下表达矩阵中重复基因的处理方法!~

这篇具有很好参考价值的文章主要介绍了Same Symbol | 哇咔咔!!!盘点一下表达矩阵中重复基因的处理方法!~。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1写在前面

医院天天叫我们填问卷,我真是不能理解。🫠

动不动就问我们对医院的福利满意吗,对自己的收入满意吗,觉不觉得工作负荷太重了???🙂

我们满不满意,觉不觉得累,医院心里没点数吗!?~~~🤒

不能再说了,再说我的号就要被河蟹掉了。🥸

今天的教程是相对比较基础的了,分享一下我处理Expression matrix时经常遇到的一个小问题,就是重复基因名或者探针名的问题。🤪

这个问题的处理起来也简单也复杂,你可以随机取一个,可以都去掉,可以取最大值,可以取均值,仁者见仁,智者见智吧。🧐

接着是今天的正文,盘点一下我个人常用的几种处理重复基因的方法!~🥳

2用到的包

rm(list = ls())
library(tidyverse)
library(limma)
library(IOBR)

3示例数据

今天是随机生成的数据,20个样本,30个基因。🙃

set.seed(123456)

exprSet <- matrix(runif(600, 1, 10), ncol= 20)

colnames(exprSet) <- paste0("Sample",1:20)

genes <- paste0("Gene", sample(LETTERS, 30, replace=T))

exprSet <- data.frame(genes,exprSet)

DT::datatable(exprSet)
Same Symbol | 哇咔咔!!!盘点一下表达矩阵中重复基因的处理方法!~,后端

看一下有几个重复的基因吧,10个。😘

table(duplicated(exprSet$genes))
Same Symbol | 哇咔咔!!!盘点一下表达矩阵中重复基因的处理方法!~,后端

4方法一(取高值)

这里需要注意一下哦,对于相同的基因,应该挑选行平均值大的一整行,而不应该打乱。🥳

index <- order(rowMeans(exprSet[,-1]),decreasing = T)

exprSet_ordered <- exprSet[index,]

keep <- !duplicated(exprSet_ordered$genes)

exprSet_max <- exprSet_ordered[keep,]

DT::datatable(exprSet_max)
Same Symbol | 哇咔咔!!!盘点一下表达矩阵中重复基因的处理方法!~,后端

再看一下重复的基因去掉了没有,好的,任务完成。😙

table(duplicated(exprSet_max$genes))
Same Symbol | 哇咔咔!!!盘点一下表达矩阵中重复基因的处理方法!~,后端

5方法二(取均值)

5.1 aggregate函数法

exprSet_mean <- aggregate(.~genes, mean, data = exprSet)

DT::datatable(exprSet_mean)
Same Symbol | 哇咔咔!!!盘点一下表达矩阵中重复基因的处理方法!~,后端

table(duplicated(exprSet_mean$genes))
Same Symbol | 哇咔咔!!!盘点一下表达矩阵中重复基因的处理方法!~,后端

5.2 avereps函数法

exprSet_avereps <-  avereps(exprSet,ID = exprSet$genes) %>% 
as.data.frame()

DT::datatable(exprSet_avereps)
Same Symbol | 哇咔咔!!!盘点一下表达矩阵中重复基因的处理方法!~,后端

table(duplicated(exprSet_avereps$genes))
Same Symbol | 哇咔咔!!!盘点一下表达矩阵中重复基因的处理方法!~,后端

6方法三(IOBR包)

最后介绍一下IOBR包的remove_duplicate_genes()函数,非常好用!~🤓

虽然这里method写的是mean,但实际上是挑选了平均值最大的一行,我个人也是比较喜欢这种方法。🤨

exprSet_IOBR_mean <- remove_duplicate_genes(exprSet, column_of_symbol = "genes", method = "mean")

DT::datatable(exprSet_IOBR_mean)
Same Symbol | 哇咔咔!!!盘点一下表达矩阵中重复基因的处理方法!~,后端

table(duplicated(rownames(exprSet_IOBR_mean)))
Same Symbol | 哇咔咔!!!盘点一下表达矩阵中重复基因的处理方法!~,后端

Same Symbol | 哇咔咔!!!盘点一下表达矩阵中重复基因的处理方法!~,后端
最后祝大家早日不卷!~

点个在看吧各位~ ✐.ɴɪᴄᴇ ᴅᴀʏ 〰

📍 往期精彩

📍 🤣 chatPDF | 别再自己读文献了!让chatGPT来帮你读吧!~
📍 🤩 WGCNA | 值得你深入学习的生信分析方法!~
📍 🤩 ComplexHeatmap | 颜狗写的高颜值热图代码!
📍 🤥 ComplexHeatmap | 你的热图注释还挤在一起看不清吗!?
📍 🤨 Google | 谷歌翻译崩了我们怎么办!?(附完美解决方案)
📍 🤩 scRNA-seq | 吐血整理的单细胞入门教程
📍 🤣 NetworkD3 | 让我们一起画个动态的桑基图吧~
📍 🤩 RColorBrewer | 再多的配色也能轻松搞定!~
📍 🧐 rms | 批量完成你的线性回归
📍 🤩 CMplot | 完美复刻Nature上的曼哈顿图
📍 🤠 Network | 高颜值动态网络可视化工具
📍 🤗 boxjitter | 完美复刻Nature上的高颜值统计图
📍 🤫 linkET | 完美解决ggcor安装失败方案(附教程)
📍 ......

本文由 mdnice 多平台发布文章来源地址https://www.toymoban.com/news/detail-738362.html

到了这里,关于Same Symbol | 哇咔咔!!!盘点一下表达矩阵中重复基因的处理方法!~的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 基于Expression Lambda表达式树的通用复杂动态查询构建器——《剧透一下》

    前篇 《https://www.cnblogs.com/ls0001/p/17437225.html》 有大佬在评论里剧透了,这里就来一遍剧透。   通常,前后端分离的系统要在前端查询数据是提交一个带着查询条件参数的表单,比如A=1,B=2,类似样,后端接收到表单需要将这些条件参数拼接成查询需要写代码,并且表单结构

    2024年02月06日
    浏览(31)
  • Java通过Lambda表达式根据指定字段去除重复数据(集合去重)

    这里博主给大家封装好了一个工具类,里面有两个方法。 方法一:可以根据指定字段去除重复数据。 方法二:可以获取到重复的数据。 大家在使用过程中直接拷贝下方代码在要去重的类中调用即可。 导入这个工具类后怎么使用呢?我们接着往下看。 List rstList = list.stream()

    2024年02月16日
    浏览(30)
  • 第22章 补充一下实变函数的势,测度,退化矩阵,对称矩阵

    之前讲到微分,再深入的话就不够了,补充一下实变函数的知识。 集这个概念可以说很重要,但又不那么重要,具有某种特性的汇集,这个要一直牢记。比如说有理数,无理数,比如方程的解,它都具有解的特性,那么就被叫做解集,具有被算子联系的特性,就可以说是自变

    2024年01月17日
    浏览(24)
  • MATLAB知识点:矩阵的拼接和重复

    ​讲解视频:可以在bilibili搜索《MATLAB教程新手入门篇——数学建模清风主讲》。​ MATLAB教程新手入门篇(数学建模清风主讲,适合零基础同学观看)_哔哩哔哩_bilibili 节选自第3章 3.3.4 矩阵的拼接和重复 有时候我们需要对多个矩阵进行拼接,变成一个大的矩阵。根据矩阵拼

    2024年02月22日
    浏览(30)
  • matlab相关(4)重复排列&矩阵列的拼接

    例子,比如两次分别从数组[1 2 3 4 5]中取出一个数字出来 A=zeros(5,5); D=zeros(5,10); for i=0:4  A(:,i+1)=[(11:15)+10*i]\\\';  D(:,2*i+(1:2))=num2str(A(:,i+1))-\\\'0\\\'; end A D B=reshape(A,1,[ ]).\\\' B=reshape(A\\\',1,[])  

    2024年02月14日
    浏览(27)
  • matlab:输出一维矩阵中所有重复元素的索引

    参考:https://www.zhihu.com/question/496060981

    2024年02月07日
    浏览(38)
  • Matlab | 去除数组或矩阵中的重复元素

    感谢@向着阳光生长的男孩的指正!有更好的方法,只要一句代码就搞定了。把三种方法整理了,一并放在下面了。 运行结果 ———————————————————————————————————————————————————————————

    2024年02月11日
    浏览(30)
  • geo读取表达矩阵 RNA-seq R语言部分(表达矩阵合并及id转换)

    geo读取表达矩阵 RNA-seq R语言 方法一:1.从geo页面直接下载表达矩阵,然后通过r读取表达矩阵 2.利用getgeo函数读取表达矩阵 3.利用geo自带的geo2r,调整p值为1,获取探针和基因名的对应关系 1 多个组别 合并 id转化 下载表达矩阵和getgeo函数联合使用 读取excel表达矩阵

    2024年02月15日
    浏览(28)
  • (78)删除有序数组中的重复项(79)排序矩阵查找

    水晶帘动微风起,满架蔷薇一院香。 —高骈- 题目链接:删除有序数组中的重复项 给你一个 非严格递增排列 的数组 nums ,请你 原地 删除重复出现的元素,使每个元素 只出现一次 ,返回删除后数组的新长度。元素的 相对顺序 应该保持 一致 。然后返回 nums 中唯一元素的个

    2024年04月17日
    浏览(27)
  • 最小二乘法的矩阵表达

    1 前期准备 为了方便表述,我们先做一些很简单的定义: 假设有一多项式函数: f ( x 1 , x 2 , ⋯   , x m ) = ∑ i = 1 m a i x i f( x_1,x_2,cdots ,x_m) =sum_{i=1}^m{a_ix_i} f ( x 1 ​ , x 2 ​ , ⋯ , x m ​ ) = i = 1 ∑ m ​ a i ​ x i ​ 我们将函数中的自变量都提取出来组成一个列向量 x x x : x

    2023年04月20日
    浏览(35)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包