写在前面
批次效应分析,在医学芯片研究中,使用不同芯片进行分析时常用的数据处理方式,但是很多同学处理后的数据,存在不满意的情况。因此,到处咨询,各种查教程。今天,使用简短的时间分享该数据处理教程。
最终分析结果
欢迎投稿
小杜
一直在分享自己平时学习笔记,因此分享的内容大多数是与自己相关的,局限性比较大
。我一直在倡导大家一起分享自己学习笔记或教程。分享内容不限于生信教程
,可以是文章or文献
、遇到的问题及解决方案
、学习感悟
等等。
小杜的生信笔记投稿窗口会一直开放,也欢迎大家投稿。
方法一、使用相关的云平台分析
很多医学类的云平台都有类似的小程序
,只要你自己有那种想解决的意向
。我自己不做医学类,因此,只是分享自己以前使用过的。
**推荐平台:**Sangerbox
http://sangerbox.com/home.html
提供了好几种方法,选择自己意向一种即可。
开发者也做的相关的软件使用介绍。
方法二、使用代码
此代码是社群中有个同学分享的,再此也分享给大家。仅供参考。
## 批次校正
#BiocManager::install("sva")
library('sva')
## 批次信息
batch = data.frame(sample = c(pd1$geo_accession,pd2$geo_accession),
batch = c(pd1$platform_id,pd2$platform_id))
## 未批次校正前PCA
#install.packages('FactoMineR')
#install.packages('factoextra')
library("FactoMineR")
library("factoextra")
pca.plot = function(dat,col){
df.pca <- PCA(t(dat), graph = FALSE)
fviz_pca_ind(df.pca,
geom.ind = "point",
col.ind = col ,
addEllipses = TRUE,
legend.title = "Groups"
)
}
pca.plot(exp_idp,factor(batch$batch))
## sva 批次校正
combat_exp <- ComBat(dat = as.matrix(log2(exp_idp+1)),
batch = batch$batch)
pca.plot(combat_exp,factor(batch$batch))
combat_exp = data.frame(combat_exp)
save(combat_exp, eSet, file = "GSE70866.Rdata")
# 载入保存的数据
load("GSE70866.Rdata")
## 提取HYPOXIA相关基因表达矩阵
# BiocManager::install('GSEABase')
HYPOXIA = GSEABase::getGmt('HALLMARK_HYPOXIA.v7.5.1.gmt')
HYPOXIA_gene = HYPOXIA@.Data[[1]]@geneIds
exp_HYPOXIA = combat_exp[HYPOXIA_gene,]
exp_HYPOXIA = na.omit(exp_HYPOXIA)
## umap降维聚类分组
#devtools::install_github("ropenscilabs/umapr")
library(umapr)
umap_data = umap(t(exp_HYPOXIA))
umap_c = umap_data[,c('UMAP1','UMAP2')]
# K-Means聚类分析
fit1 <- kmeans(umap_c, 2) # 设定聚类个数为
group = fit1$cluster
umap_data$group = group
library(ggplot2)
ggplot(umap_data,aes(UMAP1,UMAP2,color = as.factor(group)))+
geom_point()+
theme_classic()+
labs(color='group')
往期文章:
1. 最全WGCNA教程(替换数据即可出全部结果与图形)
-
WGCNA分析 | 全流程分析代码 | 代码一
-
WGCNA分析 | 全流程分析代码 | 代码二
-
WGCNA分析 | 全流程代码分享 | 代码三
2. 精美图形绘制教程
- 精美图形绘制教程
3. 转录组分析教程文章来源:https://www.toymoban.com/news/detail-653466.html
腾讯课堂: https://bioinformatic.ke.qq.com/
CCtalk: https://www.cctalk.com/m/group/90864710
小杜的生信筆記,主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);分享感兴趣的文献和学习资料!!文章来源地址https://www.toymoban.com/news/detail-653466.html
到了这里,关于批次效应分析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!