提取TCGA 中体细胞突变数据的表达矩阵

这篇具有很好参考价值的文章主要介绍了提取TCGA 中体细胞突变数据的表达矩阵。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

#因为之前的命令调用GDCquery_Maf 发现用不了

#故找到了一些其他的方法,并且自己试着将其弄成了一个表达矩阵。

#代码如下

#1、下载加载相应的包

install.packages("pacman")
library(pacman)
p_load(TCGAbiolinks,DT,tidyverse)

BiocManager::install("TCGAbiolinks")
library(TCGAbiolinks)
library(tidyverse)
BiocManager::install("maftools")
library(maftools)

library(dplyr)

#

TCGAbiolinks:::getProjectSummary("TCGA-STAD")

#建立查询
raw<-GDCquery(
  project= "TCGA-STAD",
  data.category = "Simple Nucleotide Variation",
  access =  "open",
  legacy = FALSE,
  data.type= "Masked Somatic Mutation",
  workflow.type = "Aliquot Ensemble Somatic Variant Merging and Masking"
)

#下载数据
GDCdownload(raw)
#获取数据
maf<- GDCprepare(raw)
#读取数据
maf<-maf %>% maftools::read.maf()
#表格化数据,数据会以表格形式出现在右下角viewer里
datatable(getSampleSummary(maf),
          filter = 'top',
          options = list(scrollX = TRUE , keys = TRUE, 
                         pageLength = 5),
          rownames = FALSE)

#(以上代码是看b站一个视频来的,但是我需要这个表格,根据自己需求绘制相应的样本的TMB瀑布图,比较两个组之间的差异情况)
#把突变数据提取成为一个表达矩阵
a<-datatable(getSampleSummary(maf),
             filter = 'top',
             options = list(scrollX = TRUE , keys = TRUE, 
                            pageLength = 5),
             rownames = FALSE)
#观察列表a的结构,发现突变数据表达矩阵在a的x中的data中,提取出来。
STADTMB<-a$x$data

View(STADTMB)

gdcquery_maf,学习/生信分析,r语言,数据库

 

#这样就生成了一个和GDCquery_Maf提取出来的合并了的体细胞突变数据了(应该是,自己也没用GDCquery_Maf 提取出来过。总之可以用来做后续的分析:比如比较TCGA中构建出来的风险模型,高低风险组之间的TMB情况)文章来源地址https://www.toymoban.com/news/detail-664995.html

到了这里,关于提取TCGA 中体细胞突变数据的表达矩阵的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • TCGA下载和表达矩阵整理:最适合初学者的教程

    本文首发于公众号: 医学和生信笔记 “ 医学和生信笔记 ,专注R语言在临床医学中的使用,R语言数据分析和可视化。主要分享R语言做医学统计学、meta分析、网络药理学、临床预测模型、机器学习、生物信息学等。 这篇推文适合初学者看,大佬酌情阅读! 从打开网址开始教

    2023年04月08日
    浏览(93)
  • 表达矩阵任意两个基因相关性分析 批量相关性分析 tcga geo 矩阵中相关性强的基因对 基因相关性 ecm matrisome与gpx3

    使用场景 1.已经确定研究的基因,但是想探索他潜在的功能,可以通过跟这个基因表达最相关的基因来反推他的功能,这种方法在英语中称为 guilt of association,协同犯罪 。 2.我们的注释方法依赖于TCGA大样本,既然他可以注释基因,那么任何跟肿瘤相关的基因都可以被注释,

    2024年02月01日
    浏览(44)
  • 【生物信息学】单细胞RNA测序数据分析:计算亲和力矩阵(基于距离、皮尔逊相关系数)及绘制热图(Heatmap)

      计算亲和力矩阵,一般按照以下步骤进行: 导入数据:加载单细胞RNA测序数据集。 数据预处理:根据需要对数据进行预处理,例如 基因过滤 、 归一化 等。 计算亲和力:使用合适的算法(例如, 欧几里德距离 、 Pearson相关系数 或其他距离/相似度度量)计算样本之间的

    2024年02月06日
    浏览(32)
  • python 自动化数据提取之正则表达式

     前    言 我们在做接口自动化的时候,处理接口依赖的相关数据时,通常会使用正则表达式来进行提取相关的数据,今天在这边和大家聊聊如何在python中使用正则表达式。 正则表达式 ,又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:Regular

    2024年02月14日
    浏览(46)
  • VBA之正则表达式(43)-- 从网页中提取指定数据

    实例需求:由网页中提取下图中颜色标记部分内容,网页中其他部分与此三行格式相同。 【代码解析】 第6行代码创建正则对象。 第7行代码设置正则匹配模式。 正则表达式 说明 id=[^]+ 匹配以 id= 开头,后面跟一个或者多个除 之外的任意字符 [^]+#[^]+ 匹配以一个或者多个除

    2024年02月07日
    浏览(43)
  • TCGA数据批量运行Coxph函数

    df数据框形如:

    2024年02月14日
    浏览(20)
  • R语言 | GEO表达矩阵的数据清洗与预处理

    目录 1.去除/// 2.去除重复的基因名 3.表达矩阵自动log2化 4.矫正差异 表达量矩阵的数据清洗应该在 注释完成之后 进行,并且下列操作最好按顺序进行 如下图的表格所示,同一个探针ID对应的gene有多个,用///分隔着,而我们想获得一个探针ID只对应一个基因symbol的表格。 表达

    2024年02月13日
    浏览(28)
  • TCGA数据下载推荐:R语言easyTCGA包

                 

    2024年02月12日
    浏览(22)
  • React突变状态,更新数据(对象或者数组),页面数据不刷新的问题

    ​ 刚开始开发时,我们可能会遇到这样的问题,使用useState创建对象或者数组时,setState时,页面未进行更新。这里其实是一个突变状态的问题 什么是突变状态? ​ 当我们给 setState 一个基本数据类型时, state 值将会是 一个不可变的值 ​ 更新时, state 的 原始值也不会被更

    2024年02月11日
    浏览(41)
  • 如何快速下载GEO数据并获取其表达矩阵与临床信息 | 附完整代码 + 注释

    GEO数据库可以说是大家使用频率贼高的数据库啦!那它里面的数据怎么下载大家知道嘛!今天给大家展示一种快速获取它的表达矩阵和临床信息的方法! 话不多说!咱们直接开始! 在GEO数据库中,你找到了你需要的数据,接下来怎么办嘞!下载它!处理它! 比如,咱们今天

    2024年04月08日
    浏览(62)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包