单细胞注释之坑-通过AddModuleScore注释细胞

这篇具有很好参考价值的文章主要介绍了单细胞注释之坑-通过AddModuleScore注释细胞。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

兜兜转转,小编做单细胞转眼又是半年过去了,单细胞注释真的是一到玄学,一查资料很多自动化单细胞注释的工具横空出世,可是小编试了很多很多,发现还是手动注释更加准确,但是手动如何注释呢?
这里我们需要先找到细胞的marker基因,这里以NKT细胞为例,我们知道NKT有三个经典的marker(CD45,CD3,CD56),我们单个marker注释看看
这里的sce就是我们前面使用seurat创建的对象

FeaturePlot(sce,features = c('PTPRC','CD3D', 'CD3E', 'CD3G', 'NCAM1'),
            pt.size = 0.1,reduction = 'tsne',ncol = 5)

addmodulescore,R语言,r语言,单细胞
从上面的图中可以看出,右上角为T细胞,NKT细胞在哪里呢,我们需要看一下交集的地方
addmodulescore,R语言,r语言,单细胞
同样是这几个marker,我们使用该包自带的AddModuleScore进行计算,同时绘制多个marker的TSNE图

NKT_gene_list <- list(c('PTPRC','CD3D', 'CD3E', 'CD3G', 'NCAM1'))
sce <- AddModuleScore(object = sce, features = NKT_gene_list, name = "cell")
FeaturePlot(object = sce, features = "cell1",reduction='tsne',
                    cols = c('grey','red'))+
  ggtitle('NKT cell \n CD45(PTPRC), CD3(CD3D, CD3E,CD3G), CD56(NCAM1)')

addmodulescore,R语言,r语言,单细胞
这里指定的NKT在右上角
addmodulescore,R语言,r语言,单细胞
看到这里突然不知道说啥了,小编查 了一下AddModuleScore的原理,原来AddModuleScore是通过特定的方法通过这几个marker计算的评分,(其实就是这几个基因的平均表达值)对于Bulk RNA-seq的数据当然没有什么问题,但是对于单细胞来说,他是一个很大的稀疏矩阵,包含了大量的0,在取平均的时候,将高表达的细胞反而缩小了,低表达的细胞整体拉大了,加上每一个marker在细胞注释的时候占的权重不一样。
我们要确定NKT,就需要先看CD45是否表达(免疫细胞),再看CD3(T细胞),最后看CD56(NKT),但是通过AddModuleScore的方法认为这些marker的一样重要的,所以才会造成现在的情况。
换言之,除非能得到一种算法,就像流式手动圈门一样,从大类开始注释,直到小类结束,不然我们又该如何去衡量这个marker的权重呢?
玄学一般的单细胞注释,不一样的注释不一样的结果,我曾经使用garnett包进行分析,区分单个细胞,并进行注释(因为小编一直觉得不管怎么聚类,cluster都是杂的,不可能纯),可是结果总是差强人意。直到现在才明白,为什么garnett会失败,其实和AddModuleScore的一样的,还是那句话,marker权重不同,他们不知道哪个marker对于亚群权重更高,所以,面对这些只有一个方法,有交集的基因不要放,亚群之间一定要找独有的marker,但是这个又如何容易呢?大亚群可以,小亚群呢?先注释大亚群后注释小亚群吗?文章来源地址https://www.toymoban.com/news/detail-525997.html

到了这里,关于单细胞注释之坑-通过AddModuleScore注释细胞的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 专栏十:10X单细胞的聚类树绘图

    经常在文章中看到对细胞群进行聚类,以证明两个cluster之间的相关性,这里总结两种绘制这种图的方式和代码,当然我觉得这些五颜六色的颜色可能是后期加的,本帖子只总结画树状图的方法 文章Single-cell analyses implicate ascites in remodeling the ecosystems of primary and metastatic tumors

    2024年02月07日
    浏览(58)
  • 单细胞测序并不一定需要harmony去除批次效应

    大家好,今天 我们分享的是单细胞的学习教程https://www.singlecellworkshop.com/analysis-tutorial.html  教程的作者使用了四个样本,但是没有使用harmony或者其他方法去整合 去除批次效应。 主要内容: SCTransform流程代码 及结果 harmony流程代码及结果 seurat单样本标准流程代码 及结果 三种

    2024年02月03日
    浏览(31)
  • 单细胞分析(五)——使用Harmony进行数据整合和去批次

    进行样本去批次(batch correction)是单细胞RNA测序数据分析的重要步骤之一。 技术噪声和批次效应: 单细胞RNA测序数据通常具有高度异质性,且在采样、实验操作、反应条件等多个环节中可能引入技术噪声和批次效应。这些因素会对测序数据质量产生影响,从而使得不同批次

    2024年02月08日
    浏览(101)
  • Seurat | 强烈建议收藏的单细胞分析标准流程(基础质控与过滤)(一)

    作为现在 最火 的 scRNAseq 分析包, Seurat 当之无愧。😘 本期开始我们介绍一下 Seurat 包的用法,先从 基础质控 和 过滤 开始吧。🥳 3.1 读取10X文件 这里我们提供一个转成 gene symbols 的可读文件,如果大家拿到的是 Ensemble ID ,可以用之前介绍的方法进行转换。 3.2 创建Seurat对象

    2024年02月08日
    浏览(42)
  • 易基因:单细胞DNA甲基化与转录组分析揭示猪生发泡卵母细胞成熟的关键调控机制|项目文章

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 在哺乳动物中,窦卵泡内的生发泡(germinal vesicle,GV) 卵母细胞可以保持数月或数年的静止状态。促黄体生成素(luteinizing hormone,LH)激增促进了减数分裂(meiosis)恢复,使卵母细胞获得受精后和早期胚胎发育

    2024年02月14日
    浏览(41)
  • 从单细胞数据分析的最佳实践看R与Python两个阵营的博弈

    R与Python,在生物信息学领域的博弈异常激烈。许多生信分析,两个阵营都发展出了自己的方法,比如单细胞数据分析,R有Seurat,Python就有Scanpy。这些层出不穷的方法不断地吸引着吃瓜群众的眼球,同时也让人患上了选择困难症。 到底谁优谁劣?一时竟难分高下。今天我们就

    2024年01月25日
    浏览(40)
  • 易基因:人类大脑的单细胞DNA甲基化和3D基因组结构|Science

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 高通通量表观基因组分析技术可用于阐明大脑中细胞复杂性的基因调控程序。5\\\'-甲基胞嘧啶 (5mCs)是哺乳动物基因组中最常见的修饰碱基,大多数5mCs发生在胞嘧啶-鸟嘌呤二核苷酸(CpGs)上。CG差异甲基化区

    2024年04月17日
    浏览(31)
  • 生信小白学单细胞转录组(sc-RNA)测序数据分析——R语言

    10X单细胞转录组理论上有3个文件才能被读入R进行seurat分析,分别是barcodes.tsv 、 genes.tsv和matrix.mtx,文件barcodes.tsv 和 genes.tsv,就是表达矩阵的行名和列名 genes.tsv文件(有时也叫features.tsv文件) 文件内容:有两列,第一列为基因ID,第二列为基因Symbol ID,区分 各个基因 。 b

    2024年02月04日
    浏览(52)
  • 【生物信息学】单细胞RNA测序数据分析:计算亲和力矩阵(基于距离、皮尔逊相关系数)及绘制热图(Heatmap)

      计算亲和力矩阵,一般按照以下步骤进行: 导入数据:加载单细胞RNA测序数据集。 数据预处理:根据需要对数据进行预处理,例如 基因过滤 、 归一化 等。 计算亲和力:使用合适的算法(例如, 欧几里德距离 、 Pearson相关系数 或其他距离/相似度度量)计算样本之间的

    2024年02月06日
    浏览(37)
  • 【TOP生物信息】使用SingleR注释细胞类型

    扫码关注下方公粽号,回复推文合集,获取400页单细胞学习资源! 本文共计1887字,阅读大约需要6分钟,目录如下: SingleR基本介绍 SingleR包安装 SingleR包使用 1.使用已有的参考数据集进行细胞定义 2.使用自定义数据集进行细胞定义 小结 获取代码 代码参考 往期单细胞系统教程

    2024年02月04日
    浏览(83)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包