从单细胞数据分析的最佳实践看R与Python两个阵营的博弈

这篇具有很好参考价值的文章主要介绍了从单细胞数据分析的最佳实践看R与Python两个阵营的博弈。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

R与Python,在生物信息学领域的博弈异常激烈。许多生信分析,两个阵营都发展出了自己的方法,比如单细胞数据分析,R有Seurat,Python就有Scanpy。这些层出不穷的方法不断地吸引着吃瓜群众的眼球,同时也让人患上了选择困难症。

到底谁优谁劣?一时竟难分高下。今天我们就以吃瓜的心态来看看两个阵营在单细胞数据分析方面的博弈。

R语言单细胞分析最佳实践

首先出场的是 Orchestrating Single-Cell Analysis with Bioconductor (Bioconductor OSCA)。由 Bioconductor 出品,旨在传授基于 R 的 Bioconductor 生态系统分析单细胞 RNA-Seq 的常见工作流程。其电子书网址是:https://bioconductor.org/books/release/OSCA/。

从单细胞数据分析的最佳实践看R与Python两个阵营的博弈,数据分析,r语言,python,数据挖掘,开发语言

一篇同名论文[Amezquitaet al., 2020] 概述了使用 Bioconductor 进行单细胞分析。但在线的电子书含有大量示例代码,更详细。不过,OSCA 不包括其他单细胞组学,例如 scATAC-seq。空间转录组学在补充的 Orchestrating Spatially-Resolved Transcriptomics Analysis with Bioconductor (Bioconductor OSTA) 一书 (https://lmweber.org/OSTA-book/) 中进行了介绍。由于这些书籍是为 Bioconductor 生态系统设计的,因此它们仅使用 Bioconductor 上可用的工具。这些并不一定能得出书中所描述的最佳分析结果。Bioconductor 书籍对具有基本 R 和更强生物学背景的人特别有用,他们有兴趣学习如何使用 Bioconductor 分析单细胞和空间转录组学数据。

Python单细胞分析最佳实践

Python也不遑多让,好事者也推出了基于 Python 的单细胞分析最佳实践。电子书网址:

https://www.sc-best-practices.org/preamble.html,该书详细介绍了单细胞数据分析。有理论讲解和大量示例代码,并且一直处于更新当中。

从单细胞数据分析的最佳实践看R与Python两个阵营的博弈,数据分析,r语言,python,数据挖掘,开发语言

作者团队先是在 2019 年发表了一篇论文:Current best practices in single‐cell RNA‐seq analysis: a tutorial,介绍了单细胞 RNA-Seq 分析的最佳实践。与Bioconductor OSCA 相比,这篇论文和示例分析没有受到其展示的工具的偏见,并且在涵盖主题的广度方面内容更加完整。

2023年,同一团队发表了新的论文:Best practices for single-cell analysis across modalities。提出了最新的最佳实践。其示例代码以 Python 为主,可以说是与 Bioconductor OSCA 针锋相对了。大家该如何选择呢?

从单细胞数据分析的最佳实践看R与Python两个阵营的博弈,数据分析,r语言,python,数据挖掘,开发语言

海纳百川

正所谓海纳百川,有容乃大。我们在选择工具的时候,可以有偏见,但不能固执。Galaxy生信云平台(UseGalaxy.CN)就汇聚了大量生物信息学工具,不管是 R,Python 抑或是其他语言开发的,只要足够优秀,平台都做了整合,供大家自由选择。单细胞方面,就整合了基于 Seurat 和 Scanpy 的最佳分析实践,欢迎大家使用。

从单细胞数据分析的最佳实践看R与Python两个阵营的博弈,数据分析,r语言,python,数据挖掘,开发语言

参考文献

  • Orchestrating single-cell analysis with bioconductor. https://bioconductor.org/books/release/OSCA/, 2022.

  • Orchestrating single-cell analysis with bioconductor. Nature Methods, 2022

  • A single-cell survey of the small intestinal epithelium. Nature, 2017

  • Orchestrating high-throughput genomic analysis with bioconductor. Nature Methods, 2015

  • Current best practices in single-cell term`rna`-seq analysis: a tutorial. Molecular Systems Biology, 2019

关于简说基因

  • 生信平台

    Galaxy中国(UseGalaxy.cn)致力于打造中国人的云上生物信息基础设施。大量在线工具免费使用。无需安装,用完即走。活跃的用户社区,随时交流使用心得。

  • 生信培训

    简说基因的生信培训班,荣获学员的一致好评。如果你也对生物信息学感兴趣,欢迎来跟简说基因,学真生信。

  • 生信分析

    我们能够承接所有 NGS 组学数据分析业务,包括但不限于 WGS / WES / RNA-seq 等。基因组组装、注释,以及各种重测序业务都可以与简说基因合作。

从单细胞数据分析的最佳实践看R与Python两个阵营的博弈,数据分析,r语言,python,数据挖掘,开发语言文章来源地址https://www.toymoban.com/news/detail-822410.html

到了这里,关于从单细胞数据分析的最佳实践看R与Python两个阵营的博弈的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Seurat | 强烈建议收藏的单细胞分析标准流程(基础质控与过滤)(一)

    作为现在 最火 的 scRNAseq 分析包, Seurat 当之无愧。😘 本期开始我们介绍一下 Seurat 包的用法,先从 基础质控 和 过滤 开始吧。🥳 3.1 读取10X文件 这里我们提供一个转成 gene symbols 的可读文件,如果大家拿到的是 Ensemble ID ,可以用之前介绍的方法进行转换。 3.2 创建Seurat对象

    2024年02月08日
    浏览(62)
  • 单细胞seurat入门—— 从原始数据到表达矩阵

    根据所使用的建库方法,单细胞的RNA序列(也称为读取(reads)或标签(tags))将从转录本的3\\\'端(或5\\\'端)(10X Genomics,CEL-seq2,Drop-seq,inDrops)或全长转录本(Smart-seq)获得。 图片来源: Papalexi E and Satija R. Single-cell RNA sequencing to explore immune cell heterogeneity, Nature Reviews Immu

    2024年02月05日
    浏览(58)
  • 易基因:单细胞DNA甲基化与转录组分析揭示猪生发泡卵母细胞成熟的关键调控机制|项目文章

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 在哺乳动物中,窦卵泡内的生发泡(germinal vesicle,GV) 卵母细胞可以保持数月或数年的静止状态。促黄体生成素(luteinizing hormone,LH)激增促进了减数分裂(meiosis)恢复,使卵母细胞获得受精后和早期胚胎发育

    2024年02月14日
    浏览(51)
  • 单细胞注释之坑-通过AddModuleScore注释细胞

    兜兜转转,小编做单细胞转眼又是半年过去了,单细胞注释真的是一到玄学,一查资料很多自动化单细胞注释的工具横空出世,可是小编试了很多很多,发现还是手动注释更加准确,但是手动如何注释呢? 这里我们需要先找到细胞的marker基因,这里以NKT细胞为例,我们知道

    2024年02月12日
    浏览(95)
  • 单细胞分类和预测任务

    对于 分类 和 预测 任务,在生物信息学领域有一些常用的方法和工具可以使用。以下是一些常见的方法和工具: 1. 机器学习方法: 包括支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest)、神经网络(Neural Networks)等。这些方法可以用于分类和预测任务,可以根

    2024年02月13日
    浏览(46)
  • 基于GPT构建单细胞多组学基础模型

    生成式预训练模型在自然语言处理和计算机视觉等各个领域取得了显著的成功。特别是将大规模多样化的数据集与预训练的Transformer相结合,已经成为开发基础模型的一种有前途的方法。文本由单词组成,细胞可以通过基因进行表征。这种类比启发作者探索细胞和基因生物学

    2024年02月13日
    浏览(54)
  • 专栏十:10X单细胞的聚类树绘图

    经常在文章中看到对细胞群进行聚类,以证明两个cluster之间的相关性,这里总结两种绘制这种图的方式和代码,当然我觉得这些五颜六色的颜色可能是后期加的,本帖子只总结画树状图的方法 文章Single-cell analyses implicate ascites in remodeling the ecosystems of primary and metastatic tumors

    2024年02月07日
    浏览(71)
  • 单细胞测序并不一定需要harmony去除批次效应

    大家好,今天 我们分享的是单细胞的学习教程https://www.singlecellworkshop.com/analysis-tutorial.html  教程的作者使用了四个样本,但是没有使用harmony或者其他方法去整合 去除批次效应。 主要内容: SCTransform流程代码 及结果 harmony流程代码及结果 seurat单样本标准流程代码 及结果 三种

    2024年02月03日
    浏览(40)
  • 易基因:人类大脑的单细胞DNA甲基化和3D基因组结构|Science

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 高通通量表观基因组分析技术可用于阐明大脑中细胞复杂性的基因调控程序。5\\\'-甲基胞嘧啶 (5mCs)是哺乳动物基因组中最常见的修饰碱基,大多数5mCs发生在胞嘧啶-鸟嘌呤二核苷酸(CpGs)上。CG差异甲基化区

    2024年04月17日
    浏览(43)
  • 基于大数据的可视化:数据分析和展示的最佳实践

    作者:禅与计算机程序设计艺术 随着互联网、移动互联网、大数据等技术的广泛应用,用户对于各种各样的数据已经产生了海量的需求。数据呈现的形式也变得越来越多样化,包括报表、图表、地图、流程图、模型等。而如何将这些数据可视化、交流和传播,是一个重要的方

    2024年02月09日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包