【一文读懂生物学重复与技术重复】

这篇具有很好参考价值的文章主要介绍了【一文读懂生物学重复与技术重复】。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

在RNA-Seq等测序设计中,生物学重复和技术重复,是非常需要注意的问题。

那么问题就来了,生物学重复和技术重复,到底是什么?它们是如何影响我们的实验设计的。

生物学重复(biological replicate):可以理解为我们对一个群体进行研究,但是我们不会对整个群体进行检测(考虑到成本和工作量的问题,我们肯定也不会采取这种地毯式的方法),只是抽取群体中的一部分进行检测,用样本来代表总体。

这边样本个数,实际上就是生物学重复数。

技术重复(technical replicate):对一个样本的数值进行多次测定。

下表给出常见实验对应重复类型:

【一文读懂生物学重复与技术重复】

实例

Replication这篇文章以测定小鼠肝脏细胞中的某一个gene的表达量为例,展示了什么是生物学重复和技术重复以及如何权衡这两者之间的关系。

分别给出3种类型的重复,分别为:
(1)animal水平的重复
(2)cell水平的重复
(3)技术重复

【一文读懂生物学重复与技术重复】

由上图可以得到,3种不同种类的重复,所计算出来的表达量方差是不一样的,但gene表达量的总方差,可以有下列公式计算得到:

σ T O T 2 = σ A 2 + σ C 2 + σ M 2 σ_{TOT}^2 = σ_{A}^2 + σ_{C}^2 + σ_{M}^2 σTOT2=σA2+σC2+σM2

接下来,将总体的重复次数限定,即在满足 n A ∗ n C ∗ n M = 48 n_{A}*n_{C}*n_{M}=48 nAnCnM=48的前提条件下,对Var(X)进行计算。

n A n_{A} nA代表动物样本数, n C n_{C} nC代表细胞样品数, n M n_{M} nM代表技术重复次数, V a r ( X ) Var(X) Var(X)是基因表达量误差

V a r ( X ‾ ) Var(\overline{X}) Var(X) V a r ( X ) Var(X) Var(X)的变式,含义是the precision in the expression mean,计算公式为 σ A 2 n A + σ C 2 n A n C + σ M 2 n A n C n M \frac{σ_{A}^2}{n_{A}} + \frac{σ_{C}^2}{n_{A}n_{C}} + \frac{σ_{M}^2}{n_{A}n_{C}n_{M}} nAσA2+nAnCσC2+nAnCnMσM2

1、当 n A n_{A} nA n M n_{M} nM均为1, n C n_{C} nC为48的情况下,计算出来的Var(X)如下图标记:

【一文读懂生物学重复与技术重复】

这种情况下,只反映了由于cell样品重复和技术重复所引起的基因表达量误差。当n_{A}=1(动物样品数为1),即无法计算由于animal样品数变化,所带来的基因表达量误差。

因此在上述情况下, σ T O T 2 ( V a r ( X ) ) σ_{TOT}^2(Var(X)) σTOT2Var(X)就被低估了。

2、当 n A n_{A} nA n C n_{C} nC均为1, n M n_{M} nM为48的情况下

计算得到的基因表达量误差完全是由于技术重复所引起的。因此,如果我们将这种情况下的误差,认定为由生物重复所引起的,就造成了假阳性。

作者在文章中,还指出了非常重要的一点:虽然增加技术重复,可以让我们对σ_{M}2有一个更准确的估计,但是没必要。因为提升动物样品数,可以使σ_{M}2可忽略不计(以Var(\overline{X}))。

同时,需要注意的是,将是样品放入同一批次进行测序,减少批次效应对数据的影响。

同样地,每一种重复对于真实基因表达量的方差贡献也不是相同的。

因为cell重复和测定技术重复,并是一个独立变量。技术重复本质上是对同一份样品进行测定,数据在这种情况下的变异,完全是由于人为或机器造成的,而cell重复在本质上可以认为与animal样品之间存在相关性,因此也不是独立的。

3、从 V a r ( X ‾ ) Var(\overline{X}) Var(X)的角度,来选择replicate

【标注】 V a r ( X ‾ ) Var(\overline{X}) Var(X)越小,代表对 V a r ( X ) Var(X) Var(X)估计越准确

【一文读懂生物学重复与技术重复】

可以看到的是,当增大animal重复数时, V a r ( X ) Var(X) Var(X)趋于一个稳定值,该样本对总体的估计达到了一个较为准确的水平,同时 V a r ( X ‾ ) Var(\overline{X}) Var(X)的值也接近于0。

4、从统计检验的角度,来选择replicate

使用two-sample t检验,来判断cell样品的gene表达量方差、动物样品表达量均值之间是否存在显著差异。

下图很明显的一个结果就是,随着 n A n_{A} nA的增加,统计检验的效能得到提升,假阳性也降低了(同时也得权衡 n A n_{A} nA n B n_{B} nB

【一文读懂生物学重复与技术重复】

总结

对于一组数据来说,研究对象的生物重复本身所包含的影响比技术重复大,因此在进行实验设计时,最好将实验/测序资源倾向这边,而不是技术重复(除非对技术重复所诱发的影响感兴趣)

参考资料

[1] 刘小乐老师-哈佛计算生物学与生物信息学
[2] Blainey P, Krzywinski M, Altman N. Points of significance: replication[J]. Nature methods, 2014, 11(9): 879.文章来源地址https://www.toymoban.com/news/detail-446403.html

到了这里,关于【一文读懂生物学重复与技术重复】的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 一文读懂:区块链的原理、技术、应用领域

    引言 在当今数字化时代,区块链技术已经成为全球范围内备受瞩目的话题。从金融到供应链,从物联网到数字身份,区块链正在以惊人的速度渗透到各个行业,并在重塑着我们的社会和经济格局。 区块链最初因其作为比特币背后技术的而引起人们的关注。但现在,它已经远

    2024年04月23日
    浏览(64)
  • 一文读懂区块链隐私技术系列之环签名

    目录 环签名介绍 环签名原理 生成签名 验证签名

    2024年02月01日
    浏览(51)
  • 一文读懂为什么需要跨链?跨链是什么?跨链实现技术?

    区块链的现状 从2014开始,“区块链2.0”成为一个关于去中心化区块链数据库的术语。区块链2.0 技术跳过了交易和价值交换中担任金钱和信息仲裁的中介机构。这使得人们的隐私得到保护,可以将掌握的信息兑换成货币,并且有能力保证知识产权的所有者得到收益。 从狭义角

    2024年01月23日
    浏览(44)
  • 自动弹性,QPS线性提升|一文读懂云原生数仓AnalyticDB弹性技术原理

    在全球经济增长放缓的大背景之下,企业在加强数字化建设的过程中,实现效益最大化成为一个绕不开的话题。阿里云瑶池旗下的 云原生数仓AnalyticDB MySQL湖仓版 (以下简称AnalyticDB MySQL)在发布之初提供了定时弹性功能,帮助业务有规律的客户定时升降配计算资源以节省成

    2024年02月19日
    浏览(44)
  • 一文读懂区块链隐私技术系列之佩德森承诺(Pedersen Commitment)以及应用

    佩德森承诺是一种密码算法,它允许验证者在不暴露或无法更改某个值的情况下提交该值。 CT( Confidential Transactions,机密Tx)的基础密码学工具是佩德森的承诺。 承诺场景让你把一段数据作为私密保存,但是要承诺它,使得你后来不能改变该数据。一个简单的承诺场景用哈

    2024年02月02日
    浏览(49)
  • 一文让非技术宅读懂为什么AI更“喜欢”GPU而不是CPU?

      随着人工智能(AI)技术的快速发展,深度学习等算法在图像识别、自然语言处理、数据挖掘等方面表现出了强大的能力。而这些算法的底层计算,往往对硬件有着极高的要求。为了满足这些需求,越来越多的研究和工程实践开始尝试使用图形处理器(Graphics Processing Units,缩

    2024年02月17日
    浏览(44)
  • 一文读懂Websocket

    提示:通过本章节的学习,你想深入了解什么是websocket。 提示:这里可以添加本文要记录的大概内容: 例如:websocket是html5新增的全双工通讯协议,基于Tcp协议,属于应用层协议。 提示:以下是本篇文章正文内容,下面案例可供参考 WebSocket 是一种在单个 TCP 连接上进行全双

    2024年02月16日
    浏览(44)
  • 一文读懂Docker原理

    说起Docker,基本上就是指容器。许多同学熟悉Docker的操作,却搞不懂到底什么是容器。本文就来讲讲Docker容器到底是个啥。 容器被称为轻量级的虚拟化技术,实际上是不准确的。确切地说,容器是一种对进程进行隔离的运行环境。 由于生产环境的容器几乎都是运行在Linux上的

    2024年01月17日
    浏览(40)
  • 一文读懂Embedding

    “Embedding”直译是 嵌入式、嵌入层 。 简单来说,我们常见的 地图 就是对于 现实地理的Embedding ,现实的地理地形的信息其实远远超过三维,但是地图通过颜色和等高线等来最大化表现现实的地理 信息 。 通过它,我们在现实世界里的文字、图片、语言、视频就能转化为计算

    2024年02月11日
    浏览(43)
  • 一文读懂ThreadLocal

    目录 ThreadLocal 有什么用? 如何使用 ThreadLocal? ThreadLocal 原理了解吗? ThreadLocal 有什么用? 通常情况下,我们创建的变量是可以被任何一个线程访问并修改的。 如果想实现每一个线程都有自己的专属本地变量该如何解决呢? JDK 中自带的 ThreadLocal 类正是为了解决这样的问题

    2024年02月13日
    浏览(33)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包