肿瘤科医师狂喜,15分RNA修饰数据挖掘文章

这篇具有很好参考价值的文章主要介绍了肿瘤科医师狂喜,15分RNA修饰数据挖掘文章。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Biomamba荐语

与这个系列的前面一些论文类似,这次给大家推荐的是一篇纯生物信息学数据挖掘的文章,换句话说,这又是一篇不需要支出科研经费(白嫖)的论文(当然,生信分析用的服务器还是得掏点费用的)。一般来说,纯数据挖掘、没有实验验证的文章影响因子普遍比有实验验证的文章低一些。尤其是肿瘤领域的TCGA数据挖掘,铺天盖地的1分、2分、3分的文章;大量的灌水导致了目前纯生信文章的影响因子贬值。更离谱的是,大家似乎都喜欢蹭热度,最近一窝蜂的研究单基因套路、细胞焦亡、铁死亡诸如此类的,现在恨不得把门捷列夫的元素周期表挨个都“死”一遍。一方面可能这些话题确实研究价值巨大,不过另一方面我个人不太喜欢这种趋之若鹜的follow。这次的这篇文章便是在去年各类“死亡”火热时另辟蹊径,通过RNA修饰研究结直肠癌(colorectal cancer,CRC)并发表影响因子高达15分的文章(Molecular Cancer),也许对各位临床工作人员会有些许的启发,愿大家都能冲出“ 低分陷阱”。
doi:
10.1186/s12943-021-01322-w

链接:
https://pubmed.ncbi.nlm.nih.gov/33557837/

Abstract

●1. RNA修饰

RNA表观修饰主要有m6A,m1A,alternative polyadenylation,adenosine-to-inosine RNA editing这四种,共涉及26种酶。

●2. 主要发现

通过对这些基因的无监督式聚类可将这26种基因分为两类并对样本进行分型。并创造了一种关联分析方法“WM_Score”,一方面来说可以将肿瘤与健康样本相区分;另一方面在肿瘤患者内部对肿瘤微环境、免疫应答等方面产生差异并影响患者的生存期。高WM_Score与低WM_Score类群之间在各类通路确实存在各类差异,因此可作为良好的诊断指标。

Introduction

●1. RNA修饰

CRC的地位及流行特征这里就不做重点介绍了,各位一定比我了解,这是目前是癌症死亡率中排第名二的杀手。目前,CRC已被证实与RAS-MAPK、WNT、PI3K等信号通路相关,但表观遗传学影响着免疫应答与CRC的病因学。而RNA修饰又是表观遗传学的重要组成部分,与CRC存在潜在联系(仍未被研究透彻)。这一区域的空白,将由这篇论文填写。

●2. 四种最常见的RNA修饰

RNA修饰的种类共有170种,本研究不可能涵盖所有,各类修饰之间也存在竞争性,而腺苷酸修饰是RNA修饰中最常见的,因此作者挑选了其中最主要的四种,并对这几种修饰过程与CRC之间做了关联研究。整理并研究了涉及这四种修饰过程中涉及的26种酶(下文统称为writer)。

●3. 免疫&RNA修饰

目前immune checkpoint blockade(ICB)疗法存在相应效率低下的问题,而RNA修饰与免疫反应、肿瘤免疫微环境具有潜在联系,因此“writer”的研究十分有必要。免疫功能素来与肿瘤的发生具有联系,与RNA修饰相关的网路图谱有待构建。

Results

●1. 基因及转录本差异

在确定writer的表达量对CRC的影响之前,首先应排除基因突变/序列差异带来的影响。经基因组序列确实发现ZC3H13、PCF11、KIAA1429在样本中的突变确实与生存期相关,并整理出突变类型、比例、分类、位置等信息如下图所示,不难看出,这些基因在人群中存在一定程度的突变。

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

不可否认的是,通过生存分析的确发现这些writer的突变对患者生存期具有显著影响:

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

不仅是突变,拷贝数变异(CNV)同样需要在表达量分析前被排除。CNV分析后发现CSTF1、CPSF1/4、ZC3H13、KIAA1429存在广泛的CNV。

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

在解析完结构变异后作者统计了26种writer基因的表达量在tumor与normal组中的表达量,其中多数writer在normal组中上调,并且多数上调基因伴随着cnv gain,这里可以初步证明CNV只是影响基因表达的因素之一,尤其是一些cnv loss的writer表达量也上升了,因此C****NV并不是决定性因素。RNA修饰在基因表达中也同样值得被研究。作者这里也交代的很清楚,基因结构方面的差异已经完完全全展示给大家,后面就该展示writer的表达量了。
肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

●2. writer表达量分群与免疫浸润

首先,这些writers在一千多个样本中的表达量能够通过非监督式的聚类被分为两种模式(727个cluster_1,968个cluster_2):

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

Cluter1与cluster2之间差异基因的的富集分析也显示出前者富集于stromal and carcinogenic activation,TGF-β singnaling pathway和cell adhension通路,而cluster2富集于proliferation and apoptosis,mismatch repair pathways等通路:

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

并且两种cluster在CRC的生存期上具有显著不同,cluster1患者的生存率更低,初步可以证明writer的变化会引起一些与肿瘤相关基因集的变化并且确实可以引起患者生存率的显著差异。

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

此处作者通过CIBERSORT软件(这一软件我们之前有花篇幅介绍过:什么?不做单细胞也能分析细胞类群和免疫浸润?)利用去卷积算法以对CRC中的免疫浸润情况进行打分,通过对support vector regression判断免疫细胞类型。发现其中一些writer与免疫细胞浸润密切相关:

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

其中M2 macrophage、Tregs、T follicular helper cells、T γδ cells在cluster1中更高;DCs、NKC、M1 Mac浸润在cluster2中更高。不难看出,cluster1浸润的免疫细胞主要是免疫抑制细胞,这可能是cluster1预后较差的原因之一,并且Mac的极化在免疫进程中十分重要:
肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

●3. 差异基因功能

作者对cluster1与cluster2之间进行组间差异分析,对得到的差异基因进行富集分析,发现通路主要集中于DNA replication、cell cycle、tRNA metabolic process、p53、Il-17等信号通路。

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

对这些差异基因分为两类cluster后,发现clusterA的预后性更差:

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

●4. WM_Score

为了考虑到数据集的异质性与复杂性,作者此处创建了一个“WM_Score”的概念,以帮助区分样本。这一分值在cluster1高于cluster2,证明WM_Score可以用来区分writer的状态,并且cluster.gene.A中的WM_Score要高于cluster.gene.B,即DEG是受到writer的影响并能够通过WN_Score来评估的,初步证明了WM_Score这一评分机制科学有效

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

将样本按VM_S高低进行分组后,免疫浸润情况也出现了此前cluster1、2之间的类似差异,再次证明了这一评分机制的准确性。

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

为了验证write聚类、gene聚类、WM_Score高低之间的一致性,作者对这些变量进行了交叉分析。韦恩图与柱状图也显示cluster_1/2,cluster_gene_A/B与VM评分具有较好的一致性,即WM_Score high能够对应Cluster_1及gene.cluser_A,反之亦然。

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

生存分析与风险评估(多元回归COX分析)也显示VM_S的划分对CRC预后存在影响(通过AUC曲线可判断WM_S的模型的拟合程度,一般0.50.7达标、0.70.8良好、0.8~1优秀):

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

COX回归分析通常与生存分析如影随形,可用于评估自变量对因变量的影响程度,并能够校正其他混杂因素。对连续数值型变量、离散型分类变量、顺序变量均可建模分析。取某一自变量系数为e的幂数,得到的值即为HR值(风险比例),当HR>1则为危险因素,当系数<1则为保护因素。即高WM_Score为风险因素,WM_Score低为保护因素

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

CRC具有四种亚型:CMS1-4,为了探寻VM_S是否能够帮助区分亚型分类,进行VM评分后发现在某些亚群之间具有显著差异(但在数据集之间重复性较差)。随着分期进程,WM_S逐渐攀升。(CMS4主要在晚期被诊断出)。

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

此外WM_S在,CRC诊断时的分期、转移与非转移之间也存在差异,这进一步证明WM_S与CRC的预后存在关系:

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

这时,又一个热度极高的分析出现了——miRNA。上文WM_S的评分对象仅为26个writer,为了探寻RNA转运、定位、翻译等转录后生物过程。作者整理出WM_S高低组的差异miRNA并整理网络关系如下,与此前结果相一致的是EMT、Apoptosis、Cell circle相关的基因通路依然能被富集到。也就是说,WM_Score发挥作用时,这些miRNA也逃不了干系

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

对于APA与A→I这两种修饰,在两个数据集间按照高低程度进行差异分析,APA依据长短,A→I根据发生频率,发现不同的修饰程度会影响生存曲线,但A→I通过RNA-Seq较难捕捉,可信度成疑。

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

●5. 在治疗应用方面得潜在贡献

作者建立了WM_S这一良好的评价指标,期望其能够用于指导临床治疗。利用GDSC进行药物敏感性预测,与WM_S进行相关性分析,其中24种药物敏感性与WM_S具有相关性,这些抑制剂与对应的通路相对应。如MEK inhibitor Selumetinib, mTOR inhibitor LJI308, EGFR inhibitor AZD3759。18种耐药性与WM_S相关, including cell cycle checkpoint kinase inhibitor AZZD7662, Bcl-2 inhibitor AZD5991。

与WM_S高组敏感性关联的通路包括 MAPK, mTOR, and VEGF signaling pathways.与WM_S低组敏感性关联的通路包括 apoptosis and cell cycle signaling pathway. 因此通过WM_S鉴别RNA修饰模式并预测敏感性用于临床具有指导意义

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

最后,作者聚焦于PD1疗法,证明WM_S高低在bladder cancer间具有生存差异,并且在四个分期之间具有明显不同,分期之间的比例也与此前CRC类似。随着免疫程度的上升,WM_呈现下降的趋势,最终在PD-L1疗法中,WM_S高组也无法收获较好的疗效。也就是说,WM_Score的上升在膀胱癌中也有助于“免疫逃逸”。

肿瘤科医师狂喜,15分RNA修饰数据挖掘文章,文献速递,其他,数据挖掘

总结

RNA修饰的研究其实也不算少,本文的亮点主要是通过大量的分析(八个数据集共1697个样本)评估了RNA腺苷酸修饰与CRC预后、治疗方案的潜在关系,并成功构建了WM_Score这一评分概念。经过多次的验证,我不由得觉得这26种writer理应被制作成芯片以快速得对CCR病人进行检测分型,从而起到个性化治疗的目的。因此,这篇推送我们会将这篇文章拆解开来,详细的转述一番,建议大家耐心看完,有必要时推荐阅读原文

如何联系我们

公众号后台消息更新不及时,超过48h便不允许回复读者消息,这里给大家留一下领取资料、免费服务(有root权限的共享服务器,你没有体验过的全新版本!)的微信号,方便各位随时交流、提建议(科研任务繁重,回复不及时请见谅)。此外呼声一直很高的交流群也建好了,欢迎大家入群讨论:永久免费的千人生信、科研交流群

大家可以阅读完这几篇之后添加
给生信入门初学者的小贴士
如何搜索公众号过往发布内容
文章来源地址https://www.toymoban.com/news/detail-681657.html

到了这里,关于肿瘤科医师狂喜,15分RNA修饰数据挖掘文章的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 基于逻辑回归构建肿瘤预测模型

    乳腺癌数据集包括569个样本,每个样本有30个特征值(病灶特征数据),每个样本都属于恶性(0)或良性(1)两个类别之一,要求使用逻辑回归(LR)算法建立预测模型,实现准确预测新的病灶数据的类型(恶性或良性)。 样本特征数据为病灶影像的测量数据,部分特征如下

    2023年04月14日
    浏览(39)
  • UNet-肝脏肿瘤图像语义分割

    目录 一. 语义分割 二. 数据集 三. 数据增强 图像数据处理步骤 CT图像增强方法 :windowing方法 直方图均衡化 获取掩膜图像深度 在肿瘤CT图中提取肿瘤 保存肿瘤数据  四. 数据加载 数据批处理 ​编辑​编辑 数据集加载   五. UNet神经网络模型搭建          单张图片预测图

    2024年02月04日
    浏览(87)
  • 开源的RNA-Seq分析软件Trinity的详细介绍和使用方法

    GitHub - trinityrnaseq/trinityrnaseq: Trinity RNA-Seq de novo transcriptome assembly Trinity是一种开源的RNA-Seq分析软件,用于转录组的de novo组装。转录组de novo组装是通过将RNA-Seq数据中的短序列片段(reads)重新组装成完整的转录本(transcript)的过程。 Trinity的主要功能和作用如下: 转录本组装

    2024年02月02日
    浏览(34)
  • 机器学习实验三:肿瘤预测(决策树)

            基于威斯康辛乳腺癌数据集,采用决策树的方法进行肿瘤预测。 【实验要求】 1.加载 sklearn 自带的威斯康星乳腺癌数据集,探索数据。 2.进行数据集分割。 3.配置决策树模型。 4.训练决策树模型。 5.模型预测。 6.模型评估。 7.参数调优。可以根据评估结果,对模

    2024年02月08日
    浏览(44)
  • PSP - 蛋白质与核酸(RNA\DNA)复合物结构预测 RoseTTAFoldNA 算法框架

    欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/134208615 Paper: Accurate prediction of nucleic acid and protein-nucleic acid complexes using RoseTTAFoldNA GitHub: RoseTTAFold2NA 蛋白质-核酸复合物 (Protein - Nucleic Acid Complexes),在生物学中发挥着关键作用。 尽管蛋白质

    2024年02月22日
    浏览(40)
  • geo读取表达矩阵 RNA-seq R语言部分(表达矩阵合并及id转换)

    geo读取表达矩阵 RNA-seq R语言 方法一:1.从geo页面直接下载表达矩阵,然后通过r读取表达矩阵 2.利用getgeo函数读取表达矩阵 3.利用geo自带的geo2r,调整p值为1,获取探针和基因名的对应关系 1 多个组别 合并 id转化 下载表达矩阵和getgeo函数联合使用 读取excel表达矩阵

    2024年02月15日
    浏览(41)
  • 生信小白学单细胞转录组(sc-RNA)测序数据分析——R语言

    10X单细胞转录组理论上有3个文件才能被读入R进行seurat分析,分别是barcodes.tsv 、 genes.tsv和matrix.mtx,文件barcodes.tsv 和 genes.tsv,就是表达矩阵的行名和列名 genes.tsv文件(有时也叫features.tsv文件) 文件内容:有两列,第一列为基因ID,第二列为基因Symbol ID,区分 各个基因 。 b

    2024年02月04日
    浏览(65)
  • MATLAB实现确定肿瘤的重要基因信息

    目录 一、问题重述 2 二、基本的模型假设 4 三、名词解释 4 四、符号化 4 五、模型的建立与求解 4 5.1 问题一的分析、建模与求解 4 5.1.2 问题一的模型建立 5 5.1.2.1 巴氏距离模型 5 5.1.2.2 理想基因模型 6 5.1.2.3 综合模型 7 5.1.3 问题一的模型求解 8 5.1.4 问题一的结果及分析 10 5.2

    2024年02月22日
    浏览(34)
  • BraTS 2021脑肿瘤分割数据集介绍

    脑肿瘤分割挑战赛(brain tumor segmentation challenge,BraTS Chanllenge)是国际医学图像计算和计算机辅助干预协会(Medical Image Computing and Computer Assisted Intervention Society,MICCAI)所有比赛中历史最悠久的,已经连续办了10年,是医学图像处理领域最热门的比赛之一。 2017年及之后的每届挑

    2024年02月04日
    浏览(63)
  • 论文推荐:基于联合损失函数的多任务肿瘤分割

    以FFANet为主干,加入分类的分支,将模型扩展为多任务图像分割框架,设计了用于分类和分割的联合损失函数。 1、FFANet和分割分支 FFANet作为骨干网络,作为对VoVNet的重新设计和优化,FFANet在骨干网中加入了残差连接,使VoVNet可以学习更多的特性。设计了一种特殊的特征融合

    2023年04月23日
    浏览(44)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包