7+共病思路。WGCNA+多机器学习+实验简单验证,易操作

这篇具有很好参考价值的文章主要介绍了7+共病思路。WGCNA+多机器学习+实验简单验证,易操作。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

今天给同学们分享一篇共病+WGCNA+多机器学习+实验的生信文章“Shared diagnostic genes and potential mechanism between PCOS and recurrent implantation failure revealed by integrated transcriptomic analysis and machine learning”,这篇文章于2023年5月16日发表在Front Immunol期刊上,影响因子为7.3。

7+共病思路。WGCNA+多机器学习+实验简单验证,易操作,知识图谱

多囊卵巢综合征(PCOS)是一种复杂的内分泌代谢紊乱疾病,影响着5-10%的生育年龄妇女。PCOS患者的子宫内膜存在改变的免疫细胞,导致慢性低度炎症,这是反复植入失败(RIF)的原因之一。

7+共病思路。WGCNA+多机器学习+实验简单验证,易操作,知识图谱

图1 整个设计的流程图

1. GEO信息

根据作者的纳入标准,共选择了四个数据集进行发现性分析:GSE10946、GSE34526、GSE103465和GSE111974。其中,GSE10946和GSE34526被用作PCOS的发现队列,而GSE103465和GSE111974被视为RIF的发现队列。此外,GSE80432和GSE26787分别是PCOS和RIF的验证队列。在本研究中,作者简称这两个疾病组为PCOS和RIF。

2. 差异基因的鉴定

在进行生物信息分析之前,作者测试了收集的数据集的批次效应,并发现两种疾病的批次效应明显(图2A,E)。使用“sva”软件包,作者去除了PCOS(图2B)和RIF组(图2F)的批次效应,以获得可靠的分析结果。然后使用LIMMA软件包对两组之间的差异表达基因(DEGs)进行表征。对于PCOS,获得了201个DEGs(P<0.05,|log2 FC|>0.585),其中101个上调基因和100个下调基因。对于RIF,有253个DEGs(adj. P<0.05,|log2 FC|>1),其中167个上调基因和86个下调基因。火山图显示了PCOS(图2C)和RIF(图2G)组的所有DEGs。总体而言,通过热图(图2D,H)可视化了这两组中包含的DEGs。与PCOS和RIF相关的DEGs可能在它们的发生和发展中起到一定作用。

7+共病思路。WGCNA+多机器学习+实验简单验证,易操作,知识图谱

图2 去除批次效应并在PCOS和RIF中识别差异表达基因(DEGs)

3.&nbsp;通过WGCNA筛选关键模块

为了调查疾病和关键基因是否相关,作者除了分析两组之间的差异表达外,还进行了WGCNA。使用软阈值方法,本研究构建了一个共表达网络。这个参数β对于共表达网络保持无标度拓扑结构至关重要。基于基因表达数据的生物网络很可能是无标度的。因此,在PCOS组中,拟合指数大于0.85被认为是无标度拓扑结构,β被设定为9(图3A)。通过使用邻接函数,生成了邻接矩阵。如图3B所示,使用TOM差异度量构建了层次聚类。作者总共确定了20个共表达模块。P<0.05的模块被视为关键模块。如图3C所示,antiquewhite4模块具有最强的正相关性,其中包含180个基因。同样,WGCNA也应用于RIF组,β=10是软功率的最佳值(图3D)。作者总共确定了19个模块,其中深灰色、深绿色和皇家蓝显示出强烈的正相关性,而绿黄色、鲑鱼色、深青色和浅黄色模块显示出强烈的负相关性(图3E,F)。在RIF组的这7个关键模块中的基因中,作者进一步选择了334个具有|MM| > 0.8和|GS| > 0.5的基因。这些来自两组关键模块的基因可能被用作候选的细胞特异性标记物。

7+共病思路。WGCNA+多机器学习+实验简单验证,易操作,知识图谱

图3 加权基因共表达网络分析(WGCNA)在多囊卵巢综合征(PCOS)和反复植入失败(RIF)中的应用

4.&nbsp;共享基因的分析和功能富集

为了探索多囊卵巢综合征(PCOS)和反复流产(RIF)的共同发病机制,作者分别取上述差异表达基因(DEGs)和WGCNA筛选的基因的交集。图4A显示了PCOS和RIF的DEGs之间的交集,共有11个基因(CHST11,FAM150B,GLIPR1,SLC16A6,MAMLD1,SLC46A2,ENPP3,HAPLN1,PLCXD3,FAM110C,GAS1)。WGCNA分析的基因中只有一个与之交集(CCND2,图4B)。作者推测这12个基因可能与PCOS和RIF的发病机制有关,并且存在共同关系(图4C)。通过对这些基因进行功能注释和富集分析(图4D,E),作者试图研究PCOS和RIF之间的潜在生物学变化。共享基因的GO分析显示它们在早期胚胎器官形态发生相关通路中过度表达。值得注意的是,在所有富集的GO术语中,作者注意到有几个显著富集的生物过程通路,例如调节T细胞凋亡过程、肥大细胞激活和白细胞稳态,这表明免疫细胞的激活和凋亡可能对PCOS和RIF的共同发病机制有着重要贡献。此外,KEGG富集结果与GO分析一致。另外,作者还注意到几个与卵泡发育相关的通路富集,例如p53信号通路、FOXO信号通路、Hippo信号通路和PI3K-Akt信号通路。

7+共病思路。WGCNA+多机器学习+实验简单验证,易操作,知识图谱

图4 PCOS和RIF之间的共享基因签名和功能富集

5.&nbsp;基于机器学习算法,识别潜在的共享诊断基因

为了进一步选择具有显著特征值以区分疾病组和对照组的最佳诊断基因靶点,作者基于上述12个共享基因应用了三种不同的算法(LASSO、SVM-RFE和随机森林)。在PCOS组中,根据LASSO系数曲线和最佳调参选择图,将λ设定为0.06851194(PCOS)(图5A)。随后,找到了8个具有非零系数的基因。然后,作者将上述12个基因输入RF分类器,并在重要性尺度上显示了前10个基因。作者选择了0.9作为重要性筛选阈值,并确定了一组包含9个基因的集合(图5B)。此外,SVM算法确定了5个具有最低5点交叉验证误差和最佳5点交叉验证准确性的基因(图5C)。通过将这三种算法重叠,作者确定了5个共享生物标志物(CHST11、GLIPR1、SLC16A6、MAMLD1、HAPLN1、GAS1)用于PCOS组(图5D,I)。

7+共病思路。WGCNA+多机器学习+实验简单验证,易操作,知识图谱

图5 使用三种机器学习算法筛选候选的PCOS和RIF诊断基因

同样地,当使用LASSO算法将λ设置为0.03001025时,作者得到了7个特征基因,用于RIF组(图5E)。图5F显示了重要性排名前10的基因,作者选择了9个基因(重要性>0.9)作为RM结果。接下来,使用SVM-REF算法确定了10个中心基因子集(图5G)。然后,通过三种算法获得的7个共同基因标志物重叠(图5H,I)。

6.&nbsp;诊断中心生物标志物的诊断价值和验证

为了更准确地了解多囊卵巢综合征(PCOS)和反复植入失败(RIF)之间的关系,作者对PCOS和RIF群体的机器学习结果进行了交集分析,并得到了2个共享的诊断基因,GLIPR1和MAMLD1(图6A)。通过分析这两个基因的表达模式,评估了共享诊断基因的预测和鉴别能力。此外,还进行了受试者工作特征曲线(ROC曲线)的分析。

7+共病思路。WGCNA+多机器学习+实验简单验证,易操作,知识图谱

图6 选择和验证两个共享的诊断基因

首先,作者分析了两个发现队列中PCOS和RIF的表达水平。图6B显示GLIRP1在RIF组中较低(P<0.01),在PCOS组中较高(P<0.01)。MAMLD1在PCOS组(P<0.01)和RIF组(P<0.0001)中均表达较低(图6F)。

接下来,为了测试这两个目标基因在两种疾病诊断中的特异性和敏感性,作者进行了ROC分析。在多囊卵巢综合征生物标志物方面,这两个基因的结果是有利的:GLIPR1(AUC=0.812)和MAMLD1(AUC=0.774)。RIF组也经过了相同的ROC分析。每个生物标志物的预测性能都很强:GLIPR1(AUC=0.723)和MAMLD1(AUC=0.879)(图6C,G)。

此外,作者通过进行外部验证,确认了GLIPR1和MAMLD1作为多囊卵巢综合征(PCOS)和反复流产(RIF)的核心诊断基因的可靠性。在两个验证组中,这两个关键基因的表达水平与发现组相匹配。GLIPR1在RIF组中降低(P<0.05),在PCOS组中增加(P<0.05)(图6D)。MAMLD1在PCOS组(P<0.01)和RIF组(P<0.05)中均减少(图6H)。图6E显示,GLIPR1在PCOS验证队列中具有出色的诊断准确性(AUC=1.000),在RIF验证队列中也具有良好的诊断准确性(AUC=0.920)。同样,MAMLD1也能正确诊断PCOS(AUC=1.000)和RIF(AUC=0.840)(图6I)。因此,结果证实了它们作为PCOS和RIF的关键鉴别分子的能力。

7.&nbsp;诊断基因的单基因GSEA

随后,作者分别在PCOS和RIF数据集中使用单基因GSEA分析了这两个生物标志物,并使用“GSEA”软件包可视化了前5个上调和下调的通路。图7显示,在这两个疾病组中,这两个基因都参与了代谢通路,如甘氨酸、丝氨酸、苏氨酸代谢、α-亚麻酸代谢和丙酸代谢。此外,这两个基因还富集在与炎症相关的通路中,将PCOS和RIF联系在一起。

7+共病思路。WGCNA+多机器学习+实验简单验证,易操作,知识图谱

图7 单个诊断基因的GSEA(A,B)

8. 免疫浸润分析

考虑到多囊卵巢综合征(PCOS)和反复植入失败(RIF)都具有高免疫反应的特点。作者使用CIBERSORT分析了不同组别中免疫细胞的丰度。在每个组别中,22种免疫细胞的比例以条形图的形式展示。总体而言,条形图清楚地显示了PCOS(图8A)和RIF(图8E)之间T细胞、巨噬细胞和NK细胞群体百分比之间的显著差异。与对照样本相比,PCOS样本中的活化树突状细胞增加了(图8B)。而在RIF样本中,休息的NK细胞、巨噬细胞M0增加,γδT细胞和活化树突状细胞减少(图8F)。

7+共病思路。WGCNA+多机器学习+实验简单验证,易操作,知识图谱

图8 PCOS和RIF免疫细胞组成

9.&nbsp;在人体组织中通过RT-PCR验证GLIPRand MAMLD的有效性

对正常女性和多囊卵巢综合征(PCOS)患者的卵泡液颗粒细胞以及健康和反复流产(RIF)女性的子宫内膜组织进行了RT-PCR检测。这证实了两个诊断生物标志物GLIPR1和MAMLD1的基因表达水平。与数据分析一致,作者的结果显示,PCOS患者的颗粒细胞中GLIPR1的表达上调,而MAMLD1的表达下调(图9A),而RIF患者的子宫内膜组织中GLIPR1和MAMLD1的表达均减少(图9B)。

7+共病思路。WGCNA+多机器学习+实验简单验证,易操作,知识图谱

图9 在人体组织中验证RT-PCR

总结

总之,诊断生物标志物GLIPR1和MAMLD1被确定为关键生物标志物,负责调节由TCA循环代谢物失衡引起的免疫细胞激活。作者的分析加强了PCOS患者反复流产的共病发病理论基础。文章来源地址https://www.toymoban.com/news/detail-730640.html




到了这里,关于7+共病思路。WGCNA+多机器学习+实验简单验证,易操作的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 验证码滑块识别算法 100% 识别 思路简单(附算法 python 代码)

      最开始的识别思路是通过模板来找到这个验证码的滑块图像所在的位置,但是使用下来发现准确率在90%左右一起提不上去,无论怎么优化都无法提高,后来发现了一个奇特的思路可用完美解决这个验证码的问题,思路写在了代码里面,最后返回的结果是需要移动的滑块的左

    2024年02月19日
    浏览(39)
  • 通用操作接口UMI:如何快速简单地给机器人提供更多学习数据?

    论文标题: Universal Manipulation Interface: In-The-Wild Robot Teaching Without In-The-Wild Robots 论文作者: Cheng Chi , Zhenjia Xu , Chuer Pan, Eric Cousineau, Benjamin Burchfiel, Siyuan Feng, Russ Tedrake, Shuran Song 项目地址: https://umi-gripper.github.io/ 导读: 斯坦福团队提出通用操纵接口(UMI)通用框架,可以直接

    2024年04月12日
    浏览(34)
  • 【深度学习】实验04 交叉验证

    交叉验证是一种评估和选择机器学习模型性能的常用方法。它将数据集划分为训练集和验证集,并重复多次进行模型训练和性能评估,以获取更稳定和可靠的模型评估结果。 1.自定义划分 2.K折交叉验证 K-fold交叉验证是一种经典的模型选择方法,它主要用于评估机器学习模型

    2024年02月11日
    浏览(41)
  • 评价机器学习模型的思路

    这个标题不够严谨,不同业务领域下的模型,没有可比性。因此,应当增加一定的限定条件,才能对机器学习的模型进行比较。 当前可行的限定条件,如下: 模型 模型结构 参数的数量 训练算法 训练时长 数据 训练数据集 验证数据集 数据质量 基础平台 训练平台 硬件 软件

    2024年02月04日
    浏览(29)
  • 【笔记】【机器学习基础】交叉验证

    交叉验证(cross-validation) 是一种 评估泛化性能 的统计学方法,它比单次划分训练集和测试集的方法更加稳定、全面。在交叉验证中,数据被多次划分,并且需要训练多个模型。 最常用的交叉验证是 k 折交叉验证(k-fold cross-validation) ,其中 k 是由用户指定的数字,通常取

    2024年02月03日
    浏览(31)
  • 机器学习入门教学——交叉验证

    1、简介 交叉验证是在机器学习 建立模型和验证模型参数 时常用的办法,一般被用于评估一个机器学习模型的表现。更多的情况下,我们也用交叉验证来进行模型选择。 【注】在训练模型时,为了提高模型的质量,我们会将数据集划分为训练集、验证集和测试集。其中测试

    2024年02月09日
    浏览(39)
  • 4、机器学习的模型验证

    测量模型的性能,以便测试和比较备选方案。 本课程所需数据集夸克网盘下载链接:https://pan.quark.cn/s/9b4e9a1246b2 提取码:uDzP 你已经建立了一个模型,但是这个模型有多好? 在这节课中,你将学习如何使用模型验证来衡量模型的质量。衡量模型质量是迭代改进模型的关键。

    2024年01月19日
    浏览(27)
  • 机器学习 --- 模型评估、选择与验证

    Java实训代码、答案,如果能够帮到您,希望可以点个赞!!!   如果有问题可以csdn私聊或评论!!!感谢您的支持 第1关:为什么要有训练集与测试集 1、下面正确的是?( D ) A、将手头上所有的数据拿来训练模型,预测结果正确率最高的模型就是我们所要选的模型。 B、

    2024年03月18日
    浏览(45)
  • 实验三 HBase的安装与简单操作

    安装和配置hbase数据库 熟悉hbase中相关的shell命令 centOS 8 hadoop-3.2.3 JDK版本: 1.8 HBase版本: 2.4.12 下载HBase 去官网下载hbase的安装包,然后将安装包上传到虚拟机上 解压 注意需要切换到root用户下,方便操作 修改名字 配置 (1)修改 /etc/profile 增加 保存后退出,最后 source /etc/profile (2)修改

    2024年02月06日
    浏览(33)
  • 机器学习笔记 - 学习图像生成模型在医疗行业用例的思路

            合成图像生成是使用算法或模拟来替换真实世界数据创建新图像的过程。         与数据隐私、有限的数据可用性、数据标签、无效的数据治理、高成本以及对大量数据的需求相关的挑战正在推动使用合成数据来满足各行各业对人工智能解决方案的高需求。

    2024年02月09日
    浏览(51)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包