《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

这篇具有很好参考价值的文章主要介绍了《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

大赛概况

进入21世纪,生命科学特别是基因科技已经广泛而且深刻影响到每个人的健康生活,于此同时,科学家们借助基因科技史无前例的用一种全新的视角解读生命和探究疾病本质。人工智能(AI)能够处理分析海量医疗健康数据,通过认知分析获取洞察,服务于政府、健康医疗机构、制药企业及患者,实现个性化,可以循证的智慧医疗,推动创新,实现价值。

心血管病、糖尿病等慢性疾病,每年导致的死亡人数占总死亡人数的80%,每年用于慢病医疗费用占中国公共医疗卫生支出的比例超过13%。作为一种常见慢性疾病,糖尿病目前无法根治,但却能通过科学有效的干预、预防和治疗,来降低发病率和提高患者的生活质量。阿里云联合青梧桐健康科技有限公司主办天池精准医疗大赛——人工智能辅助糖尿病遗传风险预测,希望用人工智能的方法和思想处理、分析、解读和应用糖尿病相关大数据,让参赛选手设计高精度,高效,且解释性强的算法来挑战糖尿病精准预测这一科学难题,为学术界和精准医疗提供有力的技术支撑,帮助我们攻克糖尿病。

糖尿病概述

我国有1.1亿人患有糖尿病,是世界上糖尿病患者最多的国家,每年用于糖尿病的医疗费用超过3000亿。糖尿病有一型和二型,是由于胰腺分泌胰岛素紊乱或人体无法有效利用其产生的胰岛素而发生的一种慢性疾病,是21世纪人类面临的健康问题之一.糖尿病伴有弥漫性并发症,其包括心血管病变、肾脏疾病、高血压、中风等、眼部疾病、下肢截肢上百种,由此增加了过早死亡的风险.因此,糖尿病防治形势十分严峻.

下右图为糖尿病视网膜病变

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

2019年估算中国糖尿病患病率排名世界第二

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

中国糖尿病患者数量位居世界第一。中国是糖尿病最大药物研发市场。越来越多年轻人也加入糖尿病市场,成为药企摇钱树。

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

下图为中国糖尿病患病率历史数据

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

糖尿病给经济带来巨大负担
糖尿病也给经济带来了巨大的负担,每年诊断出的糖尿病成本约为 3270 亿美元,而未确诊的糖尿病和前驱糖尿病的总成本接近 4000 亿美元。

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

糖尿病可预防

虽然糖尿病无法治愈,但减肥、健康饮食、积极运动和接受药物治疗等策略可以减轻这种疾病对许多患者的危害。早期诊断可以改变生活方式和更有效的治疗,使糖尿病风险预测模型成为公共和公共卫生官员的重要工具。

糖尿病致病因子多样化
虽然有不同类型的糖尿病,但 II 型糖尿病是最常见的形式,其患病率因年龄、教育程度、收入、地点、种族和其他健康的社会决定因素而异。这种疾病的大部分负担也落在社会经济地位较低的人身上。
本实验就是通过建立人工智能机器学习模型,预测糖尿病概率和挖掘糖尿病重要致病因子。

糖尿病建模数据集介绍

糖尿病数据集来源《天池精准医疗大赛——人工智能辅助糖尿病遗传风险预测》的糖尿病数据集。数据集包含六千多条数据,41个变量。变量包括:性别    年龄    体检日期    天门冬氨酸氨基转换酶    丙氨酸氨基转换酶    碱性磷酸酶    r-谷氨酰基转换酶    总蛋白    白蛋白    球蛋白    白球比例    甘油三酯    总胆固醇    高密度脂蛋白胆固醇    低密度脂蛋白胆固醇    尿素    肌酐    尿酸    乙肝表面抗原    乙肝表面抗体    乙肝e抗原    乙肝e抗体    乙肝核心抗体    白细胞计数    红细胞计数    血红蛋白    红细胞压积    红细胞平均体积    红细胞平均血红蛋白量    红细胞平均血红蛋白浓度    红细胞体积分布宽度    血小板计数    血小板平均体积    血小板体积分布宽度    血小板比积    中性粒细胞%    淋巴细胞%    单核细胞%    嗜酸细胞%    嗜碱细胞%。变量主要为血常规检测指标。

《天池精准医疗大赛——人工智能辅助糖尿病遗传风险预测》的糖尿病数据集一览如下图

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

通过对病人的临床数据和体检指标来预测其血糖值。 大赛提供的训练数据包含病人的性别、体检日期以及血常规、肾功能检查等指标, 每个指标分别作为一个字段储存在数据表中。最后一列为我们要预测的血糖值。

模型价值和意义

通过我们建立的人工智能机器学习预测模型,可实现以下一些研究问题:
1.模型能准确预测个人血糖值高低。
2.模型能挖掘哪些风险因素最能预测糖尿病风险。
3.我们能使用风险因素的一个子集来准确预测一个人血糖值高低。
4.我们可以使用筛选几个重要糖尿病致病特征,然后组合创建为一个简短的问题,以准确预测某人是否可能患有糖尿病或是否有糖尿病的高风险。

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

老规矩,不要急着建模,先做描述性统计,投石问路。

变量相关性分析热力图如下,相关性高的变量有很多,例如血小板比积和血小板计数相关性高于0.9.

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

绘制变量的小提琴图如下

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

来看看血糖变量的小提琴图

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

变量散点图如下

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

为了更好观察变量分布,我们绘制变量的直方图如下,年龄等多个变量呈现正态分布。

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

我方模型质量较好,MAE 0.6863658764353456,非常低。MAE是评估机器学习回顾模型的主要指标,该值越低越好,反之亦然。

我方模型挖掘变量重要性排序如下,我们发现年龄,甘油三酯,r-谷氨酰基转换酶,性别,红细胞体积分布宽度为主要变量。

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

拔出萝卜带出泥,我们来观察变量的定量分析。

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

年龄越大,糖尿病风险越高年龄越小,糖尿病风险越小。当然会有例外,我们这里分析的是主要趋势,不是个例。人体器官是注定会不断老化的,我们虽然不能阻止老化.但有养生之道延缓老化速度我经常锻炼身体的体育馆看到一些老人80岁+,看起来肌肉仍有轮廓,外表像60-70岁。
 

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

甘油三酯越大,糖尿病风险越高,甘油三酯越小,糖尿病风险越小。
 

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

血清甘油三酯的正常参考值:0.45~1.69mmol/L。依据2007年《中国成人血脂异常防治指南》地划分标准,空腹 (禁食12小时)甘油三酯在1.70mmol/L以下为适当水平;1.70-2.25mmol/L为边缘升高;≥2.26mmol/L为升高。

我们吃的食物中有很多东西就有甘油三酯,例如植物油,肉,含糖高饮品和食物。甘油三酯高不能喝酒,饮酒会加重甘油三酯进一步升高或诱发急性胰腺炎。

Toby老师提醒一下甘油三酯并非完全负面,它也有许多作用,具体作用如下。
第一、储存能量。它可以给人体提供热量,脂肪被燃烧后形成二氧化碳和水,释放热量,它是人体供能的重要部分,是人体所需的基础营养物质,能够被人体充分吸收代谢。
第二、增加各种营养物质的吸收能力。甘油三酯能够促进人体对于维生素、氨基酸等营养物质的吸收,维持人体的营养平衡,各种脂溶性维生素的吸收,都需要甘油三酯的帮助。人体的神经系统,尤其是脑部的神经敏感性,需要甘油三酯的帮助。
第三,保温作用。我们人体皮肤下面沉积较厚的脂肪层,越是寒冷的冬天脂肪层越厚,有利于保温御寒。
第四,保护重要器官。人体重要器官的表面都有厚厚的脂肪层覆盖,这些油脂就是用来保护脏器,免受外力伤害,同时在剧烈运动或者撞击中起到减震作用。

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

甘油三酯超量坏处
当我们的饮食过好、过多,吃进去的甘油三酯无法消耗完,人就会逐渐地变胖,血脂就会升高。甘油三酯升高后会有以下坏处:
一、导致胰岛素抵抗,诱发糖尿病。人体内甘油三酯积蓄过多,除了发胖之外,还会造成胰岛素不敏感,出现胰岛素抵抗,就会诱发糖尿病、冠心病、脑梗塞等。
二、诱发急性胰腺炎。如果体内的甘油三酯超过了5.6mmol/L时,非常容易诱发急性胰腺炎。

我们再来看看r-谷氨酰转移酶和糖尿病关系

如下图趋势:r-谷氨酰转移酶越高,糖尿病风险越高。

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

r-谷氨酰转移酶升高一般出于下面场景:

(1)胆道阻塞性疾病:原发性胆汁性肝硬化、硬化性胆管炎等所致的慢性胆汁淤积,肝癌时由于肝内阻塞,诱使肝细胞产生多量GGT同时癌细胞也合成GGT均可使GGT明显升高,可达参考值上限的10倍以上。此时GGT、ALP、5-核苷酸酶(5-NT)、亮氨酸氨基肽酶(LAP)及血清胆红素呈平行增加。
(2)急、慢性病毒性肝炎、肝硬化:急性肝炎时,GGT呈中等度升高;慢性肝炎、肝硬化的非洁动期,酶活性正常,若GGT持续升高,提示病变洁动或病情恶化。
(3)急、慢性酒精性肝炎、药物性肝炎:GGT可呈明显或中度以上升高(300~1000UL),ALT和AST仅轻度增高,甚至正常。酗酒者当其戒酒后GGT可随之下降。
(4)其他:脂肪肝、胰腺炎、胰腺肿瘤、前列腺肿瘤等GGT亦可轻度增高。

r-谷氨酰转移酶主要临床参考意义在肝脏。随着建模和数据挖掘,我们发现r-谷氨酰转移酶和血糖值也有一定联系。

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

在参考论文:r-谷氨酰转移酶VS 糖尿病,观察性研究中,高水平的血清 γ-谷氨酰转移酶 (GGT) 与前驱糖尿病和 2 型糖尿病的风险增加有关。

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

在美国NCBI发表文章显示:测量 2 型糖尿病患者 FDR 中的 GGT 可能有助于评估糖尿病风险;长期高 GGT 的人应被视为糖尿病的高危人群。

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

我们再来看看性别和糖尿病关系。我们把“男”替换为0,“女” 替换为1,缺失替换为0。从下图分析中,我们观察到男性患糖尿病风险更高。

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

According to the Centers for Disease Control and Prevention (CDC) , men are more likely to receive a diagnosis of diabetes than women. However, some research suggests that women with diabetes may be more likely to develop complications than men.
Toby老师从美国疾控中心查找一些辅助证明材料。美国疾病控制和预防中心 (CDC) 的数据显示:男性比女性更容易被诊断为糖尿病。然而,一些研究表明,患有糖尿病的女性可能比男性更容易出现并发症。
男性比女性更容易患上2 型糖尿病。一个原因是男性在他们的腹部储存了更多的脂肪——这是一个已知的风险因素。患有未确诊糖尿病的男性多于女性

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

Toby老师在其他糖尿病数据集实验中,发现不同算法得到结论不一样,有的算法认为性别变量很重要,有的算法认为不重要。Toby老师认为性别变量还需要更多数据科学实验观察和临床观察。此变量还有争议,不要急着下结论。

通过对天池糖尿病建模和数据挖掘后,我们得到很多高价值信息。

糖尿病是潘多拉魔盒,血糖异常后,五脏六腑都可能受到影响。通过此次建模,我们挖掘出糖尿病相关重要因子:年龄,甘油三酯,r-谷氨酰转移酶,性别等等。
不足的是此数据集变量有限,糖尿病其它重要相关变量还包括BMI指数。
Toby老师提醒一下,数据挖掘结果要和专业医生临床经验交叉验证。我这次数据挖掘结果和诸多权威机构发布数据结论是一致的,参考价值非常高。

模型启示录1-控制甘油三脂含量。

控制甘油三酯方法为多运动,用餐八分饱,控制糖类食物摄入量。

模型启示录2

年龄-适当锻炼,让身体更年期

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

模型启示录3-定期体检,观察r-谷氨酰转移酶指标

如果r-谷氨酰转移酶指标值过高,需要警惕和随访医生。

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

糖尿病可防可控,从预防做起,可限制降低糖尿病患病概率,减少政府医疗开支负担。

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

如果您们对糖尿病模型项目感兴趣,欢迎各大医疗机构,科研机构,生物医药企业留言。

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

人工智能让生活更美好!

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文

版权声明:文章来自公众号(python生物信息学),未经许可,不得抄袭。遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
 


 文章来源地址https://www.toymoban.com/news/detail-406705.html

到了这里,关于《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 医疗机器人与手术:人工智能如何改变医疗手术方式

    作者:禅与计算机程序设计艺术 随着科技的进步和发展,医疗行业也在迅速转型,通过电子化手术等技术实现对患者身体的更精准治疗。而传统的手术过程仍然存在很多不足之处,比如时间长、效率低、易出错、费用高等问题。因此,人工智能(Artificial Intelligence, AI)技术加

    2024年02月07日
    浏览(22)
  • 人工智能与医疗影像的互动与融合

    2023年08月22日
    浏览(27)
  • 人工智能与人类智能的差异:如何在医疗领域实现革命

    人工智能(Artificial Intelligence, AI)和人类智能(Human Intelligence, HI)是两个不同的概念。人工智能是指人类创造的计算机程序和机器人具有一定程度的智能和自主性,能够进行一定的思考和决策。人类智能是指人类自然具备的智能和认知能力,包括感知、思考、决策、学习等。

    2024年02月02日
    浏览(24)
  • 如何使用AIGC人工智能辅助开发?

    🎉欢迎来到AIGC人工智能专栏~如何使用AIGC人工智能辅助开发? ☆* o(≧▽≦)o *☆嗨~我是IT·陈寒🍹 ✨博客主页:IT·陈寒的博客 🎈该系列文章专栏:AIGC人工智能 文章作者技术和水平有限,如果文中出现错误,希望大家能指正🙏 📜 欢迎大家关注! ❤️ 在人工智能时代,

    2024年02月11日
    浏览(17)
  • 人工智能在医疗健康领域的应用与发展

    人工智能在医疗健康领域的应用与发展 一、引言 近年来,人工智能(AI)技术的飞速发展已经在多个领域展现出其巨大潜力。医疗健康领域也不例外,人工智能的应用正在逐步改变我们的医疗方式,提升医疗效率,使患者得到更好的治疗体验。本文将探讨人工智能在医疗健康

    2024年02月07日
    浏览(20)
  • AIGC人工智能辅助开发:提升效率、优化代码、实现智能编程

    导语:随着人工智能的快速发展,越来越多的领域开始尝试将AI技术应用于开发过程中。AIGC(Artificial Intelligence for General Coding)是一种基于人工智能的辅助开发技术,它能够帮助开发者提升开发效率、优化代码质量,并实现智能编程。本文将介绍如何用好AIGC人工智能辅助开发

    2024年02月14日
    浏览(18)
  • 基于神经进化算法的人工智能:实现高效和精准的决策和预测

    作者:禅与计算机程序设计艺术 引言 1.1. 背景介绍 人工智能(AI)是近年来高速发展的领域之一,各种机器学习、深度学习、神经网络等算法逐渐被广泛应用于各个领域。在这些算法中,神经进化算法(Neural Evolutionary Algorithm,NEA)因其独特的魅力和高效性逐渐受到关注。

    2024年02月06日
    浏览(22)
  • 人工智能:人脸识别技术在医疗领域中的应用

    作者:禅与计算机程序设计艺术 人工智能(Artificial Intelligence,AI)已经逐渐成为当今的热点词汇。近年来,随着人工智能技术的不断进步,尤其是生物识别、图像处理、语音理解等领域取得重大突破,人工智能在医疗领域也逐渐走向成熟。目前,我国医疗卫生行业已经进入

    2024年02月08日
    浏览(19)
  • 人工智能与医疗保健:如何利用人工智能解决医疗领域中的数据问题

    作者:禅与计算机程序设计艺术 随着互联网的飞速发展,现代社会信息化程度越来越高,各行各业都在不断向数字化转型。人工智能(AI)与医疗保健产业密切相关,应用场景丰富且多变。但是,如何更好地运用人工智能技术处理医疗保健数据,提升医疗服务质量,也是当前

    2024年02月07日
    浏览(18)
  • 探索人工智能在健康数据分析中的新领域:智能医疗咨询

    作者:禅与计算机程序设计艺术 随着全球数字化进程的加快、互联网行业的蓬勃发展、数字健康产品和服务的不断涌现,人工智能(AI)作为一种高技术含量的新兴产业正在引爆全新的经济增长点。而如何利用人工智能技术帮助医疗机构进行健康管理,则是一个亟待解决的问

    2024年02月07日
    浏览(23)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包