糖尿病预测模型-Pima印第安人数据集-论文_企业科研

这篇具有很好参考价值的文章主要介绍了糖尿病预测模型-Pima印第安人数据集-论文_企业科研。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

糖尿病概述

糖尿病有一型和二型,是由于胰腺分泌胰岛素紊乱或人体无法有效利用其产生的胰岛素而发生的一种慢性疾病,是21世纪人类面临的健康问题之一.糖尿病伴有弥漫性并发症,其包括心血管病变、肾脏疾病、高血压、中风等、眼部疾病、下肢截肢上百种,由此增加了过早死亡的风险.因此,糖尿病防治形势十分严峻.

下右图为糖尿病视网膜病变

糖尿病预测模型-Pima印第安人数据集-论文_企业科研

2019年估算中国糖尿病患病率排名世界第二

糖尿病预测模型-Pima印第安人数据集-论文_企业科研

中国糖尿病患者数量位居世界第一。中国是糖尿病最大药物研发市场。越来越多年轻人也加入糖尿病市场,成为药企摇钱树。

糖尿病预测模型-Pima印第安人数据集-论文_企业科研

下图为中国糖尿病患病率历史数据

糖尿病预测模型-Pima印第安人数据集-论文_企业科研

糖尿病给经济带来巨大负担
糖尿病也给经济带来了巨大的负担,每年诊断出的糖尿病成本约为 3270 亿美元,而未确诊的糖尿病和前驱糖尿病的总成本接近 4000 亿美元。

糖尿病预测模型-Pima印第安人数据集-论文_企业科研

糖尿病可预防

虽然糖尿病无法治愈,但减肥、健康饮食、积极运动和接受药物治疗等策略可以减轻这种疾病对许多患者的危害。早期诊断可以改变生活方式和更有效的治疗,使糖尿病风险预测模型成为公共和公共卫生官员的重要工具。

糖尿病致病因子多样化
虽然有不同类型的糖尿病,但 II 型糖尿病是最常见的形式,其患病率因年龄、教育程度、收入、地点、种族和其他健康的社会决定因素而异。这种疾病的大部分负担也落在社会经济地位较低的人身上。
本实验就是通过建立人工智能机器学习模型,预测糖尿病概率和挖掘糖尿病重要致病因子。

糖尿病建模数据集介绍
糖尿病数据集来源Pima印第安人糖尿病数据集。数据集包含769条数据,9个变量。变量如下:妊娠, 血糖,血压,皮肤厚度,胰岛素,BMI,糖尿病系统功能,年龄,是否为糖尿病患者。


本研究的实验数据来自 UniversityofCalifornia,UGI机器学习数据库中的 PimaIndianDiabetes数据集,其研究对象是亚利桑那州凤凰城附近的皮马印第安人.该数据集共有768条数据项,包含8个医学预测变量和1个结果变量,其具体属性包括:怀孕次数(Pregnancies)、血糖浓度(Glucose)、年龄(Age)、血压(BloodPressure)、肱三头肌皮脂厚度(SkinThickness)、胰岛素含量(Insulin)、身体质量指数(BMI)、糖尿病遗传系数(DiabetesPedigreeFunction)和 结 果(Outcome,1代 表 患 糖 尿 病,0代 表 未 患 糖 尿 病).在PimaIndianDiabetes数据集中,Outcome为1的有268例,即为糖尿病患者人数;Outcome为0的有500例,即为未患有糖尿病的人数.

糖尿病预测模型-Pima印第安人数据集-论文_企业科研

模型价值和意义

通过我们建立的人工智能机器学习预测模型,可实现以下一些研究问题:
1.模型能准确预测个人是否患有糖尿病。
2.模型能挖掘哪些风险因素最能预测糖尿病风险。
3.我们能使用风险因素的一个子集来准确预测一个人是否患有糖尿病。
4.我们可以使用筛选几个重要糖尿病致病特征,然后组合创建为一个简短的问题,以准确预测某人是否可能患有糖尿病或是否有糖尿病的高风险。

糖尿病预测模型-Pima印第安人数据集-论文_企业科研

传统集成树算法虽然比决策树性能更优,但性能仍有改进空间。

糖尿病预测模型-Pima印第安人数据集-论文_企业科研

型采用新一代对称树算法,有效降低过度拟合,提高模型预测速度和预测能力。

糖尿病预测模型-Pima印第安人数据集-论文_企业科研

糖尿病预测模型性能优秀,ROC大于0.84。

糖尿病预测模型-Pima印第安人数据集-论文_企业科研

通过描述性统计,我们观察匹马印第安糖尿病数据集变量直方图:BMI,血压,血糖三个变量呈现明显正态分布。

糖尿病预测模型-Pima印第安人数据集-论文_企业科研

所有变量数据缺失率为0,是良好科研建模数据集。

糖尿病预测模型-Pima印第安人数据集-论文_企业科研

变量相关性热力图显示:血糖,BMI,年龄与糖尿病有高度相关性。

糖尿病预测模型-Pima印第安人数据集-论文_企业科研

通过数据挖掘,我们得到匹马印第安数据集中变量重要性排序。

糖尿病预测模型-Pima印第安人数据集-论文_企业科研

模型启示录1
血糖-控制含糖量高的食品摄入,例如白糖,奶茶,糖果,零食。

糖尿病预测模型-Pima印第安人数据集-论文_企业科研

模型启示录2

BMI-控制体重,适当锻炼

糖尿病预测模型-Pima印第安人数据集-论文_企业科研

人工智能让生活更美好!

糖尿病预测模型-Pima印第安人数据集-论文_企业科研

AI机器学习建模Pima印第安人糖尿病数据集-论文

版权声明:文章来自公众号(python生物信息学),未经许可,不得抄袭。遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。文章来源地址https://www.toymoban.com/news/detail-494408.html

到了这里,关于糖尿病预测模型-Pima印第安人数据集-论文_企业科研的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 大数据分析案例-基于Adaboost算法构建糖尿病预测模型

    🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 喜欢大数据分析项目的小伙伴,希望可以多多支持该系列的其他文章 大数据分析案例合集

    2024年02月06日
    浏览(41)
  • 大数据分析案例-基于LightGBM算法构建糖尿病确诊预测模型

    🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 喜欢大数据分析项目的小伙伴,希望可以多多支持该系列的其他文章 大数据分析案例合集

    2024年02月11日
    浏览(36)
  • 《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

    进入21世纪,生命科学特别是基因科技已经广泛而且深刻影响到每个人的健康生活,于此同时,科学家们借助基因科技史无前例的用一种全新的视角解读生命和探究疾病本质。人工智能(AI)能够处理分析海量医疗健康数据,通过认知分析获取洞察,服务于政府、健康医疗机构

    2023年04月09日
    浏览(40)
  • MLOps-预测糖尿病示例

    MLOps是一门工程学科,旨在统一 ML 系统开发(dev)和 ML 系统部署(ops),以标准化过程生产高性能模型的持续交付。实现 MLOps 有助于使机器学习工作负载可靠且可重现。 例如,你将能够在始终将模型保留在生产环境中时根据需要监视、重新训练和重新部署模型。 设置:为解

    2024年02月11日
    浏览(24)
  • 机器学习实战6-糖尿病疾病的预测与分析(随机森林算法)

    大家好,我是微学AI,今天给大家介绍一下机器学习实战6-糖尿病疾病的预测与分析(随机森林算法),糖尿病是一种常见的慢性代谢性疾病,由于生活方式及基因等因素的影响,全球范围内糖尿病患者人数不断增加。预测糖尿病的发生有助于早期筛查和干预治疗,以降低糖尿

    2024年02月04日
    浏览(33)
  • 互联网加竞赛 基于机器学习与大数据的糖尿病预测

    🔥 优质竞赛项目系列,今天要分享的是 基于机器学习与大数据的糖尿病预测 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐! 🥇学长这里给一个题目综合评分(每项满分5分) 难度系数:3分 工作量:3分 创新点:4分 🧿 更多资料, 项目分享: https://gitee.com/dancheng-

    2024年01月16日
    浏览(31)
  • 计算机毕设 基于机器学习与大数据的糖尿病预测

    # 1 前言 🚩 基于机器学习与大数据的糖尿病预测 🥇学长这里给一个题目综合评分(每项满分5分) 难度系数:3分 工作量:3分 创新点:4分 本项目的目的主要是对糖尿病进行预测。主要依托某医院体检数据(处理后),首先进行了数据的描述性统计。后续针对数据的特征进行特

    2024年02月11日
    浏览(28)
  • 【阿旭机器学习实战】【36】糖尿病预测---决策树建模及其可视化

    【阿旭机器学习实战】系列文章主要介绍机器学习的各种算法模型及其实战案例,欢迎点赞,关注共同学习交流。 关注GZH: 阿旭算法与机器学习 ,回复:“ ML36 ”即可获取本文数据集、源码与项目文档 pregnant glucose bp skin insulin bmi pedigree age label 0 6 148 72 35 0 33.6 0.627 50 1 1 1

    2024年02月11日
    浏览(39)
  • 使用Keras构建分类问题的MLP神经网络——用于糖尿病预测

            大家好,我是带我去滑雪!          Keras 是一个用于构建和训练深度学习模型的高级 API,它基于 Python编写,并能够运行于 TensorFlow, CNTK, 或者 Theano 等深度学习框架之上。Keras简化了深度神经网络的构建流程,让用户能够更加简单、快速地搭建一个完整的深度学习模

    2024年02月05日
    浏览(31)
  • 【线性回归、岭回归、Lasso回归分别预测患者糖尿病病情】数据挖掘实验一

    任务描述:将“diabetes”糖尿病患者数据集划分为训练集和测试集,利用训练集分别结合线性回归、岭回归、Lasso回归建立预测模型,再利用测试集来预测糖尿病患者病情并验证预测模型的拟合能力。 具体任务要求如下: 搜集并加载“diabetes”患者糖尿病指数数据集。 定义训

    2024年02月07日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包