原创:CSDN/知乎:川川菜鸟
问题描述
阿尔茨海默病的临床前阶段,也称为轻度认知障碍(MCI),是正常和严重之间的过渡状态。由于患者及家属对疾病的认知有限,67%的患者被诊断为中重度,已错过最佳干预阶段。因此,早期准确诊断阿尔茨海默病和轻度认知障碍具有重要意义
所附数据包含在不同时间点(一个时间点为一个量)收集的 4850 名认知正常老年人(CN)、1416 名主观记忆主诉患者(SMC)、2968 名早期轻度认知障碍患者(EMCI)、5236 名晚期轻度认知障碍患者(LMCI)和 1738 名阿尔茨海默病患者(AD)的具体信息特征。请利用附录中提供的不同类别人群的大脑结构特征和认知行为特征,构建阿尔茨海默病识别模型,设计智能诊断方法,准确诊断阿尔茨海
默病。
说明文档原文:
https://adni.loni.usc.edu/wp-content/uploads/2013/09/DOD-ADNI-PM-12.7.12-FINAL.pdf
任务
- 对所附数据的特征指标进行预处理,考察数据特征与阿尔茨海默病诊断的相关性。
- 利用附带的结构脑特征和认知行为特征,设计阿尔茨海默病的智能诊断。
- 首先,将 CN、MCI 和 AD 分成三大类。然后,对于 MCI 中包含的三个子类(SMC、EMCI 和 LMCI ),聚类继续细化为三个子类。
- 附件中的相同样本包含在不同时间点收集的特征,请分析它们与时间点的关系,以揭示不同类别疾病随时间演变的模式。
- 请参考相关文献来描述 CN、SMC、EMCI、LMCI 和 AD 五种类型的早期干预和诊断标准
数据说明
- DX_b:类型。CN表示正常老年人,SMC表示主观记忆主诉患者,EMCI表示早期轻度认知障碍患者,LMCI表示晚期轻度认知障碍患者,AD表示阿尔茨海默病患者。
- AGE:年龄
- PTGENDER:性别
。。。。。
不用太关心这些变量的含义,只要把目标变量确定出来就行。
思路
目标变量:DX_b
其它变量:相关特征
第一问:空缺部分可填充为0,缺失多的直接删除;缺失值少的用平均值填充。剔除一些不重要的特征。相关性可以用热力图,估计用处不大;还可以用特征重要性的排名来看,越重要则越相关,从而还能用于筛选特征。
第二问:五分类问题。建议算法:XGBoost 模型、 支持向量机 (SVM)模型、随机森林(RF)模型。建议至少使用两个算法,从而有对比性。
第三问:把三个大类分开筛选,其中单独提取H列中SMC、EMCI 和 LMCI 这三个类型的数据,然后使用无监督学习的聚类算法。例如使用:手肘法+Kmeans,这样的做法在高教杯就能国二水平。
第四问:关键在“时间点”,描述统计一些关于时间的量,可视化能说明出来更好。
第五问:这方面资料很多,晚点我再发出来。
思路如果有错误,后续我再更新。
代码
点击查看:C题文章来源:https://www.toymoban.com/news/detail-628535.html
视频讲解:C题文章来源地址https://www.toymoban.com/news/detail-628535.html
到了这里,关于2022国际数维杯C题题解:利用大脑结构特征和认知行为特征诊断阿尔茨海默病的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!