临床决策曲线分析如何影响预测模型的使用和评价

这篇具有很好参考价值的文章主要介绍了临床决策曲线分析如何影响预测模型的使用和评价。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目前,临床决策曲线分析(clinical decision curve analysis, DCA)在业界已经被超过1500文献使用,也被多个主流的临床杂志所推荐,更被写进了临床预测模型撰写标准(TRIPOD)中,但是许多预测模型的文章却仅仅把它当做另外一个模型评价的指标,显然是没有完全了解DCA对于预测模型的作用和意义。概括来说,DCA不仅为预测模型向临床应用的转化提供了一个接口,更反过来规范了预测模型的使用和评价。本文在此阐述DCA对于预测模型的重要作用和意义进行阐述,以期加深对着对DCA的理解并恰当应用。

1.临床决策曲线给预测模型划了一个“框”

  • 这个“框”就是决策阈值范围。DCA开创性地提出了代价-收益比(cost:benefit radio)的概念并使其与预测模型的决策阈值相关联。临床上,施加一项临床诊断或者治疗措施都有相反的两方面作用, 一方面是获益,一方面是代价,比如常用来作为例子的活检, 活检的收益是确诊疾病,代价是有创。如果某位医生认为活检确诊某种疾病的作用大的,而有创是小的,且大约是10倍的关系,那活检的代价-收益比就是1:9,代表了这位医生可以接受10位接受活检的患者中,有1位通过活检确诊了疾病(是益处),另外9位患者是阴性(仅是感受了活检的有创性,是代价)。这个比值就可以作为预测模型的决策阈值,即0.1,因为不同的医生心目中活检的代价-收益比是不一样的,所以决策阈值是一个范围更加合理, 比如0.05~0.2。这个“框”不简单,预测模型的使用和评价都要在这个“框内”。

2.预测模型的使用要在这个“框”内

  • 决策阈值范围的确定与疾病和治疗或诊断的手段有关,是纯粹的临床考量,和预测模型的表现毫无关系,且要求高于这个阈值范围上限的患者就一定要接受诊断或者治疗措施,而低于这个阈值范围的患者就不需要进行诊断或者治疗措施,所以预测模型的使用范围就是在这个阈值范围之内。为了能精确地划定这个“框”,专家推荐在构建预测模型之前明确预测模型应用的目的,即明确预测模型后续的诊断或治疗手段,因为对于不同的疾病,不同的检测治疗手段,其代价-收益比是不一样的,比如同样是活检,对于恶性程度一般的疾病其比值为1:10,而对于恶性程度较高的肿瘤,其比值可能为1:20。

3.进行预测模型的评价和模型之间的比较,也要在这个“框”内

  • 因为预测模型仅在这个“框”内起作用,所以对于评价一个预测模型是否合格或者两个模型哪个更加优秀,也要局限在在这个“框”内,超出这个框框的评价,无论是好还是坏,对于模型的临床应用都没有影响,所以也就没有价值。笔者在实际的数据分析中遇到这样一个情况,使用一个甲状腺癌远处转移的不平衡数据构建了一个预测模型,因为甲状腺癌远处转移的发病率极低,导致整体的校准度总是达不到要求,按照目前的对模型整体评价这样一个体系,这样的模型是不能进入下一步评价的,但是在临床决策曲线所规定的阈值范围内,预测模型的局部校准度是符合进入临床要求的。
    目前预测模型的评价指标体系,ROC曲线和校准曲线都可以做到局部评价。虽然局部的区分度和校准度评价体系有待于进一步发展并得到业内的认可,相信在总体评价的基础上增加局部评价会是未来预测模型评价的一种趋势,这里尝试罗列一些可能的局部评价指标及其R语言的实现:
  • 局部区分度:局部AUC(partial AUC),首先确定决策阈值的范围,然后在R语言包pROC中指定决策阈值范围即可实现partial AUC 的绘制和计算,具体操作是在其roc 函数中指定决策阈值对应的X轴(specificity)的范围(图2)。
  • 局部校准度:使用经典的R语言val.pro函数可以简单实现局部校准度的绘制,指定参数“lim”的范围与决策阈值范围相同即可(图1)。
  • 加权曲线下净收益面积:这是2016年Talluri等在净收益基础上提出的一个指标,目前并未广泛应用,也没有专门的R包来实现相关的计算,但是可以根据作者公布的公式来进行计算,计算公式为:
    W A − N B C = ∫ p t N B C ( p t ) d p t WA-NBC= \int_{pt}NBC(pt)dpt WANBC=ptNBC(pt)dpt
    公式是一个积分,下限是pt,上限无,其中NBC(pt)是特定模型的净收益曲线。实际计算中可以使用R包的integrate()函数来实现。
#NBC(pt),需要提供一个数据框df_pred,包含了df_pred$.pred_1是预测的概率,conf_mat是混淆矩阵函数,df_pred$outcome是实际标签。
NBC<-function(pt,df=df_pred){
	y_pred_label=df$.pred_1>pt#ture or false
	df$y_pred_label<-ifelse(y_pred_label=='FALSE',0,1)%>%factor(levels=c(0,1))
	cm<-conf_mat(df,outcome,y_pred_label)%>%tidy()
	tp=cm$value[4]
	fp=cm$value[3]
	n = length(df$outcome)
	net_benefit = (tp / n) - (fp / n) * (pt / (1 - pt))
	return (net_benefit)#这里计算的是演示的NB值,如果想计算标准化的NB值,需要除以发病率(prevalence)
}
#WA-NBC,使用的积分函数,下限0.01,上限0.3
WA_NBC=stats::integrate(NBC,0.01,0.3)
WA_NBC

总之,DCA对于临床预测模型的意义不仅仅是提供了一个评价的指标,而是划定了一个模型使用和评价的范围,从根本上更新了对预测模型使用和评价的传统认知。

临床决策曲线分析如何影响预测模型的使用和评价
临床决策曲线分析如何影响预测模型的使用和评价文章来源地址https://www.toymoban.com/news/detail-422693.html

到了这里,关于临床决策曲线分析如何影响预测模型的使用和评价的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 大数据分析案例-基于GBDT梯度提升决策树算法构建数据科学岗位薪资预测模型

    🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 喜欢大数据分析项目的小伙伴,希望可以多多支持该系列的其他文章 大数据分析案例合集

    2024年02月07日
    浏览(44)
  • 二分类结局变量Logistic回归临床模型预测—— 外部数据集验证

      1. 介绍 2. 基线特征 3. 单因素多因素logistic回归分析及三线表 4. 构建临床列线图模型 5. 模型评价 6. 外部数据集验证 7. 另一种发文章的办法,分训练集和测试集,分析上述3-6节的内容 外部数据集验证,就是找一个别的数据集,可以是别家医院的,也可是数据库的,但是前提

    2024年02月12日
    浏览(65)
  • 结构方程模型SEM、路径分析房价和犯罪率数据、预测智力影响因素可视化2案例...

    在本文,我们将考虑观察/显示所有变量的模型,以及具有潜在变量的模型 ( 点击文末“阅读原文”获取完整 代码数据 )。 第一种有时称为“路径分析”,而后者有时称为“测量模型”。 SEM 在很大程度上是回归的多元扩展,我们可以在其中一次检查许多预测变量和结果。

    2024年02月09日
    浏览(42)
  • Topic 13. 临床预测模型之一致性指数 (C-index)

    C-index,C指数即一致性指数(concordance index),用来评价模型的预测能力。C指数是指所有病人对子中预测结果与实际结果一致的对子所占的比例。它估计了预测结果与实际观察到的结果相一致的概率。c指数的计算方法是:把所研究的资料中的所有研究对象随机地两两组成对子

    2024年02月11日
    浏览(39)
  • 机器学习-使用决策树DecisionTreeRegressor模型对水果蔬菜价格预测

    决策树 -常用于数据分析领域的分类和回归 数据集 fruitvegprices-2017_2022.csv数据集来对水果价格的预测。 水果蔬菜价格数据集自取 本数据用来学习所用,如有错误请指正 首先我们了解到决策树 [Decision Tree]可以用来解决什么样的问题? 分类 回归 对于不同的数据选择不同的方法

    2024年02月09日
    浏览(58)
  • 机器学习技术:如何使用交叉验证和ROC曲线提高疾病预测的准确性和效率?

    随着机器学习的普及,评估模型的性能越来越重要。交叉验证和ROC曲线是两种常见的评估模型性能的方法。本文将介绍这两种方法的基本原理和应用场景,并结合实际案例和技术实践,讲解如何使用交叉验证和ROC曲线来提高机器学习模型的性能。此外,文章也将提供一些最佳

    2024年02月11日
    浏览(61)
  • 【根据loss曲线看模型微调效果】如何使用loss曲线诊断机器学习模型性能

    一、Loss曲线     在模型的预训练或者微调过程中,我们一般通过观察loss曲线来得出模型对于数据集的学习效果等信息。那么我们如何根据loss曲线得到一些信息呢?     通常数据集会被划分成三部分,训练集(training dataset)、验证集(validation dataset)、测试集(test dat

    2024年01月19日
    浏览(47)
  • 直觉与预测模型:人工智能在游戏行业的影响

    随着人工智能技术的不断发展,游戏行业也逐渐被人工智能技术所涉及。直觉与预测模型在游戏行业中具有重要的应用价值,它们可以帮助开发者更好地理解玩家的行为,提高游戏的吸引力,并优化游戏体验。在本文中,我们将深入探讨直觉与预测模型在游戏行业中的应用,

    2024年02月21日
    浏览(47)
  • 数学建模--决策树的预测模型的Python实现

    目录 1.算法流程简介 2.算法核心代码 3.算法效果展示

    2024年02月08日
    浏览(52)
  • 【数据分析】基于XGboost(决策树)的银行产品认购预测--小林月

    目录 一、数据探索: 1.1 读取数据 1.2查看数据 1.3 数据预处理 二、字段描述 2.1 非离散型数据 2.2离散数值字段 三、数据建模 四、评估指标: 4.1:混淆矩阵 4.2: 准确率,回归率,F1 五、测试集准确率 六、模型优化 环境:使用python+jupter nodebook 数据:本文数据来源2023年【教

    2024年02月06日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包