spss--数据分析Log-Binonial模型

这篇具有很好参考价值的文章主要介绍了spss--数据分析Log-Binonial模型。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

               在横断面研究中,Log-binomial 模型能够获得研究因素与结局变量的关联强度指标患病率比(PR),是一种研究二分类观察结果与多因素之间关系的重要方法,在医学研究等领域中得到了广泛的应用。

采用log-binomial 模型可直接估计PR,  log-binomial模型的因变量y服从二项分布 ,且因变量(y= 1)概率的对数与自变量呈线性关系:

spss--数据分析Log-Binonial模型,算法,数据结构,线性回归,决策树,宽度优先,广度优先,深度优先

 文章来源地址https://www.toymoban.com/news/detail-653740.html

其中,

spss--数据分析Log-Binonial模型,算法,数据结构,线性回归,决策树,宽度优先,广度优先,深度优先

 

β表示控制其他自变量时 , 自变量X 与Y之间的回归系数 ,PR = exp ( β)

01适用情形
 

但当事件的发生率较高(>10%)时 ,若仍用OR描述关联强度,则会高估暴露与结局的关联。因此,很多学者建议采用现患比(PR)描述暴露与结局的关联强度。

 

当存在连续型自变量时,可能导致log-binomial 模型出现不收敛的情况,这是则可采用COPY方法(数据集扩充,后面会介绍)。

02案例分析

假设有因变量Y与自变量X1,X2, X3, X4 等;因变量Y(二分类)患病率大于20%,自变量X1 为年龄age(连续型变量),其他均为分类变量;

对于此案例,最直接的方法是采用logistic回归模型,但是Y患病率大于20%,可能会高估OR值。因此,本例使用Log-binomial 模型的PR值来估计患病率与研究因素的关联强度

03 SAS 程序实例
 

PROC GENMOD 的详细使用可参照SAS help 手册。

spss--数据分析Log-Binonial模型,算法,数据结构,线性回归,决策树,宽度优先,广度优先,深度优先

 

 

在SAS/STAT中,通过PROC GENMOD 程序实现

数据集名为Log_binomial,参数统计量输出到Log_binomial _y中;

spss--数据分析Log-Binonial模型,算法,数据结构,线性回归,决策树,宽度优先,广度优先,深度优先

定义数据集OUT-para,  计算PR, LPR, UPR; 并打印

spss--数据分析Log-Binonial模型,算法,数据结构,线性回归,决策树,宽度优先,广度优先,深度优先

 

输出结果

spss--数据分析Log-Binonial模型,算法,数据结构,线性回归,决策树,宽度优先,广度优先,深度优先

 

spss--数据分析Log-Binonial模型,算法,数据结构,线性回归,决策树,宽度优先,广度优先,深度优先

 

但是,日志中警告 模型出现不收敛。可能的原因与很多,其中连续型自变量age可能导致模型出现不收敛;
下面采用COPY方法对数据集进行扩张。

04 SAS程序示例—COPY方法
 

当存在连续型自变量时, MLE(maximum likelihood estimation)估计的参数通常在参数所限制范围的边界上 ,MLE得不到似然函数导数为零的极大值点,导致模型不能收敛。

Deddens等学者提出先对原始数据集调整扩充后再拟合 log-binomial模型,称为COPY方法扩充原始数据集的步骤:当log-binomial 回归模型不收敛时,将原始数据集中Y=1的个案增加 c-l倍 ,然后再将原始数据集Y值互换 ,将这两个新的数据集合并成一个数据集, 即为复制(COPY )数据集 , 再利用 COPY 数据集拟合log-binomial 回归模型从而达到解决模型不收敛问题 。

通常C为常数 ,C越大(通常取1000) ,COPY数据集的伪似然估计值越接近于最大似然估计值 。在 SAS 软件中, 可以利用 genmod 模块中的加权log-binomial回归模型实现COPY 数据集下的log-binomial回归方法 。



对数据集log-binomial 进行复制,其中,c=1000;

spss--数据分析Log-Binonial模型,算法,数据结构,线性回归,决策树,宽度优先,广度优先,深度优先

 

再对数据进行log-binomial模型分析,应特别注意需要对 w 进行加权处理

spss--数据分析Log-Binonial模型,算法,数据结构,线性回归,决策树,宽度优先,广度优先,深度优先

 

结果输出

spss--数据分析Log-Binonial模型,算法,数据结构,线性回归,决策树,宽度优先,广度优先,深度优先

 

spss--数据分析Log-Binonial模型,算法,数据结构,线性回归,决策树,宽度优先,广度优先,深度优先

 

05 logistic回归模型与log-binomial模型的对比
 

从调整OR值和PR值可看出,log-binomial模型计算出的PR值要更接近与1。

spss--数据分析Log-Binonial模型,算法,数据结构,线性回归,决策树,宽度优先,广度优先,深度优先

 

到了这里,关于spss--数据分析Log-Binonial模型的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • R语言数据分析笔记——方差分析(单因素方差分析、双因素方差分析)在Excel、SPSS、R语言中的操作)

    前言:本文为个人学习笔记,为各大网站上的教学内容之综合整理,综合整理了①方差分析的基础知识、②方差分析(单因素方差分析、双因素方差分析)在Excel、SPSS、R语言中的操作),尽量标明出处。另因能力所限或有纰漏之处,故仅供参考,欢迎交流指正。 基本概念 指

    2024年02月05日
    浏览(45)
  • 苹果电脑MacBook M1芯片安装SPSS(数据分析工具)教程详细介绍:保姆级教程!!!

    特别强调:在安装过程中请逐一对照安装步骤,操作可以慢一点但是不要出错,避免出现一系列报错或者无法打开软件的情况。 首先准备好两个安装文件,一个是后缀为 dmg 的安装包,一个是 pojie 文件。首先在下面附上安装文件链接(点击即可): 链接: 百度网盘 提取码:

    2023年04月22日
    浏览(247)
  • IBM SPSS Statistics for Mac v27.0.1中文激活版:强大的数据分析工具

    IBM SPSS Statistics for Mac是一款功能强大的数据分析工具,为Mac用户提供了高效、精准的数据分析体验。 IBM SPSS Statistics for Mac v27.0.1中文激活版下载 该软件拥有丰富的统计分析功能,无论是描述性统计、推论性统计,还是高级的多元统计分析,都能轻松应对。用户可以利用IBM S

    2024年04月27日
    浏览(40)
  • 运营数据分析模型—用户分层分析

    分层分析法是根据数据分析对象的特征,按照一定的标志(指标),把数据分析对象划分为不同的部分和类型来进行研究,以揭示其内在的联系和规律性。 业务经营最忌吃大锅饭,对待用户一视同仁。当用户只有几千几万的时候,尚谈不上精细化运营,但当用户规模达到几十

    2023年04月11日
    浏览(41)
  • Python数据分析-数据挖掘(准备数据——数据建模——模型评估——模型应用)

    20 理解业务和数据:我们需要做好什么计划?_哔哩哔哩_bilibili 目录   一、理解业务和数据:我们需要做好什么计划? 1.1两个思想问题 1.2为什么数据挖掘不是万能的 1.3业务背景与目标 1.4把握数据  1.5总结 二、 准备数据:如何处理出完整、干净的数据? 2.1找到数据 2.2数据探索

    2024年02月05日
    浏览(62)
  • 数据分析 — 电商用户分析和用户 RFM 模型

    字段 说明 RowID 行编号 OrderID 订单 ID OrderDate 订单日期 ShipDate 发货日期 ShipMode 发货模式 CustomerID 客户 ID CustomerName 客户姓名 Segment 客户类别 City 客户所在城市 State 客户所在州 Country 客户所在国家 PostalCode 邮编 Market 商店所属区域 Region 商店所属州 ProductID 产品 ID Category 产品类别

    2024年02月21日
    浏览(41)
  • 数据分析专家能力模型

    招式:懂商业(业务能力) 外功更偏重于技能,首先需要懂招式,即懂商业,数据分析最终是为业务服务的,无论是互联网企业准求的用户增长和UJM分解,还是传统企业追求的降本增效和精细化运营,最终都是为了更好的识别业务问题,寻求解决方案,提出落地建议。如果不

    2024年04月28日
    浏览(26)
  • 人工智能:数据分析之数据预处理、分析模型与可视化

    在人工智能和数据科学领域,数据分析是一种核心过程,它帮助我们从大量的数据中提取有价值的信息。数据分析的质量和结果直接影响到决策的效率和准确性。在这篇博客中,我们将详细探讨数据分析的关键步骤,包括数据预处理、分析模型和可视化,并通过实际应用案例

    2024年03月10日
    浏览(71)
  • 数据分析 | 特征重要性分析 | 树模型、SHAP值法

            在分析特征重要性的时候,相关性分析和主成分分析往往是比较简单的方法,相关性分析是通过计算特征与目标变量之间的相关系数来评估特征的重要性。它可以告诉我们特征和目标变量之间的线性关系程度,但对于非线性关系就无能为力了;主成分分析是一种降

    2024年02月10日
    浏览(44)
  • 用大模型增强数据分析应用

    大模型出道即巅峰,它广受欢迎并在很多领域中成为有力的工具,当然包括数据分析领域。你可能不确定如何把大模型整合到你的工作中,如帮助你用数据驱动决策。本文介绍一些思路带你在不同应用场景下使用数据分析提示词。当然不仅局限与ChatGPT,其他国内大模型也一样

    2024年01月25日
    浏览(34)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包