多分类logit回归案例分析

这篇具有很好参考价值的文章主要介绍了多分类logit回归案例分析。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

在研究X对Y的影响时,因变量Y有时是分类变量,这时如果还想分析影响关系可以使用logit回归,常见的logit回归包括,二元logit回归(二项logit回归)、多分类logit回归以及有序logit回归。三者的区别如下:

logit多元回归结果分析,SPSSAU,统计学,数据分析,人工智能,概率论

此案例使用多分类logit回归研究幸福感情况。

一、案例背景

某研究者分别于1985年、1995年、2005年调查了已婚及未婚的30岁左右成年人的幸福感情况,部分数据如下,有时“幸福感”也会看成是有序变量,如果看成有序变量,该案例可以进行“有序logit”,该案例将“幸福感”看成多分类变量。所以用多分类logit分析。

该研究以“幸福感”为因变量,“婚姻状况”和“年份”为自变量建立模型,观察模型影响因素

logit多元回归结果分析,SPSSAU,统计学,数据分析,人工智能,概率论

二、分析前处理

对于自变量,该案例认为“婚姻状况”、“年份”为定类变量所以将二者进行哑变量处理。

补充说明:

多分类logit因变量为类别数据,研究X对Y的影响时,如果为类别数据,那么不能说越如何越如何,这就是类别数据的特点,一定是相对某某而言。这就导致了多分类logistic回归分析时,文字分析的难度加大,如果说因变量Y的类别个数很多,比如为10个,此时建议时对类别进行组合下,尽量少的减少类别数量,便于后续进行分析。此步骤可通过SPSSAU数据处理模块的数据编码功能完成。该案例的类别只有三个所以不进行处理。

三、结果分析

结果将从四个方面进行说明,其中包括“基本汇总”、“模型似然比检验”、“模型公式及影响关系”以及“模型预测效果分析”。

  1. 基本汇总

logit多元回归结果分析,SPSSAU,统计学,数据分析,人工智能,概率论

分析结果来源于SPSSAU


从上表可以看出共有5375个样本参与分析,其中比较幸福的成年人占比较大,占总分析人数的56.19%,不太幸福的成年人占比最少,占总分析人数的11.29%,接下来对模型似然比检验进行查看。

  1. 模型似然比检验

logit多元回归结果分析,SPSSAU,统计学,数据分析,人工智能,概率论


首先对p值进行分析,如果该值小于0.05,则说明模型有效;反之则说明模型无效,从上表可以看出p值小于0.05,说明拒绝原定假设,即说明本次构建模型时,放入的自变量具有有效性,本次模型构建有意义。接下来构建模型以及分析影响因素。

  1. 模型公式及影响关系

logit多元回归结果分析,SPSSAU,统计学,数据分析,人工智能,概率论


该案例的参考项是“不太幸福”,并且因为对自变量婚姻情况和年份进行哑变量处理,所以放入的自变量分别为‘婚姻状况_未婚’‘年份_1995年’以及‘年份_2005年’。有上表可以得到模型公式。
说明如下:
ln(十分幸福/不太幸福)=0.087 + 1.737*婚姻状况_未婚-0.110*年份_1995.0 + 0.115*年份_2005.0
ln(比较幸福/不太幸福)=1.375 + 0.796*婚姻状况_未婚-0.382*年份_1995.0-0.134*年份_2005.0
影响关系具体分析如下:
(1)“十分幸福”和“不太幸福”进行比较
相对于不太幸福来讲,在十分幸福的前提之下,婚姻情况为未婚的回归系数为正并且p值<0.05,未婚会对幸福感产生显著的正向影响关系。也就是相对于“幸福感”来讲,未婚成年人比已婚成年人会幸福。
(2)“比较幸福”和“不太幸福”进行比较
相对于不太幸福来讲,在比较幸福的前提之下,婚姻情况为未婚的回归系数为正并且p值<0.05,所以未婚会对幸福感产生显著的正向影响关系。也就是相对于“幸福感”来讲,未婚成年人比已婚成年人比较幸福。并且分析项1995年的p值<0.05并且回归系数为-0.382<0,所以相对于1985年调查的成年人不太幸福。

  1. 模型预测效果分析

logit多元回归结果分析,SPSSAU,统计学,数据分析,人工智能,概率论

通过模型预测准确率去判断模型拟合质量,从上表可知:研究模型的整体预测准确率为56.19 %,模型拟合情况一般。该案例分析模型预测不是重点,如正常分析可以忽略。

四、总结

案例利用多分类logit回归分析方法,以“幸福感”为因变量,“婚姻状况”和“年份”为自变量建立模型,观察模型影响因素。在分析前对自变量进行处理以及对结果进行分析,其中包括基本汇总、模型似然比检验、模型公式及影响关系以及模型预测效果分析,该案例分析模型预测不是重点,如正常分析可以忽略。最后发现就是相对于“幸福感”来讲,未婚成年人比已婚成年人会幸福。1985年调查成年人比1995年调查的成年人更幸福。


更多干货请登录SPSSAU官网进行查看。文章来源地址https://www.toymoban.com/news/detail-776139.html

到了这里,关于多分类logit回归案例分析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 汽车制造案例 | 过程管理优化+结果分析闭环,IOT提高电镀挂具管理效能

    江苏中科瑞尔汽车科技有限公司(下称中科瑞尔)主营业务为汽车零部件的设计、研发、生产、销售等,其中给整机厂提供电镀零部件是其重要业务。 电镀挂具是其电镀过程中必需工具,需要匹配零件的形状、电镀工艺和设备大小等不同需求,以及确保使用次数合规、维修得

    2024年02月22日
    浏览(31)
  • 【机器学习】决策树与分类案例分析

    决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-else结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法。下面就来举一个例子: 通过这一个例子我们会有一个问题,为什么女生会把年龄放在第一个呢?这就是决策树的一个思想:高效性。 为了

    2024年02月07日
    浏览(29)
  • 鲍鱼数据集案例分析-预测鲍鱼年龄(线性回归/梯度下降法实操)

    数据集来源UCI Machine Learning Repository: Abalone Data Set 目录 一、数据集探索性分析 二、鲍鱼数据预处理 1.对sex特征进行OneHot编码,便于后续模型纳入哑变量 2.添加取值为1的特征 3. 计算鲍鱼的真实年龄 4.筛选特征 5. 将鲍鱼数据集划分为训练集和测试集 三、实现线性回归和岭回归

    2024年02月08日
    浏览(44)
  • Python数据分析案例31——中国A股的月份效应研究(方差分析,虚拟变量回归)

    本次案例是博主本科在行为金融学课程上做的一个小项目,最近看很多经管类的学生作业都很需要,我就用python来重新做了一遍。不弄那些复杂的机器学习模型了,经管类同学就用简单的统计学方法来做模型就好。 有效市场假说是现代金融证券市场的理论基础之一,根据这一

    2024年01月22日
    浏览(49)
  • 【ArcGIS微课1000例】0073:ArcGIS探索性回归分析案例

    “探索性回归”工具会对输入的候选解释变量的所有可能组合进行评估,以便根据用户所指定的指标来查找能够最好地对因变量做出解释的 OLS 模型。 给定一组候选解释变量,找出正确指定的 OLS 模型: 用法 : 工具还会生成一个可选表,该表包括所有满足最大系数 p 值边界

    2024年02月11日
    浏览(31)
  • Python案例|使用Scikit-learn进行房屋租金回归分析

    回归分析是一种预测性的建模技术,研究的是因变量(目标)和自变量(预测器)之间的关系。回归分析是建模和分析数据的重要工具。比如预测股票价格走势、预测居民收入、预测微博互动量等等。常用的有线性回归、逻辑回归、岭回归等。本文主要使用线性回归。 本文使

    2024年02月15日
    浏览(44)
  • 大数据分析案例-基于LinearRegression回归算法构建房屋价格预测模型

    🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 喜欢大数据分析项目的小伙伴,希望可以多多支持该系列的其他文章 大数据分析案例合集

    2024年02月03日
    浏览(40)
  • 【ArcGIS微课1000例】0071:普通最小二乘法 (OLS)回归分析案例

    严重声明:本文来自专栏《ArcGIS微课1000例:从点滴到精通》,为CSDN博客专家刘一哥GIS原创,原文及专栏地址为:(https://blog.csdn.net/lucky51222/category_11121281.html),谢绝转载或爬取!!! 有关空间回归的相关原理,简单的来说如下图所示,之前的文章有详细解说,请点击:【Geo

    2024年02月11日
    浏览(28)
  • Python数据分析案例05——影响经济增长的因素(随机森林回归)

    在计量经济学里面的研究,围绕着影响GDP的因素的研究有很多,基本都是做回归,拿GDP作为被解释变量y,其他因素作为解释变量x。然后做线性回归,时间序列就做自回归,面板数据就做固定效应等等。本次案例采用机器学习里面的随机森林回归来研究影响经济增长的因素,

    2024年02月09日
    浏览(30)
  • 大数据分析案例-基于随机森林算法构建新闻文本分类模型

    🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 喜欢大数据分析项目的小伙伴,希望可以多多支持该系列的其他文章 大数据分析案例合集

    2024年02月02日
    浏览(46)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包