SPSS中系统聚类操作案例

这篇具有很好参考价值的文章主要介绍了SPSS中系统聚类操作案例。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

示例:

一啤酒生产商想了解当前啤酒市场情况,并判断时下最受欢迎的啤酒品牌,收集了多种啤酒在售价、热量、钠含量、酒精含量等方面的数据。运用系统聚类法对各项数据进行分析,并给出:

(1)所有样本的归类情况表(群集成员表);

(2)所有样本的树状图;

(3)简要分析聚类结果。(酒精含量较高的啤酒酒质较好,国际上公认12°以上的啤酒为高级啤酒,酒精含量5%左右;低“钠”含量的食物较健康)。

主要操作步骤如下:

SPSS中系统聚类操作案例

(1)将变量移入 变量框 中。将标志变量 啤酒名 移入 个案标记依据框 中;

在 分群 栏中选择 个案 单选按钮,即对样品进行聚类(若选择 变量,则对变量进行聚类)。在 输出 栏中选择 统计量 和 复选框,这样在结果输出窗口中可以同时得到聚类结果统计量和统计图。

SPSS中系统聚类操作案例

 (2)点击 统计量 按钮,设置在结果输出窗口中给出的聚类分析统计量。在 聚类成员 中,方案范围2—4(此数值不固定,可根据实际情况而定),这样在结果输出窗口中可以得到分别分成2、3、4类的聚类结果;点击 继续 按钮;

SPSS中系统聚类操作案例

(3)点击 绘制 按钮,设置结果输出窗口中给出的聚类分析统计图。选中 树状图 复选框和 冰柱 栏中的  单选按钮,即只给出聚类树形图,而不给出冰柱图。单击 继续 按钮,返回主界面;

树状图可以非常直观的看出整个聚类过程和结果,是观察理解聚类结果的重要图形,一般要选择它;冰柱图也是查看聚类结果的一种图形,但是它无论从应用范围还是易于理解性上都要比树状图差一些,所以此处未选。

SPSS中系统聚类操作案例

(4)点击 方法 按钮,设置系统聚类的方法选项。聚类方法 下拉列表用于指定聚类的方法,包括组间连接、组内连接、Ward法等;不同的聚类方法结果不一定完全相同,一般只是大致相似。如果有很大的差异,则应该仔细考查,找到问题所在;另外,可将聚类结果与实际问题对照,看哪一个结果更符合经验;这里沿用系统默认选项;

度量标准 用于选择对距离和相似性的测度方法。一般而言对每一类变量类型使用其默认方法即可;

转换值 和 转换度量 用于选择对原始数据进行标准化的方法。当进行聚类的变量之间数量级相差比较大的时候,往往要根据数据的实际情况选择相应的标准化方法,这里将全部数据标准化为Z得分。右侧的 转换变量 还可以设置进一步的变换方法,可以为 先取绝对值再变换、变换后更改正负号、或者先将取值范围变为0-1再进行变换。一般来说不需要使用这些选项。单击 继续,返回主界面。

(5)点击 确定 按钮,得到系统聚类分析结果。

主要结果如下:

(1)所有样本的归类情况表(群集成员表);

SPSS中系统聚类操作案例

 “群集成员”表格是聚类个数为2—4时的类成员表;在数据编辑窗口生成了同样的内容,即3个变量,保存聚类个数分别为2、3、4时的分类结果,如下所示。SPSS中系统聚类操作案例

(2)所有样本的树状图;

图形的左边代表进行聚类的对象,而对象的合并则通过线条连接的方式来表达。在这个例子中,对应的是各啤酒名列在结果的最左端,而结果的上端给出的是类别间的相对距离。

SPSS中系统聚类操作案例

 (3)简要分析聚类结果。(酒精含量较高的啤酒酒质较好,国际上公认12°以上的啤酒为高级啤酒,酒精含量5%左右;低“钠”含量的食物较健康)

根据保存的分类结果,对各类中售价、酒精含量、钠含量和热量进行对比,分析所属各类啤酒品质的好坏;或进行描述性分析(从均值、标准差等方面简单直观地研究各类别之间的区别),对聚类结果进一步分析。

描述性分析:

SPSS中系统聚类操作案例

SPSS中系统聚类操作案例

SPSS中系统聚类操作案例

SPSS中系统聚类操作案例 SPSS中系统聚类操作案例

 拖动调整3个描述量的位置如下所致:

 SPSS中系统聚类操作案例

 关闭窗口即得到:系统聚类的PLAP立方体(以分三类为例,其他类别分析类似)

SPSS中系统聚类操作案例

 由各类均值看出,第一类售价较高,酒精含量高且接近5%,钠含量较低(比第3类略高);第三类价格最低,酒精含量也远低于一、二类;第二类售价和热量适中,酒精含量较高,且此类聚类数最多(14个),该类啤酒市场占有额较大。综合判断,第一类啤酒价格高、品质好,第二类最受市场青睐,第三类低能量、低度数,市场份额小。文章来源地址https://www.toymoban.com/news/detail-459450.html

到了这里,关于SPSS中系统聚类操作案例的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 基于SPSS的聚类分析原理概述

    在声音样本数目比较多的情况下,直接进行成对比较法,工作量非常大,且评价者容易疲劳,在很大程度上影响评价结果的一致性和准确性。对于这种情况,采用聚类分析,从 30 个声音样本中选择有代表性的样本进行主观评价试验,大大降低了主观评价试验的工作量 1 。 [

    2024年02月06日
    浏览(42)
  • 基于spss的多元统计分析 之 聚类分析+判别分析(3/8)

    实验目的: 1. 掌握多元数据的相关性、正态性、可视化表征的基本原理; 2.熟悉掌握SPSS软件/R软件的基本用法和基本操作; 3.利用实验指导中及软件中内置的实例数据,上机熟悉相关性检验+正态性检验+可视化数据方法。 实验内容: 1.实验数据为女性汗液+ 32名学生核心课

    2024年02月09日
    浏览(35)
  • JVM系统优化实践(23):GC生产环境案例(6)

    您好, 这里是 「 码农镖局 」 CSDN博客,欢迎您来,欢迎您再来~ 在互联网大厂中,对每天亿级流量的日志进行清洗、整理是非常常见的工作。在某个系统中,需要对用户的访问日志做脱敏处理,也就是清洗掉姓名、身份证号、手机号等个人隐私信息后在保存到数据库中或者

    2024年02月15日
    浏览(35)
  • JVM系统优化实践(22):GC生产环境案例(五)

    您好, 这里是 「 码农镖局 」 CSDN博客,欢迎您来,欢迎您再来~ 除了Tomcat、Jetty,另一个常见的可能出现OOM的地方就是微服务架构下的一次RPC调用过程中。笔者曾经经历过的一次OOM就是基于Thrift框架封装出来的一个RPC框架导致的宕机。   也就是当服务A更新后,服务B宕机了

    2024年02月15日
    浏览(46)
  • JVM系统优化实践(20):GC生产环境案例(三)

    您好, 这里是 「 码农镖局 」 CSDN博客,欢迎您来,欢迎您再来~ 某新手开发工程师接到了一个保存Elasticsearch日志的任务,以供后续分析之用。但写代码的时候,误将保存日志的代码段弄成了无限循环,程序启动后,没用多久就崩溃了。 另一名工程师在动态创建类时,没有

    2024年02月16日
    浏览(47)
  • 对应分析介绍及SPSS案例分析

    在开展统计分析的过程中,分类变量(定序和定类变量)是我们研究的一个重点。通常我们分析分类变量间关系时,最常用的分析方法是卡方检验,其次是逻辑回归和对数线性模型等。 如果类别变量的分类较少,我们可以通过卡方检验判断行变量和列变量间是否相互独立,同

    2024年02月13日
    浏览(44)
  • SPSS--如何使用分层分析以及分层分析案例分享

         分层分析: 将资料按某个或某些需要控制的变量的不同分类进行分层,然后再估计暴露因子与某结局变量之间关系的一种资料分析方法 。 分层分析的最重要的用途是评估和控制混杂因子所致的混杂偏倚。通过按混杂因子分层,可使每层内的两个比较组在所控制的混杂

    2024年02月12日
    浏览(45)
  • 操作系统-进程同步:生产者-消费者问题

    ​ 以生产者-消费者模型为基础,在Windows环境下创建一个控制台进程(或者界面进程),在该进程中创建读者写者线程模拟生产者和消费者。写者线程写入数据,然后将数据放置在一个空缓冲区中供读者线程读取。读者线程从缓冲区中获得数据,然后释放缓冲区。当写者线程

    2023年04月20日
    浏览(45)
  • Linux操作系统实验:生产者和消费者问题

    “生产者消费者”问题是一个著名的同时性编程问题的集合。通过编写经典的”生产者消费者”问题的实验,读者可以进一步熟悉 Linux 中多线程编程,并且掌握用信号量处理线程间的同步互斥问题。 VMware Workstation Pro “生产者消费者”问题描述如下。 有一个有限缓冲区和两

    2024年02月06日
    浏览(53)
  • 机器学习之聚类——双聚类简介及简单案例

    ​ ​ 活动地址:CSDN21天学习挑战赛         在生物学领域,为了研究基因表达 ,通常使用微阵列记录mRNA分子的含量并对基因的表达强度进行推断。它可以记录人体大量乃至全部基因在不同环境下的表达强度,并以矩阵形式进行储存,这些以矩阵形式存储的数据,被称为

    2024年02月16日
    浏览(38)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包