【数据挖掘】练习6:上机题目

这篇具有很好参考价值的文章主要介绍了【数据挖掘】练习6:上机题目。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

练习6:上机题目

一:实验目的与要求

1:了解R语言中各种图形元素的添加方法,并能够灵活应用这些元素。

2:了解R语言中的各种图形函数,掌握常见图形的绘制方法。

二:实验内容

1:某银行在降低贷款拖欠率的数据 bankloan 的示例数据。

2:比较违约与不违约情形不同特征的人群分布。

3:探索不同特征的人群收入与负债的分布情况。口 探索不同特征的人群收入与负债的关系。

三:实验方法与步骤

1)数据预处理,调整数据类型,按照年龄、工龄分组。

2)绘制违约与不违约客户的年龄、教育和工龄的条形图、Cleveland 点图。

3)绘制不同年龄、教育和工龄的客户收入与负债的直方图、核密度图、箱线图、小揭琴图。

4)绘制不同年龄、教育和工龄下客户的收入与负债的散点图。

第1步:读入数据

bankloan <- read.csv(file="bankloan.csv", header=T)

bankloan

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

第2步:按照年龄分组

(agesort <- cut(bankloan$age,c(0,10,20,30,40,50,60)))

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R


第3步:按照工龄分组

(worksort <- cut(bankloan$seniority,c(0,5,10,20,30,40), include.lowest = T))

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

第4步:绘制违约与不违约客户的年龄条形图

library(ggplot2)

ggplot(data=bankloan,aes(x=agesort,fill=agesort))+geom_bar()+facet_wrap(~default)

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

第5步:绘制违约与不违约客户的教育条形图

ggplot(data=bankloan,aes(x=education,fill=education))+geom_bar()+facet_wrap(~default)

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

第6步:绘制违约与不违约客户的工龄条形图

ggplot(data=bankloan,aes(x=worksort,fill=worksort))+geom_bar()+facet_wrap(~default)

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

第7步:绘制违约与不违约客户的年龄Cleveland点图

ggplot(data=bankloan,aes(x=age,y=age))+geom_point()+facet_wrap(~default)

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R


第8步:绘制违约与不违约客户的教育Cleveland点图

ggplot(data=bankloan,aes(x=education,y=education))+geom_point()+facet_wrap(~default)

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

第9步:绘制违约与不违约客户的工龄Cleveland点图

ggplot(data=bankloan,aes(x=seniority,y=seniority))+geom_point()+facet_wrap(~default)

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

 

第10步:绘制不同年龄的客户收入与负债的直方图

ggplot(data=bankloan,aes(x=age,group=factor(income)))+geom_histogram()

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

第11步:绘制不同教育的客户收入与负债的直方图

ggplot(data=bankloan,aes(x=education,group=factor(income)))+geom_histogram()

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

第12步:绘制不同工龄的客户收入与负债的直方图

ggplot(data=bankloan,aes(x=seniority,group=factor(income)))+geom_histogram()

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

第13步:绘制不同年龄的客户收入与负债的核密度图

ggplot(data=bankloan,aes(x=income,group=factor(age),colour=factor(age)))+geom_density()

ggplot(data=bankloan,aes(x=debt_rate,group=factor(age),colour=factor(age)))+geom_density()

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

第14步:绘制不同教育的客户收入与负债的核密度图

ggplot(data=bankloan,aes(x=income,group=factor(education),colour=factor(education)))+geom_density()

ggplot(data=bankloan,aes(x=debt_rate,group=factor(education),colour=factor(education)))+geom_density()

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

第15步:绘制不同工龄的客户收入与负债的核密度图

ggplot(data=bankloan,aes(x=income,group=factor(seniority),colour=factor(seniority)))+geom_density()

ggplot(data=bankloan,aes(x=debt_rate,group=factor(seniority),colour=factor(seniority)))+geom_density()

 【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

第16步:绘制不同年龄的客户收入与负债的箱线图

ggplot(bankloan,aes(x=age,y=income))+geom_boxplot()

ggplot(bankloan,aes(x=age,y=debt_rate))+geom_boxplot()

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

第17步:绘制不同教育的客户收入与负债的箱线图

ggplot(bankloan,aes(x=education,y=income))+geom_boxplot()

ggplot(bankloan,aes(x=education,y=debt_rate))+geom_boxplot()

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

第18步:绘制不同工龄的客户收入与负债的箱线图

ggplot(bankloan,aes(x=seniority,y=income))+geom_boxplot()

ggplot(bankloan,aes(x=seniority,y=debt_rate))+geom_boxplot()

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

第19步:绘制不同年龄的客户收入与负债的小揭琴图

ggplot(bankloan,aes(factor(age),income))+geom_violin()

ggplot(bankloan,aes(factor(age),debt_rate))+geom_violin()

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

第20步:绘制不同教育的客户收入与负债的小揭琴图

ggplot(bankloan,aes(factor(education),income))+geom_violin()

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R


第21步:绘制不同工龄的客户收入与负债的小揭琴图

ggplot(bankloan,aes(factor(seniority),income))+geom_violin()

ggplot(bankloan,aes(factor(seniority),debt_rate))+geom_violin()

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

 【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

 

第22步:绘制不同年龄下客户的收入与负债的散点图。

ggplot(bankloan,aes(income,debt_rate))+geom_point(aes(colour=factor(age)))

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R


第23步:绘制不同教育下客户的收入与负债的散点图。

ggplot(bankloan,aes(income,debt_rate))+geom_point(aes(colour=factor(education)))

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R


第24步:绘制不同工龄下客户的收入与负债的散点图。

ggplot(bankloan,aes(income,debt_rate))+geom_point(aes(colour=factor(seniority)))

【数据挖掘】练习6:上机题目,专业选修课系列,数据挖掘,人工智能,R

四:思考与实验总结

1)如何选择绘制的图形类型?

选择绘制的图形类型通常取决于数据的类型和分析的目的。

柱状图(Bar Plot):用于显示不同类别之间的频数或数量关系。适用于比较类别变量之间的差异。

折线图(Line Plot):用于显示连续变量随时间或其他有序变量的变化。适用于显示趋势和变化的方向。

散点图(Scatter Plot):用于显示两个连续变量之间的关系。适用于发现变量之间的相关性和观察异常值。

箱线图(Box Plot):用于显示连续变量的分布情况,包括中位数、四分位数和异常值。适用于比较多个组的分布,并识别异常值。

直方图(Histogram):用于显示连续变量的分布情况。适用于了解数据的分布形状和集中程度。

密度图(Density Plot):用于显示连续变量的分布密度估计。适用于比较两个或多个分布,并观察它们之间的重叠程度。

小提琴图(Violin Plot):结合了箱线图和密度图的特点,展示了数据的分布形状和中位数。适用于比较多个组的分布,并观察它们之间的差异。

Cleveland 点图(Cleveland Dot Plot):用于显示类别变量和连续变量之间的关系。适用于显示组内变量的分布情况和组间的差异。

2)如何向原始图形添加合适的图形元素,使图形简单明了且更能表达数据含义?

添加合适的图形元素可以帮助图形更加清晰地传达数据的含义。常见的图形元素如下:

标题(Title):描述图形内容和目的,使读者可以快速理解图形。

坐标轴标签(Axis Labels):标明 x 轴和 y 轴的含义,提供数据的单位或范围。

图例(Legend):用于解释图形中的颜色或图案代表的含义,特别适用于多组数据的比较。

参考线(Reference Lines):在图形中添加水平线或垂直线,表示特定数值或阈值,有助于对比数据和发现模式。

数据标签(Data Labels):在图形中添加数据点的数值标签,使得读者可以直观地了解数据。

注释(Annotations):添加文字说明或箭头指向特定数据点或趋势,提供更多背景信息或关键观察。

图形形状(Geometric Shapes):在图形中添加几何形状,如矩形、圆形等,以突出或强调特定区域或数据。

背景色(Background Color):调整图形背景色,使得图形更具对比度或吸引力。文章来源地址https://www.toymoban.com/news/detail-854866.html

到了这里,关于【数据挖掘】练习6:上机题目的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【数据挖掘竞赛】零基础入门数据挖掘-二手汽车价格预测

    目录 一、导入数据  二、数据查看 可视化缺失值占比  绘制所有变量的柱形图,查看数据 查看各特征与目标变量price的相关性 三、数据处理  处理异常值 查看seller,offerType的取值 查看特征 notRepairedDamage   异常值截断  填充缺失值   删除取值无变化的特征 查看目标变量p

    2023年04月27日
    浏览(60)
  • 数据挖掘-实战记录(一)糖尿病python数据挖掘及其分析

    一、准备数据 1.查看数据 二、数据探索性分析 1.数据描述型分析 2.各特征值与结果的关系 a)研究各个特征值本身类别 b)研究怀孕次数特征值与结果的关系 c)其他特征值 3.研究各特征互相的关系 三、数据预处理 1.去掉唯一属性 2.处理缺失值 a)标记缺失值 b)删除缺失值行数  c

    2024年02月11日
    浏览(52)
  • 数据挖掘(3.1)--频繁项集挖掘方法

    目录 1.Apriori算法 Apriori性质 伪代码 apriori算法 apriori-gen(Lk-1)【候选集产生】 has_infrequent_subset(c,Lx-1)【判断候选集元素】 例题 求频繁项集: 对于频繁项集L={B,C,E},可以得到哪些关联规则: 2.FP-growth算法 FP-tree构造算法【自顶向下建树】 insert_tree([plP],T) 利用FP-tree挖掘频繁项集

    2023年04月09日
    浏览(54)
  • 数据仓库与数据挖掘

    数据挖掘(Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(Knowledge-Discovery in Databases,KDD)中的一个步骤。 数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中的信息的过程。 数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、

    2024年02月06日
    浏览(48)
  • 《数据挖掘基础》实验:Weka平台实现关联规则挖掘

    进一步理解关联规则算法(Apriori算法、FP-tree算法),利用weka实现数据集的挖掘处理,学会调整模型参数,读懂挖掘规则,解释规则的含义 (1)随机选取数据集为对象,完成以下内容:(用两种方法:Apriori算法、FP-tree算法) 文件导入与编辑; 参数设置说明; 结果截图;

    2024年02月02日
    浏览(57)
  • 数据挖掘与图像挖掘:计算机视觉的创新

    计算机视觉是人工智能领域的一个重要分支,它涉及到计算机对图像和视频数据进行分析和理解。数据挖掘则是数据科学领域的一个核心技术,它涉及到从大量数据中发现隐藏的模式和规律。随着数据量的增加,数据挖掘技术在计算机视觉领域得到了广泛应用,以提高计算机

    2024年04月17日
    浏览(49)
  • 数据挖掘|序列模式挖掘及其算法的python实现

    序列(sequence)模式挖掘也称为序列分析。 序列模式发现(Sequential Patterns Discovery)是由R.Agrawal于1995年首先提出的。 序列模式寻找的是事件之间在顺序上的相关性。 例如,“凡是买了喷墨打印机的顾客中,80%的人在三个月之后又买了墨盒”,就是一个序列关联规则。对于保险

    2024年04月09日
    浏览(59)
  • 数据挖掘(7.1)--数据仓库

    目录 引言 一、数据库 1.简介 2.数据库管理系统(DBMS) 二、数据仓库 数据仓库特征 数据仓库作用 数据仓库和DBMS对比 分离数据仓库和数据库 数据仓库的历史可以追溯到20世纪60年代,当时计算机领域的主要工作是创建运行在主文件上的单个应用,这些应用以报表处理和程序为特

    2024年02月08日
    浏览(38)
  • 数据仓库与数据挖掘小结

    更加详细的只找得到pdf版本  填空10分 判断并改错10分 计算8分 综合20分 客观题 填空10分 判断并改错10分--错的要改 mooc中的--尤其考试题   名词解释12分 4个,每个3分 经常碰到的专业术语 简答题40分 5个,每道8分 综合 画 roc 曲线 类似于和计算相关的题目 C1 什么是数据挖掘?

    2024年01月22日
    浏览(49)
  • 数据挖掘与数据分析

    目录 数据挖掘与数据分析 一.数据的本质 二.什么是数据挖掘和数据分析 三.数据挖掘和数据分析有什么区别 案例及应用 1. 基于分类模型的案例 2. 基于预测模型的案例 3. 基于关联分析的案例 4. 基于聚类分析的案例 5. 基于异常值分析的案例 6. 基于协同过滤的案例 7. 基于

    2024年04月28日
    浏览(50)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包