R语言、02 案例2-1 Pelican商店、《商务与经济统计》案例题

这篇具有很好参考价值的文章主要介绍了R语言、02 案例2-1 Pelican商店、《商务与经济统计》案例题。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

  • 编程教材 《R语言实战·第2版》Robert I. Kabacoff

  • 课程教材《商务与经济统计·原书第13版》 (安德森)

P48、案例2-1 Pelican 商店

PS C:\Users\小能喵喵喵\Desktop\R\homework\1_Pelican> tree /f
C:.
│   pelican.r
│
├───.vscode
│       launch.json
│
└───data
        PelicanStores.csv

加载数据

编程教材p32 2.3.2

已知数据集为csv文件,所以要按间隔符形式导入。并删除带缺省值的列。

stores <- read.table("./data/PelicanStores.csv",
  header = TRUE, row.names = "Customer", sep = ","
)

res1 <- data.frame(stores)
library(dplyr)
res <- res1 %>% select_if(~ !any(is.na(.)))

print(summary(res))

View(res)

主要变量的百分数频数分布

编程教材 p21~30 、p137~143

顾客类型、支付类型

# ^ 百分数频数分布
# @ 客户类型
typeTable1 <- table(res$Type.of.Customer)
typeTable1 <- prop.table(typeTable1) * 100
print(typeTable1)
# @ 支付方法
typeTable2 <- table(res$Method.of.Payment)
typeTable2 <- prop.table(typeTable2) * 100
print(typeTable2)

竖着显示方法、改成数据框

# @ 竖着显示方法
print(as.data.frame(typeTable2))

使用DescTools包Freq方法

install.packages("DescTools")
# ! 使用 DescTools
t1 <- Freq(res$Type.of.Customer)
View(t1)
# ! 使用 DescTools
t2 <- Freq(res$Method.of.Payment)
View(t2)

销售额类型

课程教材 p25 2.2.1

首先我们要确定组宽,公式为 \(近似组宽=\frac{数据最大值-数据最小值}{组数}\)

Max.=287.59 、Min.=13.23。数据项较少的情况下给定5组互不重叠的组数。组宽约等于 55

# @ 销售额频率分组
typeTable3 <- within(res, {
  group1 <- NA
  group1[Net.Sales >= 13 & Net.Sales < 68] <- "[13~68)"
  group1[Net.Sales >= 68 & Net.Sales < 123] <- "[68~123)"
  group1[Net.Sales >= 123 & Net.Sales < 178] <- "[123~178)"
  group1[Net.Sales >= 178 & Net.Sales < 233] <- "[178~223)"
  group1[Net.Sales >= 233 & Net.Sales <= 288] <- "[223~288]"
})
# print(head(sales))
typeTable4 <- table(typeTable3$group1)
typeTable4 <- prop.table(typeTable4) * 100
# @ 默认按字符串排序,重新排列表格列
typeTable4 <- typeTable4[c(2, 5, 1, 3, 4)]
print(as.data.frame(typeTable4))

条形图或圆饼图显示顾客付款方法数量

编程教材 p110~117

条形图

# ^ 支付方式条形图
png(file = "typeTable2_barplot.png")
par(mar = c(10, 4, 4, 0))
barplot(typeTable2,
  main = "100个顾客付款方法数量条形图",
  xlab = "", ylab = "频数", las = 2, col = rainbow(25)
)
dev.off()

使用qcc包pareto.chart方法

# ! qcc包画条形图
library(qcc)
par(mar = c(6, 0, 0, 0))
pareto.chart(typeTable2,
  main = "100个顾客付款方法数量条形图",
  xlab = "付款方式", ylab = "频数"
)

圆饼图

# ^ 支付方式圆饼图
png(file = "typeTable2_pie.png")
colors <- c("#4286f4", "#bb3af2", "#ed2f52", "#efc023", "#ea7441")
pie(typeTable2,
  main = "Daily Diet Plan",
  col = colors, init.angle = 180, clockwise = TRUE
)
dev.off()

顾客类型与净销售额的交叉分组表

编程教材 p137~143 课程教材 p34

# ^ 顾客类型与净销售额的交叉分组表
crossTable <- with(typeTable3, table(Type.of.Customer, group1))
View(crossTable)

把交叉分组表中的项目转换成行百分比数或者列百分比数。顾客各类型数量差别太大会影响判断

# ^ 顾客类型与净销售额的交叉分组表
crossTable <- with(typeTable3, table(Type.of.Customer, group1))
View(crossTable)
# @ 转化成顾客类型的行百分比
# crossTable <- round(prop.table(crossTable, 1) * 100, 2)
# crossTable <- cbind(crossTable, sum = rowSums(crossTable[, 1:5]))
# @ 另一种方式
crossTable <- addmargins(round(prop.table(crossTable, 1) * 100, 1), 2)
View(crossTable)

通过表格可知道普通顾客和促销顾客的净销售额较多聚集在13~68区间的净销售额,但促销顾客出现部分178~288区间的净销售额,是因为促销活动发的优惠卷促进了消费者的消费欲望,利用消费者的投机心理来促进多买行为。


净销售额与顾客年龄关系的散点图

# ^净销售额与顾客年龄关系的散点图

png(file = "res_scatterplot.png")

plot(
  x = res$Net.Sales, y = res$Age,
  xlab = "净销售额",
  ylab = "年龄",
  xlim = c(10, 300),
  ylim = c(20, 80),
  main = "净销售额与顾客年龄关系的散点图"
)

dev.off()

两个变量之间没有明显相关。但可以发现无论顾客年龄多少,净销售额大多都集中在0~150区间。

资料

每一行数据求和

cbind(crossTable, sum = rowSums(crossTable[, 1:5]))

使用函数添加的另外一种方式

addmargins(prop.table(mytable, 1), 2) # 加在列
addmargins(prop.table(mytable, 2), 1) # 加在行 

RStudio table描述性统计,频数,频率,总和,百分比 - 知乎 (zhihu.com)

cbind函数给列命名

Set Column Names when Using cbind Function in R | Rename Variables (statisticsglobe.com)

scatterplots

R - Scatterplots (tutorialspoint.com)

piechart

R Tutorials (tutorialkart.com)

How to draw Pie Chart in R programming language (tutorialkart.com)

barplot 显示问题

graph - How to display all x labels in R barplot? - Stack Overflow

关于warning问题

带中文字符 R 语言经常会发出警告

options(warn=-1) #忽视任何警告
options(warn=1) #不放过任何警告
options(digits = 2) #将有效输出变为2

prop.table()

How to Use prop.table() Function in R (With Examples) - Statology

prop table in R: How Does the prop.table()

变量分组的三种方法

R语言将变量分组的三种方法(含cut函数介绍

完整代码

alicepolice/R01_Pelican (github.com)文章来源地址https://www.toymoban.com/news/detail-807374.html

到了这里,关于R语言、02 案例2-1 Pelican商店、《商务与经济统计》案例题的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【案例实践】R语言多元数据统计分析在生态环境中的实践应用

    查看原文R语言生物群落分析绘图、多元统计分析、CMIP6、遥感碳储量、GEE林业、InVEST等 生态环境领域研究中常常面对众多的不同类型的数据或变量,当要同时分析多个因变量(y)时需要用到多元统计分析(multivariate statistical analysis)。多元统计分析内容丰富,应用广泛,是

    2023年04月12日
    浏览(49)
  • 爬虫案例—抓取小米商店应用

    代码如下: # 抓取第一页的内容 import requests from lxml import etree url = ‘https://app.mi.com/catTopList/0?page=1’ headers = { ‘User-Agent’: ‘Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36’ } res = requests.get(url, headers=headers) content = res.content.decode(‘

    2024年01月16日
    浏览(33)
  • SQL数据库案例1——创建商店数据库

    创建商店数据库Commodities_Management 创建商品表、供应商表、进货表、销售表 各表分别输入数据 库名:Commodities_Management 字符集:utf16 表一:商品表 字段名 类型 长度 约束 商品编号 varchar 10 外键(参照进货表) 商品名 varchar 30 — 规格 varchar 20 — 供应商编号 varchar 10 非空 表二:

    2024年02月12日
    浏览(48)
  • 第8章 综合案例—构建DVD租赁商店数据仓库

    ​​​​ 目录 一.学习目标 二.案例介绍         2.1.案例背景介绍         2.2.数据仓库的架构模型 三.数据准备         3.1.数据库sakila的下载和安装         3.2.数据库sakila简介 四.案例实现        4.1加载日期数据至日期维度表        4.2 加载时间数据至时间维度表

    2024年02月09日
    浏览(34)
  • 看涨期权计算例题(期权案例计算)

    看涨期权又称认购期权,买进期权,买方期权,买权,延买期权,或“敲进”,是指期权的购买者拥有在期权合约有效期内按执行价格买进一定数量标的物的权利,下文为大家科普看涨期权计算例题(期权案例计算) 本文来自:期权酱 当看涨期权(Call Option)的价格计算时,

    2024年02月09日
    浏览(42)
  • Python数据分析案例05——影响经济增长的因素(随机森林回归)

    在计量经济学里面的研究,围绕着影响GDP的因素的研究有很多,基本都是做回归,拿GDP作为被解释变量y,其他因素作为解释变量x。然后做线性回归,时间序列就做自回归,面板数据就做固定效应等等。本次案例采用机器学习里面的随机森林回归来研究影响经济增长的因素,

    2024年02月09日
    浏览(43)
  • 数据分析案例-基于因子分析探究各省份中心城市经济发展状况

      🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 目录 一、实验背景 二、实验内容及数据 2.1 概述 2.2 变量介绍 三、实验步骤 3.1 导入模块

    2023年04月15日
    浏览(46)
  • 数学建模算法与应用:预测模型(3)案例: SARS 疫情对经济指标影响

    目录         问题描述: 一、建模思路  二、对模型进行分析预测          2.1、对模型进行假设 三、建立灰色预测模型GM(1,1)           3.1、模型的求解(i)商品零售额          3.2、用MATLAB程序,实现(i)商品零售额          3.3、输出结果          3.4、模

    2024年02月07日
    浏览(64)
  • 【量化课程】02_4.数理统计的基本概念

    数理统计思维导图 更多详细内容见notebook 1.基本概念 总体 :研究对象的全体,它是一个随机变量,用 X X X 表示。 个体 :组成总体的每个基本元素。 简单随机样本 :来自总体 X X X 的 n n n 个相互独立且与总体同分布的随机变量 X 1 , X 2 ⋯   , X n X_{1},X_{2}cdots,X_{n} X 1 ​ , X

    2024年02月12日
    浏览(36)
  • 【生态经济学】R语言机器学习方法在生态经济学领域中的实践技术

    查看原文基于R语言机器学习方法在生态经济学领域中的实践技术 近年来,人工智能领域已经取得突破性进展,对经济社会各个领域都产生了重大影响,结合了统计学、数据科学和计算机科学的机器学习是人工智能的主流方向之一,目前也在飞快的融入计量经济学研究。表面

    2024年02月10日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包