stata学习笔记(一)stata入门与基本操作

这篇具有很好参考价值的文章主要介绍了stata学习笔记(一)stata入门与基本操作。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

这里开个新坑,主题有关stata使用以及定量分析入门,主要内容来自于之前与之后的课程学习、作业以及资料查询整理,主要目的是对个人学习过程的一个记录,方便日后回顾。

1 导入数据

方法1:点击文件选项,选择导入,根据数据类型选择即可;
stata,学习,开发语言

方法2::点击进入数据编辑器界面,点击“文件”选择打开。注意,该方式只能打开.dta文件,若数据量较小建议在Excel中的打开,全选后复制,粘贴至数据编辑器中。
stata,学习,开发语言

若想将导入后的Excel文件转换成dta数据,可在主界面的文件中选择另存为即可。

2 修改变量标签

方法1:在数据编辑器的属性窗口直接输入即可
stata,学习,开发语言

方法2:在命令窗口输入
label variable 城市 “city”
注意var后面的跟变量名称,即使是汉字也不需要加引号

3 检视数据

1.输入命令describe(可简写为d)看数据集中变量名称、标签等
stata,学习,开发语言

2.若想看某几个变量的具体数据,则输入命令:
list A B C
stata,学习,开发语言

3.也可通过逻辑关系来定义数据集子集,比如列出C变量大于等于10000的数据,则使用命令:
list A C if C>=10000
stata,学习,开发语言

这里注意下其他表示关系的逻辑符号有“==”(等于)、“~=”(不等于,也可以用“!=”表示)。stata中等号的作用跟Python中类似,一个=是赋值,两个= =才表示等于。此外,if后面的等号必须是“= =”。
4.删改数据:
①若要删除满足“C<=10000”条件的观测值,可输入
drop if C<=10000
②若只要保留“C<=10000”条件的观测值,可输入
keep if C<=10000
注意,stata中没有撤回,所以删除数据需慎重。
5.若想将数据按变量C升序排列,可输入
sort C
list
若想按变量C降序排列,可输入
gsort -C

4 画图

1.hist 变量名 , width(5) frequency
其中hist全拼histogram,表示直方图,width(5)表示将组款设为5,frequency表示将纵坐标定为频数(默认使用密度)
2.sc 变量1 变量2 , mlabel(变量1)
其中sc全拼scatter,即画出两个变量的散点图来看二者的关系。mlabel表示以变量1作为标签,显示在图中

5 统计分析

1.su 变量1
其中su全拼summarize,计算变量1的样本容量、平均值、标准差、最小值与最大值。若不表明变量则输出所有变量的统计指标
stata,学习,开发语言
2.ta 变量1
其中ta全拼tabulate,显示变量1的经验累积分布函数,Freq表示频数,Percent表示百分比,Cum表示累积百分比
stata,学习,开发语言
3.cor 变量1 变量2 变量3
其中cor全拼correlate,显示变量1 2 3之间的相关关系
stata,学习,开发语言

6 生成新变量

1.通过generate 简写为gen来实现。
gen lnB=ln(B)
上面命令可定义变量B的对数并生成名为lnB的新变量
gen squareB=B^2
上面命令表示生成新的B的平方变量
2.生成虚拟变量,即只包含0 1的二值项
gen 变量2=1 if 变量11
replace 变量2=0 if 变量2
.
3.rename 变量1 变量一
变量1被重命名为变量一
4.drop 变量1
变量1被删除

7 链接新变量

若需要合并其他数据集中的变量,则要用到merge命令。例如表1中需要加入B变量,该变量位于表2中,其中共同字段为A,则可以通过以下命令来将B合并如表1中:
use C:\ 表1.dta,clear
merge m:1 A using E:\表2.dta , keepusing(B)
drop if _merge2
drop _merge
其中m;1表示数据对应关系为多对1,较为常见,关于merge用法的详解可以参考其他博文:https://blog.csdn.net/qq_42729246/article/details/105623056
keepusing(B)表示只引入B变量,若不加这个可选项则表示引入表2中的全部变量。
drop if _merge
2表示删除不匹配数据
drop _merge表示删除新生成的 _merge变量

8 do文件

stata,学习,开发语言
点击上图的新建do文件,即可撰写代码实现可重复性的使用

9 相关练习

1.计算gdp、college的变异系数
变异系数的公式为V=S/|x ̅ | ,其中S 为标准差,x ̅为平均值。两者均可通过Stata自带的函数进行运算,具体代码如下:
stata,学习,开发语言
计算出来的结果为,gdp的变异系数为0.7695182,college的变异系数为0.4989674(保留小数点后7位)。

stata,学习,开发语言
2.用Stata计算基尼系数
这里我将人口与GDP数据相结合,计算了各省份人均GDP方面的基尼系数。选用公式为
stata,学习,开发语言

其中p_i为地区单元比重,w_i为地区某指标比重,q_i为累积比重。因为要计算人均GDP的基尼系数,因此,p_i为各省份人口所占总人口的比例,w_i为各省份GDP占总GDP的比例,q_i为按人均GDP排序后的累积GDP比例。具体代码如下:
stata,学习,开发语言
计算得到的基尼系数为0.2032725(保留小数点后7位)。
stata,学习,开发语言
3.对trade变量进行极差标准化并赋值给新变量
与上个问题同理,其公式的不同在于分母,换成了最大值减最小值的极差。具体公式为:
stata,学习,开发语言
stata,学习,开发语言
运算结果如下:
stata,学习,开发语言文章来源地址https://www.toymoban.com/news/detail-831907.html

到了这里,关于stata学习笔记(一)stata入门与基本操作的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 深度学习 精选笔记(1)数据基本操作与线性代数

    学习参考: 动手学深度学习2.0 Deep-Learning-with-TensorFlow-book pytorchlightning ①如有冒犯、请联系侵删。 ②已写完的笔记文章会不定时一直修订修改(删、改、增),以达到集多方教程的精华于一文的目的。 ③非常推荐上面(学习参考)的前两个教程,在网上是开源免费的,写的很棒

    2024年03月10日
    浏览(60)
  • 黑马大数据学习笔记4-Hive部署和基本操作

    p48、51、52 https://www.bilibili.com/video/BV1WY4y197g7/?p=48 Hive是分布式运行的框架还是单机运行的? Hive是单机工具,只需要部署在一台服务器即可。 Hive虽然是单机的,但是它可以提交分布式运行的MapReduce程序运行。 我们知道Hive是单机工具后,就需要准备一台服务器供Hive使用即可。

    2024年02月14日
    浏览(47)
  • Matlab基本操作和矩阵输入(郭彦甫视频学习笔记)

    who/whos         查看工作区当前变量 clear         清空工作区的所有变量(慎用) clear  valuable         清除变量valuable clc             清空命令行窗口 clear all         清除工作区所有变量 close all         关闭所有显示的图片 一行代码太长需要换行写可以在后面加 ... 

    2024年02月06日
    浏览(33)
  • Git企业开发控制理论和实操-从入门到深入(二)|Git的基本操作

    那么这里博主先安利一些干货满满的专栏了! 首先是博主的高质量博客的汇总,这个专栏里面的博客,都是博主最最用心写的一部分,干货满满,希望对大家有帮助。 高质量博客汇总 https://blog.csdn.net/yu_cblog/category_12379430.html 然后就是博主最近最花信息的一个专栏《Git企业开

    2024年02月11日
    浏览(50)
  • 从零开始学习Netty - 学习笔记 - NIO基础 - ByteBuffer: 简介和基本操作

    1.1. Channel Buffer Channel 在Java NIO(New I/O)中,“Channel”(通道)是一个重要的概念,用于 在非阻塞I/O操作中进行数据的传输 。Java NIO提供了一种更为灵活和高效的I/O处理方式,相比于传统的I/O,它具有更好的性能和可扩展性。 常见的Java NIO中的通道类型: FileChannel(文件通道

    2024年02月20日
    浏览(48)
  • C语言从入门到精通学习第6天(位运算的基本操作)

    程序中所有的数在计算内存中都是以二进制的形式存储的,位运算是指按二进制进行的运算,位运算的运算速度通常与加法运算相同(仍快于乘法运算),但通常功耗较小,因为资源使用比较小。 在软件开发的过程中,常常要处理二进制的问题,例如: 通过子网掩码求IP地址的

    2023年04月18日
    浏览(46)
  • 学习Nano编辑器:入门指南、安装步骤、基本操作和高级功能

    1.1 关于Nano编辑器 Nano是一个简单易用的文本编辑器,适用于终端环境。它具有轻量级、快速启动和基本功能的特点,非常适合新手使用。 1.2 Nano的起源和特点 Nano最早是Pico编辑器的克隆版本,后来发展成为一个独立且功能更加强大的编辑器。它具有简洁的用户界面、直观的操

    2024年02月04日
    浏览(49)
  • Qt-OpenCV学习笔记--基本函数操作--cv::convertTo(图像类型转换)

    不是所有格式的Mat型数据都能被使用。 目前OpenCV主要只支持单通道和3通道的图像,并且此时要求其深度为8bit和16bit无符号(即CV_16U),所以其他一些数据类型是不支持的,比如说float型等。 如果Mat类型数据的深度和通道数不满足上面的要求,则需要使用convertTo()函数和cvtColor(

    2024年02月04日
    浏览(60)
  • 【详细教程】关于如何使用Git&GitHub的基本操作汇总&GitHub的密钥配置 ->(个人学习记录笔记)

    点击 官网链接 后,进入Git官网,下载安装包 然后根据系统类型进行下载,一般为windows 一般选择64位的安装器版本 下载好后开始安装 点击Next 默认即可,Next 默认即可,Next Next Next Next Next Next Next Next Next Next install即可 我们在桌面随便创建一个文件夹例如code 进入code文件夹 鼠

    2024年02月06日
    浏览(57)
  • nodejs 入门基本操作

    在窗口执行对应的目录即可,我这里是: 如上最简单的http 服务起来了,在浏览器中 输入 http://localhost:9000/index.html 得到如下页面 通过匹配后缀,在public文件中返回对应的资源,代码结构如下 都是一些很简单的代码就不贴了,如果需要留下 邮箱 即可。 其他模块看看官网的文

    2024年02月05日
    浏览(49)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包