Loading...
墨滴

thomas

2021/04/09  阅读:5  主题:橙心

数据与变量

数据与变量

上节回顾

检验、相关性与回归
分组变量假设检验
相关性分析
回归分析
正态性检验
图形检验
异方差调整
多重共线性调整


本节主要内容

知识与思维的层次
数据与数据集
变量分类与运算


知识与思维的层次

布鲁姆知识结构 布鲁姆学习理论 元认知


元认知方法


对话时间

你用来学习(统计学或各种科目)的方法是什么?效果如何?
你为什么使用这种方法而不是别的?
你在生活中经常使用的学习方法是什么?
你是否经历过让你exciting的学习过程?是什么?有什么启示


数据与数据集

经济社会数据平台


变量分类与运算

STATA 中的变量可以划分为三类:分别是数值型,字符型和日期型。变量类型可通过help data type显示。

(一)数值型变量

数值型变量按其精度又可分为五种类型:byte、int、long、float、double。类似于Access中的字节型、整型、长整型、浮点型和双精度型。不同的精度对应着不同的计算运算误差。若多次运算均需四舍五入时,低精度的运算会使计算误差迅速变大,而高的精度却需要占用较多的内存。当运算精度要求很高的时候,需要将变量设置成浮点型或双精度型。

下面的命令可用于存贮类型变换:

recast type varlist [, force]。

(二)字符串变量

字符变量通常是一些需要用文字描述的信息,如:姓名、住址等。常由字母或一些特殊的符号组成。字符变量也可以用来表示定性变量,如性别可用男、女表示。字符串变量也可以由数字来组成,但数字在这里仅代表一些符号而不再是数字,如病历号、身份证等信息。字符串变量通常以英文引号""标注,而且引号不属于字符串的一部分,字符串最多可以达244 个字符。一般用str#来表示字符的。字符串中的大小写属于不同字符,有无空格及空格的位置不同,都表示不同的字符串。

(三)日期型变量

在STATA 中,1960 年1 月1 日被认为是第0 天,因此1959 年12 月31 日为第-1 天,今天为18734 天。日期之间可以进行数学运算。其常用格式有如下几种:%tc、%td、%tw、%tm、%tq、%th、%tg等,详细内容通过help date来显示。

关于上述变量的各类表现形式,可通过help format来显示。


变量转换

字符串转数值

destring varname,replace force

字符串转日期变量

gen datax_x = date(数据表的日期变量“t”, "YMD")

tip:"YMD"的顺序取决于数据表中年月日的顺序!


数据的变量转换例子

将新浪财经的股票历年数据导入stata,注意字符串、日期与数值变量的转换


数据的运算

我们面临这样一个问题。需要模拟一个100人原始部落的生产函数行为。人们每天出去狩猎,但获取的产出服从1-100之间的随机数,由于每个人营养摄入不能低于0.1,所以当出现入不敷出的情况,将会有有人死去,这样部落将减员。下一次开始的时候将以较少的人员开始。当总体产出超出人数,则按照超出的额度增加新的人数。循环进行无论,看看大家的结果。

将以上情境编程,并循环执行五次,看结果。


先学一点stata编程基础

set obs 100 \\ 设定100观察值
set seed 20070816 \\ 设定随机种子数(可以任意设定,尽量大一点)
gen x=uniform() \\ 产生随机数


stata加减乘除

gen x1=x2+x3*x4-x5/x6 gen ln_x1=log(x1)


stata 循环语句

forvalue

foreach

stata循环语句

大家试一下吧


本节内容回顾

知识与思维的层次
数据与数据集
变量分类与运算

thomas

2021/04/09  阅读:5  主题:橙心

作者介绍

thomas