Loading...
墨滴

thomas

2021/04/09  阅读:17  主题:橙心

stata编程初步+三种数据类型

stata编程初步+三种数据类型

本讲主要内容

掌握编程的循环语句
应用循环语句进行简单的编程
时间序列的设定
时间序列差分检验

上节内容回顾

知识与思维的层次
数据与数据集
变量分类与运算


数据的运算

我们面临这样一个问题。需要模拟一个100人原始部落的生产函数行为。人们每天出去狩猎,但获取的产出服从1-100之间的随机数,由于每个人营养摄入不能低于0.1,所以当出现入不敷出的情况,将会有有人死去,这样部落将减员。下一次开始的时候将以较少的人员开始。当总体产出超出人数,则按照超出的额度增加新的人数。循环进行无论,看看大家的结果。

将以上情境编程,并循环执行五次,看结果。 操作时间:30分钟


先学一点stata编程基础

set obs 100 \\ 设定100观察值
set seed 20070816 \\ 设定随机种子数(可以任意设定,尽量大一点)
gen x=runiform() \\ 产生随机数,runiform()可以产生0-1之间符合正态分布的随机数


stata加减乘除

gen x1=x2+x3*x4-x5/x6 gen ln_x1=log(x1)


stata 循环语句

forvalue

foreach

stata循环语句

大家试一下吧


交流时间

遇到什么困难?
你是如何克服的?
有什么收获?



面板数据、截面数据、时间序列数据

面板数据含义

面板数据(Panel Data)是将“截面数据”和“时间序列数据”综合起来的一种数据类型。具有“横截面”和“时间序列”两个维度,当这类数据按两个维度进行排列时,数据都排在一个平面上,与排在一条线上的一维数据有着明显的不同,整个表格像是一个面板,所以称为面板数据(Panel Data)。

它是截面上个体在不同时间点的重复测量数据。面板数据从横截面(cross section)看,是由若干个体(entity,unit,individual)在某一时点构成的截面观测值,从纵剖面(longitudinal section)看每个个体都是一个时间序列。

从时空维度来看,可将计量经济学中应用的数据分三类:

1、横截面数据(Cross-sectional data)

横截面数据是指在某一时点收集的不同对象的数据。它对应同一时点上不同空间(对象)所组成的一维数据集合,研究的是某一时点上的某种经济现象,突出空间(对象)的差异。 横截面数据的突出特点就是离散性高。横截面数据体现的是个体的个性,突出个体的差异,通常横截面数据表现的是无规律的而非真正的随机变化。即计量经济学中所谓的“无法观测的异质性”。

在分析横截面数据时,应主要注意两个问题:一是异方差问题,由于数据是在某一时期对个体或地域的样本的采集,不同个体或地域本身就存在差异;二是数据的一致性,主要包括变量的样本容量是否一致、样本的取样时期是否一致、数据的统计标准是否一致。

2、时间序列数据(Time-series data)

时间序列数据是指对同一对象在不同时间连续观察所取得的数据。它着眼于研究对象在时间顺序上的变化,寻找空间(对象)历时发展的规律。利用时间序列作样本时,要注意几个问题:一是所选择的样本区间内经济行为的一致性问题;二是样本数据在不同样本点之间不可比,需要对原始数据进行调整,消除其不可比因素;三是样本观测值过于集中,因而时间序列数据不适宜于对模型中反映长期变化关系的结构参数的估计;四是模型随机误差的序列相关问题。


## 面板数据

Panel Data,是截面数据与时间序列综合起来的一种数据资源。 在分析时,多用PanelData模型,故也被称为面板数据模型. 它可以用于分析各样本在时间序列上组成的数据的特征,它能够综合利用样本信息,通过模型中的参数,既可以分析个体之间的差异情况,又可以描述个体的动态变化特征。


例子

时间序列数据:北京一年来每天的平均温度

截面数据:北京,上海,深圳,广州某一天的平均温度。

面板数据:北京,上海,深圳,广州这一年来每天的平均温度。

时间序列数据:某一个个体随时间变化产生的数据。

截面数据:许多个个体在同一个时间下由于个体不同而产生的数据。

面板数据:前两个的综合——许多个个体由于个体不同以及时间变化产生的数据。


虚拟变量的生成与回归

虚拟变量,哑变量

stata入门——xi,i,回归中自动生成虚拟变量

大家打开stata,使用发到qq群的dofile文件,进行操作。


问题时间


参考视频

Stata面板数据处理——行业效应、地区效应、时间固定效应
虚拟变量,哑变量
秒懂百科虚拟变量
stata入门——xi,i,回归中自动生成虚拟变量


面板数据回归

作者:连玉君 链接:https://zhuanlan.zhihu.com/p/50554575 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

世界是复杂的,所表现出来的行为特征也是复杂的,我们需要面板数据。例如,欲研究影响企业利润的决定因素,我们认为企业规模 (截面维度)和技术进步(时间维度)是两个重要的因素。截面数据仅能研究企业规模对企业利润的影响程度,时间序列数据仅能研究技术进步对企业利润的影响,而面板数据同时考虑了截面和时间两个维度 (从哪个维度看都好看),可以同时研究企业规模和技术进步对企业利润的影响。正因为面板数据所具有的独特优势,许多模型从截面数据扩展到面板数据框架下。通过 findit panel data 命令可以发现目前Stata已有许多相关面板数据模型命令,包括(不限于):xtreg :普通面板数据模型,包括固定效应与随机效应 reghdfe: 多维固定效应模型 xtabond/xtdpdsys/xtabond2/xtdpdqml/xtlsdvc:动态面板数据模型 spxtregress/xsmle: 空间面板数据模型 xthreg:面板门限模型 xtqreg/qregpd/xtrifreg: 面板分位数模型 xtunitroot: 面板单位根检验 xtcointtest/ xtpedroni/xtwest: 面板协整检验 sfpanel: 面板随机前沿模型 xtpmg/xtmg:非平稳异质面板模型


本节内容回顾

循环语句与编程基础
两个例子
三种数据类型
虚拟变量的生成与回归


thomas

2021/04/09  阅读:17  主题:橙心

作者介绍

thomas