Loading...
墨滴

Isaacruan

2021/04/20  阅读:48  主题:WeChat-Format

isaac测试

**NHANES专题 | **(一) NHANES数据的下载(R版)

全文约700字,预计阅读时间10min

1. HNAHES数据库简介

HNAHES全称是National Health and Nutrition Examination Survey,即美国国家健康与营养调查,是国家卫生统计中心的主要计划,始于20世纪60年代初期,旨在评估美国成人和儿童的健康和营养状况。该调查将家庭访谈和健康体检相结合,免费提供全面的人口统计学、生物学、社会心理学及行为学等信息

尝试过MIMIC数据库的小伙伴也曾吐槽过数据下载相当的繁琐,包括伦理考试→申请→几十g的数据下载。整个过程下来不说历经九九八十一难,也是被累得够呛。那么,对于想拿别人的数据做自己临床研究的同学,我想告诉你们一个好消息:NHANES的数据下载:无需伦理!无需审核!官网点击即可下载:smirk:


2. NHANES数据下载(以R示范)

首先,通过侧面的Search Variables确定寄己所需变量的周期和所在的表单,然后修改代码的参数,即可下载。 下面是通过R下载NHANES数据的操作视频,文字版和代码见视频下方:

(手工划重点:spss版本也在赶来的路上,敬请期待:smirk:)

2.1 通过自定义函数下载

下载步骤: 1. 自定义函数downloadNHANES(无需修改)→→2.填写需要下载数据的年份和对应编号(即下方代码中红色的部分)→→3.运行代码

install.packages(dplyr) ##仅第一次使用需要安装

##自定义函数“downloadNHANES”
library(dplyr)
downloadNHANES <- function(fileprefix){
  print (fileprefix)
  outdf <- data.frame(NULL)
  for (j in 1:length(letters)){
    urlstring <- paste('https://wwwn.cdc.gov/nchs/nhanes/',yrs[j],'/',fileprefix,letters[j],'.XPT', sep='')
    download.file(urlstring, tf <- tempfile(), mode="wb")
    tmpframe <- foreign::read.xport(tf)
    outdf <- bind_rows(outdf, tmpframe)
  }
  return(outdf)
}   ##以上为自定义函数,无须修改

## 以下红字部分需要根实际情况作修改:
yrs <- c('2013-2014')  ##修改年份
letters <- c('_H')  ##修改年份对应编号(大小写均可)
DEMO_H<- downloadNHANES('DEMO')  ##确定表单并下载
write.csv(DEMO_H, 'D:/NHANSE/data2/DEMO_H.csv')   ##保存
2.2 通过“RNHANES”包下载
install.packages('RNHANES')##仅第一次使用需要安装
#
library(RNHANES)
DEMO_H<- nhanes_load_data("DEMO_H""2013-2014", destination = "D:/NHANSE/data2")##下载及自动保存
2.3 注意

下载后需要核对下载文件的大小,因为可能出现下载不完整的情况!  如图所示即为下载不完整:

下载不全.png
下载不全.png

如果核对发现下载文件大小与网页文件大小一致,即为成功。如否,则删除下载文件后再次运行代码下载。 

2.4 补充

有时候代码无法下载相应表单(例如文件地址有改动),可通过官网下载。下载后可通过R进行格式转换,见下方代码

install.packages('haven')
library(haven) ##加载haven包

mydata <- read_xpt("D:/NHANSE/data1/DEMO_H.XPT")  ##转格式
write.csv(mydata, "D:/NHANSE/data2/DEMO_H.csv")  ##保存

单个NHANES数据表单下载讲完啦,有木有很简单!想不想试一试呢?:smirk: 但是!(凡事最怕有个但是:joy:?) solo表单可能不足以支撑起1篇SCI或者数据玩耍的任务……那么,怎样组团下载表单以及把散落各处的表单整合起来呢? 且听我们下回分晓吧


下节预告

1. NHANES专题 | (二) NHANES表单的整合

2. spss版本已在赶来的路上,敬请期待:smirk:

Isaacruan

2021/04/20  阅读:48  主题:WeChat-Format

作者介绍

Isaacruan