第90章 努力更改(1/1)
在临床研究中一定会涉及数据的收集、存储和管理。如果研究经费不足以购买大的数据管理系统,那么在临床研究中用的最多的数据管理软件就是Access、Excel和EpiData了。当然也有很多“高大上”的研究有专职的数据管理团队和管理系统,近年来基于网络的数据收集与管理系统发展迅猛,相继出现了各种数据管理与数据托管系统,规模较大的研究也常有CRO公司参与。
但是对于个体的临床医师或小的临床科研团队而言,研究开展之初可能并没有经费支持,此时就只能靠自己来开展数据收集、录入和整理工作了。今天我们给大家介绍一款小而精的数据管理软件和它的拓展平台。
说到EpiData,可能会有人说Excel也挺好的啊。的确Excel也不错,而且有还算不错的统计功能和强大的作图功能。但是当我们需要管理几百个病例,每个病例有上百个变量的数据时,用Excel真的能让你眼花缭乱。不过如果您的研究是基础研究,一共就18只老鼠,每只老鼠3个数据,那真心没必要使用EpiData进行数据管理。EpiData自开发以来,一直受到大家广泛的青睐。它的数据录入和管理功能,就像那句广告词一样,简约而不简单!
EpiData最早由丹麦的Jens M.Lauritsen发起。最初是作为Funen县开展的“预防意外伤害行动”(initiative for act prevention)中的一部分,后来Mark Myatt和Michael Bruus参与到研发小组中,并希望将EpiData开发成为一个简单、易用和独立的应用程序。EpiData软件具有体积小、安装方便、录入和管理数据便捷等优势。它的使用流程如下:建立数据录入结构文件(QES文件),使用者可依据自己的课题建立合适的数据录入文件结构;②依据QES文件生成数据信息存储文件(REC文件),REC文件可依次录入问卷信息;③建立数据核查文件(CHK文件),CHK文件用于数据录入过程中的各项管理和控制;④数据录入;⑤数据处理,包括数据展示、简单的统计描述、双录入核对等功能;⑥数据导出,可导出各类常用的数据格式,适合STATA、SPSS和SAS等统计软件使用。至此一套完整的数据流程就走完了,便可以进行数据统计分析了。
我们跟大家一起讨论了EpiData的安装以及各种调试,经过调试之后能够避免不少使用过程中会出现的小错误。在本期中,我们来聊聊EpiData中的一个常用的概念—变量及其类型。
变量这个词源于数学,意思就是会变化的量或未知和未定的量,它是相对于常量而言的。常量不是会变化的量,而是保持不变的量。在计算机语言中,变量指能够储存计算结果或能够表示值的抽象概念,变量可以通过变量名访问。
在EpiData中有四种变量类型,分别是数值型、字符型(文本型)、日期型和其他。下面我们就一一介绍一下这四种类型的变量:
14.1在对数值型变量进行定义时,我们只需要定义其小数点前后的位数即可。它的最大支持是14位(小数点算一位),即小数点及其前后的数字最多14位。这个应该足够用了。针对多选题的设计,需要将每个选项作为一个单独的变量进行设计,以方便后期的统计分析。
14.2在对文本型变量进行定义时,首先需要定义文本类型(文本、大写文本和加密字段),然后再定义文本的长度,EpiData最长支持80个字符的长度,也就是可以录入40个汉字,如果有的文本题过长,那么可以为其设置两个变量。“大写文本”中输入的英文会自动转为大写字母,“加密文本”是对REC文件进行加密,你需要输入密码才能录入和导出数据。
14.3定义日期型变量时,有日月年、月日年和年月日三种,另外还有自动插入日期,它自动插入的是系统的当前日期,也有上述三种类型。
14.4在其他型变量中有:自动ID号,就是每次录入一个问卷的时候会依次生成一个编号。②声音提示(soundex),它是依据Soundex码来对文本进行编码,主要用来进行隐私保护它可以将发音相似的姓赋予同样的编码。但是对于中文就真心没用了,因为Soundex码是用来编码英文字母的,至于中文和数字它都会编码为“-000”。③逻辑是否,就是只能输入0和1两个值,0是N,1是Y。
下面我们聊聊EpiData使用一般流程吧。首先你需要建立一个待录入问卷,也就是QES问卷。在设计QES文件时需要注意一些小问题,如多选题的设计需要将每个选项拆为一个独立的变量,这样会方便后期的统计分析。在既往病史的设计时,也最好将既往病史拆成不同的变量进行录入处理。在处理身份证号的时候,需要将身份证号设定为字符型变量,因为一方面EpiData的数值变量只支持14个字符长度,另一方面一些身份证号码是以X结尾,定义为数值变量会导致无法输入完整身份证号码。在设计日期型变量的时候,如果不能保证日期的获得足够完整,那么最好将日期拆成年、月、日三个变量,这样在日缺失的时候,至少还可以输入年和月的信息。
再然后就是做CHK文件,CHK文件不是必须的,但是如果有就会防范一些错误。比如设置唯一的ID,这样在文件录入的过程的如果你录入了之前录过的ID,就会提示你该ID已存在。下图是check的插入和编辑窗口。