我的博文
EpiData:科研数据录入与管理的必备神器
来源:一起学统计软件
1.没有数据库的基础知识,不知道如何处理临床纷繁复杂的数据;
2.在大量数据录入时容易出现错误。而数据录入软件Epidata具有简单、好用、实用的特点,极其方便临床医生使用。
EpiData主要用于数据输入。它可以将我们在临床观察之中所使用的观察表格“计算机化”,计算机上的表格可以与我们的观察表完全一样,使得数据输入变得直观、简便。 EpiData由三种基本文件组成: 1) .QES文件(调查表文件文件),它的作用是定义调查表(问卷)的结构。 2) .REC文件 (数据文件),它包括数据以及已经定义好的编码。 3) .CHK文件 (数据录入核查文件),数据输入字段的有效性规则。 字段是Epidata中最重要的概念,每个字段就是我们临床观察表中的一个小项目。它包括: 1)字段的名称,它是给计算机识别的字段的名字,如V1、V2等,当然如果我们不去专门定义的话,Epidata可以自动给字段定义一个名称。 2)字段的文本描述,即解释这个字段在我们临床观察表之中所代表的具体观察指标,如年龄、性别、检查结果等。 3)字段的数据变量,根据字段的性质,可以规定该字段的变量及变量长度,Epidata支持的数据变量有:数字、文本、大写文本、欧洲日期、美国日期、布尔函数、自动 ID-号、声索引字段等,可以基本满足临床观察的需要。 运行EpiData.exe会出现程序运行界面(图1)。 第一行是EpiData菜单栏,所有命令都可以在其中找到: 1.文件,下列菜单有:新建文件、打开文件、选项、近期使用的文件名及退出等。 2.数据核对,下列菜单有:增加/更改检查项。 3.数据输入/输出,下列菜单有:数据输入/修改、根据调查表文件(.QES)产生新的数据文件、备份数据文件、导入数据、数据输出、追加/合并数据文件等。 4.其他功能,下列菜单有:显示数据文件结构、数据输入的信息、检查数据、显示数据列表、变量基本描述(编码表)、对两个相同数据文件进行有效性检查、合理性检查、计算记录数等。 5.工具,下列菜单有:根据数据文件生成调查表文件、清理数据文件、重建索引、根据修改的调查表更新数据文件、更改字段名、编辑数据文件标签、复制数据文件结构、颜色表、数据重新编码、删除所有核对命令、压缩数据文件、创建文档、恢复文档等。 6.窗口设置,下列菜单有:水平平铺、垂直平铺、重叠窗口、显示所有窗口、工具栏等。 7.帮助。 第二行是EpiData工作过程工具栏,有6个项目:1建立调查表文件,2生成数据文件,3添加核对命令,4数据录入,5其他功能,6数据输出。 第三行是EpiData常用的几个快捷工具按钮,大多数是与我们常用的word软件相似,如:新建文件、打开文件、保存、复制、粘贴、剪切等工具按钮,其中“数据表预览、选择字段类型、数码编辑器”按钮是EpiData比较独特的。 编辑数据表文件就在下面的空白部分。 3.1建立调查表文件 点击“建立调查表文件”按钮,选择“建立新调查表文件”,命名为“脑血管病人血脂调查表”并进行保存。这时生成的是.QES文件。 3.1.1 打开原始的调查表(图2)。 3.1.2 根据原始表格在EpiData输入相关内容。在“姓名”之后,点击“选择字段类型”按钮,在选项卡片之中选择“文本”,设置为文本,长度8个字节(注意一个汉字的长度需要2个字节),点击“插入”按钮(图3) 3.1.3 依此类推将其他观察指标进行输入并保存(图4) 3.1.4 点击数据表预览按钮,一张电子观察表就诞生了(图5) 3.2建立数据文件 虽然生成的数据预览表与我们的原始观察表很相似,但是这时还不能进行数据的录入,我们需要建立数据文件,即.REC文件。 这个步骤很简单。点击“生成数据文件”按钮,选择“生成数据文件”,软件会自动提示要由我们刚刚作成的“脑血管病人血脂调查表.QES”文件,生成“脑血管病人血脂调查表.REC”文件(图6),直接选择确定,这时,软件会要求输入对数据文件的描述(数据文件标签),这里最好输入录入者的姓名,比如“陈医生”。 3.3数据输入 点击“输入数据”按钮,打开“脑血管病人血脂调查表.REC”文件,这时会出现与“数据表预览”时看到的一样的表格,不过这个表格是可以填写的,现在我们就可以一项一项将数据输入,数据录入完整后,软件会自动提醒进行保存(图7),确认保存之后就可以输入下一张表格的数据了。 3.4数据输出 点击“数据输出”按钮,选择“脑血管病人血脂调查表.REC”文件。EpiData为我们提供了丰富的数据输出类型,如文本文件、dBase III、Excel 文件、Stata 文件、spss文件、sas文件等,大大方便了我们后期对数据的处理。图8为输出的文本文件,图9为输出的excel文件。 用我们上述介绍的方法已经足以完成一个临床观察表的数字化,并且可以顺利地将数据输出并进行统计计算。但是Epidata的功能不仅于此,我们知道,Epidata有三种主要文件,上面的方法只涉及了.QES文件和.REC文件,.CHK文件有什么作用呢? 我们对于某些字段的数据并不满足于仅仅是长度或位数的设置,Epidata提供了对这些字段的进一步设置功能。点击工作过程工具条中“添加核对命令”按钮,仍旧选择“脑血管病人血脂调查表.REC”这个数据文件,同样会出现我们做好的电子表格,这时软件也会自动生成同名的.CHK文件,同时会有一个数据核对窗口(如图10)。 可以看到这个数据核对窗口上半部是字段的名称、字段的内容及字段数据类型,下半部份就是我们需要设置的内容了。 4.1 Rang,Legal:是定义一个字段的数字范围及合理数。例如,我们对“年龄”字段进行设置,输入“50-85”(图11),表示这个字段只能输入50~80的数字,否则软件会弹出错误信息。 同样,对“性别”字段我们可以将Rang,Legal设置为“男,女”,那么在录入数据时,一旦输入任何其他文字,软件也会弹出错误信息(图12)。 4.2 Jump:跳转命令。临床上有些问题只是需要部分人来回答,例如当前字段为性别sex (1=male, 2=female) ,则可定义如果sex=1跳转至字段V23,而当sex=2跳转至V40,我们就可以在Jump后填入1>V23, 2>V40。 4.3 Must enter:如果当前字段必须输入数据,则需要使用这个规则,选择Yes。Epidata的默认选择为No。 4.4 Repeat:如果在编辑表中Repeat选择项中选择“Yes”则前一个记录中的该字段值将自动出现在下一个记录的该字段中,当然这个数值是可以改变的。 4.5 Value label:是将一组具有解释数值意义的文本与数值结合。例如,我们对“职业”这个字段进行设置,点击Value label后的“+”,在“数据编辑标签”中设置数字和其所代表的职业,数字和职业之间用空格分开,选择“接受并关闭”(图13)。 当录入职业时,按F9键,这时会弹出一张转换表,我们可以分别选择1,2,3,4,5,6分别代表工人,干部,职员,教师,农民,其他(图14)。 为了保证数据录入的可靠性,我们可以让两个人分别输入同样的一组调查表数据,Epidata提供了对两个相同数据文件的检查功能。 我们还是以“脑血管病人血脂调查表.QES ”调查表文件生成“脑血管病人血脂调查表1.REC”数据文件,用“章医生”作为数据文件标签,录入和“脑血管病人血脂调查表.REC”(文件标签是“陈医生”)同样的数据,当然为了检验Epidata的数据检查功能,部分字段的变量是不同的。 点击工作过程工具条中“其他功能”按钮,选择“对两个相同数据文件进行有效性检查”,选择“章医生”和“陈医生”录入的两个数据文件,Epidata会自动对两个文件进行比较,并给出报告,这时我们发现这两个数据文件“记录1”的“FIELD5”和“记录3”的“AA”变量是不一样的(图15),追溯原表,我们发现是“记录1”和“记录3”中的“学历”和“病案号”的录入有错误。这个报告也可以存成.not文件,方便将来核查及修改。 EpiData的这些功能已经能够满足一般临床科研观察数据的需要,当然如果你还有一些编程的知识就可以更好地使用这个软件。Epidata是一个免费软件,有中文版,目前最新的版本号是3.1版。希望大家能试用一下这个软件,你会觉得它对你的临床科研有很大的帮助的。
图1
图2
图3
图4
图5
图6
图7
图8
图9
图10
图11
图12
图13
图14
图15
v
共0条评论