我的博文

EpiData:科研数据录入与管理的必备神器

2016-07-03 17:33  阅读(4717)  评论(0)  分类:软件学习

来源:一起学统计软件 

在临床科研观察中,通常我们先要作出一个详尽的病例观察表用来采集临床资料,当这些资料积累到一定数量,我们会将它们输入计算机,使其数字化,方便保存和管理,最后再将这些数据进行统计学处理,找出其中规律性的东西。其中使临床资料数字化是承上启下的一步,对于从事临床工作的医生来说主要存在几个问题:

1.没有数据库的基础知识,不知道如何处理临床纷繁复杂的数据;

2.在大量数据录入时容易出现错误。而数据录入软件Epidata具有简单、好用、实用的特点,极其方便临床医生使用。

1.Epidata的基础知识

EpiData主要用于数据输入。它可以将我们在临床观察之中所使用的观察表格“计算机化”,计算机上的表格可以与我们的观察表完全一样,使得数据输入变得直观、简便。

EpiData由三种基本文件组成:

1) .QES文件(调查表文件文件),它的作用是定义调查表(问卷)的结构。

2) .REC文件 (数据文件),它包括数据以及已经定义好的编码。

3) .CHK文件 (数据录入核查文件),数据输入字段的有效性规则。

字段是Epidata中最重要的概念,每个字段就是我们临床观察表中的一个小项目。它包括:

1)字段的名称,它是给计算机识别的字段的名字,如V1、V2等,当然如果我们不去专门定义的话,Epidata可以自动给字段定义一个名称。

2)字段的文本描述,即解释这个字段在我们临床观察表之中所代表的具体观察指标,如年龄、性别、检查结果等。

3)字段的数据变量,根据字段的性质,可以规定该字段的变量及变量长度,Epidata支持的数据变量有:数字、文本、大写文本、欧洲日期、美国日期、布尔函数、自动 ID-号、声索引字段等,可以基本满足临床观察的需要。

2. EpiData运行界面介绍

运行EpiData.exe会出现程序运行界面(图1)。

EpiData:科研数据录入与管理的必备神器
图1

第一行是EpiData菜单栏,所有命令都可以在其中找到:

1.文件,下列菜单有:新建文件、打开文件、选项、近期使用的文件名及退出等。

2.数据核对,下列菜单有:增加/更改检查项。

3.数据输入/输出,下列菜单有:数据输入/修改、根据调查表文件(.QES)产生新的数据文件、备份数据文件、导入数据、数据输出、追加/合并数据文件等。

4.其他功能,下列菜单有:显示数据文件结构、数据输入的信息、检查数据、显示数据列表、变量基本描述(编码表)、对两个相同数据文件进行有效性检查、合理性检查、计算记录数等。

5.工具,下列菜单有:根据数据文件生成调查表文件、清理数据文件、重建索引、根据修改的调查表更新数据文件、更改字段名、编辑数据文件标签、复制数据文件结构、颜色表、数据重新编码、删除所有核对命令、压缩数据文件、创建文档、恢复文档等。

6.窗口设置,下列菜单有:水平平铺、垂直平铺、重叠窗口、显示所有窗口、工具栏等。

7.帮助

第二行是EpiData工作过程工具栏,有6个项目:1建立调查表文件,2生成数据文件,3添加核对命令,4数据录入,5其他功能,6数据输出。

第三行是EpiData常用的几个快捷工具按钮,大多数是与我们常用的word软件相似,如:新建文件、打开文件、保存、复制、粘贴、剪切等工具按钮,其中“数据表预览、选择字段类型、数码编辑器”按钮是EpiData比较独特的。

编辑数据表文件就在下面的空白部分。


3.使用EpiData建立临床数据录入表

3.1建立调查表文件

点击“建立调查表文件”按钮,选择“建立新调查表文件”,命名为“脑血管病人血脂调查表”并进行保存。这时生成的是.QES文件。

3.1.1 打开原始的调查表(图2)。

EpiData:科研数据录入与管理的必备神器
图2

3.1.2 根据原始表格在EpiData输入相关内容。在“姓名”之后,点击“选择字段类型”按钮,在选项卡片之中选择“文本”,设置为文本,长度8个字节(注意一个汉字的长度需要2个字节),点击“插入”按钮(图3)

EpiData:科研数据录入与管理的必备神器
图3

3.1.3 依此类推将其他观察指标进行输入并保存(图4)

EpiData:科研数据录入与管理的必备神器
图4

3.1.4 点击数据表预览按钮,一张电子观察表就诞生了(图5)

EpiData:科研数据录入与管理的必备神器
图5

3.2建立数据文件

虽然生成的数据预览表与我们的原始观察表很相似,但是这时还不能进行数据的录入,我们需要建立数据文件,即.REC文件。

这个步骤很简单。点击“生成数据文件”按钮,选择“生成数据文件”,软件会自动提示要由我们刚刚作成的“脑血管病人血脂调查表.QES”文件,生成“脑血管病人血脂调查表.REC”文件(图6),直接选择确定,这时,软件会要求输入对数据文件的描述(数据文件标签),这里最好输入录入者的姓名,比如“陈医生”。

EpiData:科研数据录入与管理的必备神器
图6

3.3数据输入

点击“输入数据”按钮,打开“脑血管病人血脂调查表.REC”文件,这时会出现与“数据表预览”时看到的一样的表格,不过这个表格是可以填写的,现在我们就可以一项一项将数据输入,数据录入完整后,软件会自动提醒进行保存(图7),确认保存之后就可以输入下一张表格的数据了。

EpiData:科研数据录入与管理的必备神器
图7

3.4数据输出

点击“数据输出”按钮,选择“脑血管病人血脂调查表.REC”文件。EpiData为我们提供了丰富的数据输出类型,如文本文件、dBase III、Excel 文件、Stata 文件、spss文件、sas文件等,大大方便了我们后期对数据的处理。图8为输出的文本文件,图9为输出的excel文件。

EpiData:科研数据录入与管理的必备神器
图8

EpiData:科研数据录入与管理的必备神器
图9


4.优化数据表

用我们上述介绍的方法已经足以完成一个临床观察表的数字化,并且可以顺利地将数据输出并进行统计计算。但是Epidata的功能不仅于此,我们知道,Epidata有三种主要文件,上面的方法只涉及了.QES文件和.REC文件,.CHK文件有什么作用呢?

我们对于某些字段的数据并不满足于仅仅是长度或位数的设置,Epidata提供了对这些字段的进一步设置功能。点击工作过程工具条中“添加核对命令”按钮,仍旧选择“脑血管病人血脂调查表.REC”这个数据文件,同样会出现我们做好的电子表格,这时软件也会自动生成同名的.CHK文件,同时会有一个数据核对窗口(如图10)。

EpiData:科研数据录入与管理的必备神器
图10

可以看到这个数据核对窗口上半部是字段的名称、字段的内容及字段数据类型,下半部份就是我们需要设置的内容了。

4.1 Rang,Legal:是定义一个字段的数字范围及合理数。例如,我们对“年龄”字段进行设置,输入“50-85”(图11),表示这个字段只能输入50~80的数字,否则软件会弹出错误信息。

EpiData:科研数据录入与管理的必备神器
图11

同样,对“性别”字段我们可以将Rang,Legal设置为“男,女”,那么在录入数据时,一旦输入任何其他文字,软件也会弹出错误信息(图12)。

EpiData:科研数据录入与管理的必备神器
图12

4.2 Jump:跳转命令。临床上有些问题只是需要部分人来回答,例如当前字段为性别sex (1=male, 2=female) ,则可定义如果sex=1跳转至字段V23,而当sex=2跳转至V40,我们就可以在Jump后填入1>V23, 2>V40。

4.3 Must enter:如果当前字段必须输入数据,则需要使用这个规则,选择Yes。Epidata的默认选择为No。

4.4 Repeat:如果在编辑表中Repeat选择项中选择“Yes”则前一个记录中的该字段值将自动出现在下一个记录的该字段中,当然这个数值是可以改变的。

4.5 Value label:是将一组具有解释数值意义的文本与数值结合。例如,我们对“职业”这个字段进行设置,点击Value label后的“+”,在“数据编辑标签”中设置数字和其所代表的职业,数字和职业之间用空格分开,选择“接受并关闭”(图13)。

EpiData:科研数据录入与管理的必备神器
图13

当录入职业时,按F9键,这时会弹出一张转换表,我们可以分别选择1,2,3,4,5,6分别代表工人,干部,职员,教师,农民,其他(图14)。

EpiData:科研数据录入与管理的必备神器
图14


5.如何核查数据文件

为了保证数据录入的可靠性,我们可以让两个人分别输入同样的一组调查表数据,Epidata提供了对两个相同数据文件的检查功能。

我们还是以“脑血管病人血脂调查表.QES ”调查表文件生成“脑血管病人血脂调查表1.REC”数据文件,用“章医生”作为数据文件标签,录入和“脑血管病人血脂调查表.REC”(文件标签是“陈医生”)同样的数据,当然为了检验Epidata的数据检查功能,部分字段的变量是不同的。

点击工作过程工具条中“其他功能”按钮,选择“对两个相同数据文件进行有效性检查”,选择“章医生”和“陈医生”录入的两个数据文件,Epidata会自动对两个文件进行比较,并给出报告,这时我们发现这两个数据文件“记录1”的“FIELD5”和“记录3”的“AA”变量是不一样的(图15),追溯原表,我们发现是“记录1”和“记录3”中的“学历”和“病案号”的录入有错误。这个报告也可以存成.not文件,方便将来核查及修改。

EpiData:科研数据录入与管理的必备神器
图15

EpiData的这些功能已经能够满足一般临床科研观察数据的需要,当然如果你还有一些编程的知识就可以更好地使用这个软件。Epidata是一个免费软件,有中文版,目前最新的版本号是3.1版。希望大家能试用一下这个软件,你会觉得它对你的临床科研有很大的帮助的。

v

 

我要评论

0条评论