我的博文
医学论文写作需注意的统计学问题
1. 设计方面的问题
1.1 分组没有严格遵循随机化原则研究对象的分组与抽样离不开随机化原则,在足够样本的前提下,随机抽样,随机分组,明确交代随机方法,各组样本量、基本特征等。随机不等于随便,有的作者滥用随机,只要抽样或分组,一概冠以随机,不描述随机方法,把随意、随便当做随机,使研究结果不可信。
1.2 无对照组或不合理医务科技工作者开展研究的目的就是验证假设是否正确,没有对照,无法做出判断。有的论文无对照组,没有对比观察,所得结论没有说服力。有的论文虽设有对照组,但不是严格的随机分组,组间缺乏可比性,如非同期对照,组间性别、年龄、患病状况不一致等。在实验组和对照组的可比性方面,两组例数要基本一致,否则没有可比性。
1.3 样本含量过少抽取恰当的样本量,结果才有可靠性。有些文章例数太少,这样抽样误差大,导致结果不可靠。研究对象变量标准差小的,样本可以小一些。观察计数指标的样本一般不少于20——30例,计量指标的样本不少于5——10例。有的作者仅仅观察了数例患者,就得出百分之多少的有效率,显然是不恰当的。
对于对比分析,样本太少得出的结果不可靠,往往随着样本量的增大而发生变化。
2. 统计学处理不恰当。
在进行统计学处理时,首先要明白研究资料是计数资料还是计量资料,尽管是一个常识性的问题,但仍有不少作者搞混了。先分类再计数的资料叫计数资料,如A组30例,B组32例,可根据研究目的计算出阳性率、治愈率等。测定某项具体数值的资料叫计量资料,如身高、体重、脉搏、血压等许多物理诊断和化验结果。在医学科研论文中,计数资料最常用的统计学方法是检验,计量资料最常用的是t检验。在研究设计时,就应根据研究资料的特点,决定假设检验的方法。在处理资料时,因均数和标准差是用来描述正态分布资料集中和离散趋势的指标,可否采用均数±标准差描述研究资料的分布特征,首先要看资料是否是正态分布,如果资料不是正态分布或者方差不齐时,应对资料进行转换处理,使其符合正态分布,方差齐性后采用t检验或方差分析,达不到上述要求,用秩和检验。来稿中,不少作者不考虑适用条件,盲目使用t检验。造成统计学方法使用不当,结果不可靠。更有甚者,有的作者不分计数资料还是计量资料,乱用 检验或t检验,其结果可想而知。这是无统计学常识或极不负责任的表现。
有的研究资料数据庞大,只能在表格描述中用阿.拉伯数字或特殊符号表示与比较对象的P值,如P>0.05,P<0.05,P<0.01,无法一一给出具体的P值。但有的作者既不交代使用的统计学方法,也不给出具体的P值,直接列出P<0.05或P>0.05,认为差异有统计学意义或无统计学意义,使读者对无法判断结果的可靠性。正确的做法是写明使用的统计学方法,使用了什么统计学软.件,如进行了校正检验。亦应说明。这才有说服力。
3. 描述不严谨。
日常生活中对差异的判断与统计学上差异是否有统计学意义是两个完全不同的概念。我们主观上感觉差异不大,而经统计学处理差异可能具有统计学意义;主观上感觉差别很大,但经统计学处理差异可能有统计学意义。有相当数量的作者,在描述统计学结果时,常用差异显着或差异非常显着,易与日常生活中差异的概念混淆,使用差异有统计学意义或差异无统计学意义更为确切。
我们把检验水准设定为a=0.05时就是以P>0.05为界值,一般以P>0.05,P<0.05,P<0.O1 3个档次描述差异有无统计学意义即可,有的作者出现P<0.001,以强调差异的显着性。有的作者用P>O.01或P<0.1来表示,是错误的,P>0.O1既可能是P>0.05,也可能是P<0.05,二者有本质的不同。
4. 统计符号使用不规范。
统计符号使用不规范是论文中经常出现的问题,把卡方检验中的 写成x或x2,丢掉平方或把希腊字母x写成英文字母x;把均数±标准差( ±s),丢掉z 上方的一横,既影响论文质量,又影响阅读效果。
5. 统计表格不规范。
统计表格是论文的重要组成部分,表格是否符合统计学要求,对论文有重要影响。常见的问题有:
①无表题;②表题过于简单或过于繁琐。不确切;③横纵标目倒置,不符合语法规律;④ 标目层次过多;⑤线条太多。甚至左上角有斜线;⑥ 表内同一栏目数字不对齐,小数点后位数不一致。表题如同文章的题目,简明扼要,字数控制在15个字以内。表格左侧的标目叫横标目,相当于汉语的主语,表明相应横行内数字的涵义;纵标目位于表格的上方,相当于汉语的谓语部分,说明表格内相应纵行数字的涵义。
主谓语倒置是统计表格最常见的错误,一般情况下主语做横标目,谓语做纵标目。统计表用三线表,即顶线、底线和隔开纵标目与表内数字的横线,必要时可在纵标目下加辅助线,其余线条一概省略。
统计表格和文字叙述相辅相成,互相补充,能用简洁的文字说明的,一般不用表格,文字描述不要和表格内容完全重复。表格要简洁明快,重点突出,让人一目了然,不要变成数字的堆彻。出现统计表前,要用简要文字描述或强调主要发现,不要把文字叙述放在表格后。
6 使用统计指标不当。
常见的问题是率与构成比、发病率与患病率、死亡率与病死率等的混淆。
6.1 把构成比当率构成比是说明事物或现象内部各构成部分的比重,构成比表示某事物内部各组成部分的比重或分布,单位为%,各组成部分之和应为100%。计算公式为:构成比=某组成部分的观察单位数/同一事物各组成的观察单位总数例如2011年某市围产儿死亡总数为18例,其中死胎7例、死产3例、新生儿死亡8例。其构成比分另0为38.89%、16.67%、44.44%。
率为表示某种现象发生的频率或强度。常以%、/万或/lo万表示。计算公式为率=某时期内某现象实际观察单位数/同时期内可能发生该现象的观察单位总数,如共检测568名5——7岁儿童,患龋齿儿童314人,检出率55.28%。
构成比和率都是相对数指标。有一篇题为某年某地区4种乙类传染病疫情分析。经数据处理后,作者认为,4种传染病的发病率依次为痢疾54.53%(1546/2 835)、肝炎16.19%(459/2 835)、乙脑9.21%(261/2 835)、流脑6.89% (569/283520.07)。该资料是构成比,不是发病率。作者犯了以比代率的错误。
6.2 发病率与患病率发病率是指观察期内(年、季、月等)新发生某病的例数与同期平均人口数之比,强调在观察期内的新发病例数,常以‰ 、/7/或/lO万表示。其计算公式为:某病发病率等于某年(期)内所发生的新病例数除以同年(期)平均人口数乘1000%o。例如某地某年年平均人口数为2500人,白喉发病28人,该地白喉年发病率为11.20%0。而患病率则指观察时点的某病的现患病例数与该时点人口数之比.强调的是该观察时点上某病的现患(新、旧病例)情况,常以百分率表示。有人调查16 875人,其中男性8 674人,沙眼患者7 632人,发病率为87.99%;女性8 201人,沙眼患者6 210人。发病率为75.72%。这样的结论当然是错误的,其所描述的结果应该是患病率。
6.3 死亡率与病死率这也是两个容易混淆的指标。某病死亡率是观察人群中某病的死亡频率。常以‰、/万或/10万表示;某病病死率是某病患者中因该病而死亡的频率。
一般以百分率表示。前者反映人群因该病而死亡的频率,后者反映疾病的预后。部分作者常将某病住院病死率误为某病死亡率。如重症监护室患者死亡情况分析一文中报道,颅脑损伤32例,死亡20例,死亡率为62.5%;严重心衰26例,死亡9例,死亡率为34.6%;严重肾衰竭18例,死亡11例,死亡率为61.1%。很明显,作者在这里是将住院病死率误作死亡率来讨论。
我们在编辑医学论文中经常会发现存在这样那样的统计学问题,致使文章质量下降,甚至无法刊用,十分可惜。提高统计学应用水平,减少统计学差错,是作者、审稿专家和编辑共同的责任。树立严谨的科学态度,选择正确的统计学方法,对提高科研水平,确保论文质量有着十分重要的意义。
共0条评论