去百度文库,查看完整内容>
内容来自用户:苟烨涛
统计中经常会用到各种检验,如何知道何时用什么检验呢,根据结合自己的工作来说一说:
t检验有单样本t检验,配对t检验和两样本t检验。单样本t检验:是用样本均数代表的未知总体均数和已知总体均数进行比较,来观察此组样本与总体的差异性。配对t检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。
u检验:t检验和就是统计量为t,u的假设检验,两者均是常见的假设检验方法。当样本含量n较大时,样本均数符合正态分布,故可用u检验进行分析。当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t分布),当x为未知分布时应采用秩和检验。F检验又叫方差齐性检验。在两样本t检验中要用到F检验。从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。其中要判断两总体方差是否相等,就可以用F检验。
简单的说就是检验两个样本的方差是否有显著性差异这是选择何种T检验(等方差双样本检验,异方差双样本检验)的前提条件。用途:用于完全随机设计的多个样本均数间的比较,其统计推断是推断各样本所代表的各总体均数是否相等。完全随机设计(
1、科学计数法
数学术语,a*10的n次幂的形式.将一个数字表示成(a*10的n次幂的形式),其中1≤|a|例如:
890314000保留三位有效数字为8.90*10的8次方,8.90*10^8;
839960000保留三位有效数字为8.40*10的8次方,8.40*10^8.
2、中国计数法
中国人在计数时,常常用笔画“正”字,一个“正”字有五画,代表5,两个“正”字就是10,以此类推.这个计数方法简便易懂,很受中国人欢迎.现在很多中国人在统计选票、清点财物等时候,都还保持着用“正”字计数的习惯.
统计方法有: 1、计量资料的统计方法 分析计量资料的统计分析方法可分为参数检验法和非参数检验法。
参数检验法主要为t检验和 方差分析(ANOVN,即F检验)等,两组间均数比较时常用t检验和u检验,两组以上均数比较时常用方差分析;非参数检验法主要包括秩和检验等。t检验可分为单组设计资料的t检验、配对设计资料的t检验和成组设计资料的t检验;当两个小 样本比较时要求两 总体分布为 正态分布且方差齐性,若不能满足以上要求,宜用t 检验或非参数方法( 秩和检验)。
方差分析可用于两个以上 样本均数的比较,应用该方法时,要求各个样本是相互独立的随机样本,各样本来自正态总体且各处理组总体方差齐性。根据设计类型不同,方差分析中又包含了多种不同的方法。
对于 定量资料,应根据所采用的设计类型、资料所具备的条件和分析目的,选用合适的统计分析方法,不应盲目套用t检验和 单因素方差分析。 2、计数资料的统计方法 计数资料的统计方法主要针对四格表和R*C表利用检验进行分析。
检验或u检验,若不能满足 检验:当计数资料呈配对设计时,获得的四格表为配对四格表,其用到的检验公式和校正公式可参考书籍。 R*C表可以分为双向无序,单向有序、双向有序属性相同和双向有序属性不同四类,不同类的行列表根据其研究目的,其选择的方法也不一样。
3、等级资料的统计方法 等级资料(有序变量)是对性质和类别的等级进行分组,再清点每组观察单位个数所得到的资料。在临床医学资料中,常遇到一些定性指标,如临床疗效的评价、疾病的临床分期、病症严重程度的临床分级等,对这些指标常采用分成若干个等级然后分类计数的办法来解决它的量化问题,这样的资料统计上称为等级资料。
统计方法的选择: 统计资料丰富且错综复杂,要想做到合理选用统计分析方法并非易事。对于同一 个资料,若选择不同的统计分析方法处理,有时其结论是截然不同的。
正确选择统计方法的依据是: ①根据研究的目的,明确研究试验设计类型、研究因素与水平数; ②确定数据特征(是否正态分布等)和样本量大小; ③ 正确判断统计资料所对应的类型(计量、计数和等级资料),同时应根据统计方法的适宜条件进行正确的统计量值计算; 最后,还要根据专业知识与资料的实际情况,结合统计学原则,灵活地选择统计分析方法。
计数资料与计量资料医学统计资料按其性质一般分为计数资料与计量资料两类。
不同类型的统计资料应采用不同的统计分析方法。计数资料是先将观察单位按某种属性或类别分成若干组,再清点各组观察单位个数所得到的资料。
如临床某些检验结果用阳性或阴性反应表示,对一批某病患者检验完毕后,清点呈阳性或阴性反应的各有若干例。又如要调查某人群的血型分布,先按a、b、ab、o四型分组,再清点各血型组人数。
计数资料每个观察单位之间没有量的差别,但各组之间具有质的不同,不同性质的观察单位不能归入一组。对这类资料通常是先计算百分比或率等相对数,需要时做百分比或率之间的比较,也可做两事物之间相关的相关分析。
计量资料是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位。如检查一批应征青年体重,需要磅秤测量,通常以公斤为单位,测得许多大小不一的体重值。
其它如身长(cm)、血压(mmhg)、脉搏(次/分)、红细胞(万/mm3)转氨酶(单位)等,都属于计量资料。每个观察单位的观测值之间有量的区别,但同一批观察单位必须是同质的。
对这类资料通常先计算平均数与标准差等指标,需要时做各均数之间的比较或各变量之间的分析。还有一些资料,也是将观察单位按某种属性或某个标志分组,然后清点各组观察单位个数得来的,但所分各组之间具有等级顺序。
这些资料既具有计数资料的特点,又兼有半定量的性质,称为等级资料或半定量资料。例如对一批急性病毒性肝炎患者作麝香草酚絮状试验,将试验结果按-、+、++、+++、++++分组,显然各组之间既有等级顺序,又有程序与量的差别。
又如某病住院病人的治疗结果,按治愈、好转、无效、死亡分组,同样各组之间具有顺序与程度之别。分析等级资料常用的统计指标有比和率,常用的统计方法有秩和检验、参照单位分析等。
在医学实践中,根据分析研究的目的,计数资料与计量资料可以互相转化。例如血压值本是计量资料,但如果将一组20-40岁成年人的血压值分为血压正常与血压异常两组,再清点各组人数,于是这组血压资料就转化成为计数资料了。
假若将这组血压值按低血压(130/90-110毫米汞柱)、重度高血压(>130/>110毫米汞柱)的等级顺序分组,清点各组人数,这时这组血压资料又转化为等级资料了。又如在计量诊断中,将某些阳性体征根据确诊病人的概率赋予分数,分数的多少代表量的大小,这样原来的计数资料就转化为计量资料。
由于计量资料可以得到较多的信息,所以凡能计量的,尽量采用计量资料。
医学论文中常用统计分析方法的合理选择 目前,不少医学论文中的统计分析存在较多的问题。
有报道,经两位专家审稿认为可以发表的稿件中,其统计学误用率为90%-95%。为帮助广大医务工作者提高统计分析水平,本文将介绍医学论文中常用统计分析方法的选择原则及应用过程中的注意事项。
1.t 检验 t检验是英国统计学家W.S.Gosset 1908年根据t分布原理建立起来的一种假设检验方法,常用于计量资料中两个小样本均数的比较。理论上,t检验的应用条件是要求样本来自正态分布的总体,两样本均数比较时,还要求两总体方差相等。
但在实际工作中,与上述条件略有偏离,只要其分布为单峰且近似正态分布,也可应用[2]。 常用的t检验有如下三类:①单个样本t检验:用于推断样本均数代表的总体均数和已知总体均数有无显著性差别。
当样本例数较少(n50)时,这时应用t检验的计算比较繁琐,可选用u检验[5]。 2.方差分析 方差分析适用于两组以上计量资料均数的比较,其应用条件是各组资料取自正态分布的总体且各组资料具有方差齐性。
因此,在应用方差分析之前,同样和成组t检验一样需要对各组资料进行正态性检验、方差齐性检验。 常用的方差分析有如下几类:①完全随机设计的方差分析:主要用于推断完全随机设计的多个样本均数所代表的总体均数之间有无显著性差别。
完全随机设计是将观察对象随机分为两组或多组,每组接受一种处理,形成两个或多个样本。②随机区组设计的方差分析: 随机区组设计首先是将全部受试对象按某种或某些特性分为若干区组,然后区组内的每个研究对象接受不同的处理,通过这种设计,既可以推断处理因素又可以推断区组因素是否对试验效应产生作用。
此外,由于这种设计还使每个区组内研究对象的水平尽可能地相近,减少了个体间差异对研究结果的影响,比成组设计更容易检验出处理因素间的差别。③析因设计的方差分析:将两个或两个以上处理因素的各种浓度水平进行排列组合、交叉分组的试验设计。
它不仅可以检验每个因素各水平之间是否有差异,还可以检验各因素之间是否有交互作用,同时还可以找到处理因素的各种浓度水平之间的最佳组合。此外,还有正交设计、拉丁方设计等多种方差分析法,实验者在应用时可以参考相关的统计学著作。
目前,某些医学论文中有这样的情况,就是用t 检验代替方差分析对实验数据进行统计学处理,这是不可取的。t 检验只适用于推断两个小样本均数之间有无显著性差别,而采用t 检验对多组均数进行两两比较,会增加犯I 型错误的概率,即可能把本来无差别的两个总体均数判为有差别,使结论的可信度降低[6]。
对多个样本均数进行比较时,正确的方法是先进行方差分析,若检验统计量有显著性意义时,再进行多个样本均数的两两(多重)比较。 3.卡方检验(χ2检验) χ2检验是一种用途比较广泛的假设检验方法,但是在医学论文中常用于分类计数资料的假设检验,即用于两个样本率、多个样本率、样本内部构成情况的比较,样本率与总体率的比较,某现象的实际分布与其理论分布的比较。
但是当样本满足正态近似条件时,如样本例数n与样本率p满足条件np与n(1— p)均大于5,则可以计算假设检验统计量u值来进行判断。 常用的χ2 检验分为如下几类:①2*2表χ2 检验:适用于两个样本率或构成比的比较,在应用时,当整个试验的样本例数n≥40且某个理论频数1≤T 值进行连续性校正。
因为T值太小,会导致χ2 值增大,易出现假阳性结论。此外,若样本例数n 值也有偏差,需要用2*2表χ2 检验的确切概率检验法(Fisher确切检验法)。
②配对资料χ2检验:适用于配对设计的两个样本率或构成比的比较,即通过单一样本的数据推断两种处理结果有无显著性差别。在应用时,如果甲处理结果为阳性而乙处理结果为阴性的样本例数n1与甲处理结果为阴性而乙处理结果为阳性的样本例数n2之和 值进行校正。
③R*C表χ2 检验:适用于多个样本率或构成比的比较。在R*C表χ2检验中,若检验统计量有显著性意义时,还需要对多个样本率或构成比进行两两比较,即分割R*C表,使之成为非独立的四格表,并对每两个率之间有无显著性差别作出结论。
2*2表资料在应用时可分为如下几种类型:横断面研究设计的2*2表资料、队列研究设计的2*2表资料、病例-对照研究设计的2*2表资料、配对研究设计的2*2表资料。研究者应注意不同类型的2*2表资料的统计分析方法略有差别,比如在分析队列研究设计的2*2表资料时,如果用χ2公式计算得到P 此外,在进行R*C表χ2检验时,还有如下两个主要的注意事项:首先,T值最好不要 其次,不同类型的R*C表资料选择的统计分析方法是不一样。
①双向无序的R*C表资料:可以选用一般的χ2公式计算。②单向有序的R*C表资料:如果是原因变量为有序变量的单向有序R*C表资料,可以将其视为双向无序的R*C表资料而选用一般的χ2检验公式计算,但如果是结果变量为有序变量的单向有序R*C表资料,选用的统计分析方法有秩和检验、Radit分析和有序变量的logistic回归分析等。
③双向有序且属性不同的R*C表资料:对于这类资料采用的统计分析方法不能一。
声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
蜀ICP备2020033479号-4 Copyright © 2016 学习鸟. 页面生成时间:2.775秒