区分度是高考试题分析的一个指标,反映了试题对考生素质的区分情况。其数值在-1~1之间,数值越高,说明试题设计的越好。
参数含义
反应一个题目的鉴别能力,由其可得到三方面的信息:题目能否有效的测量或预测所要了解的某些特性或正态;题目能否与其他题目一致的分辩被试;以及被试在该题的得分和测验总分数间的一致性如何。区分度取值介于(-1,+1)。
输入
高分组(即得分最高的27%)被试在该题上的通过率(PH),低分组(即得分最低的27%)被试在该题上的通过率(PD)
操作
D=PH-P L
PH:等于“假设被试群体是高分组时算出来的难度值”
P L:等于“假设被试群体是低分组时算出来的难度值”
输出
区分度(D)
区分度是指测试题目对所测试的属性的鉴别力,也就是测试的效度。区分度是衡量题目质量的主要指标之一,是筛选题目的依据。如果测试的区分度高,则该测试的信度必然理想,因此提高区分度是提高测试信度的方法。测题的区分度和难度关系也很密切。太难、太易的题目,区分度都不很好.只有中等难度的题,区分度才比较好。
区分度的计算方法有两种:鉴别指数法和相关系数法。
1、鉴别指数法:比较测验总分高和总分低的两组被试在项目通过率上的差别得来。
D=PH-P L
PH为高分组(即得分最高的27%)被试在该题上的通过率,PL为低分组(即得分最低的27%)被试在该题上的通过率
2、相关系数法:通过计算某一题目得分与测验总得分或效标分数的相关系数来判定。相关越大,区分度越高。
(1)积差相关法:当项目和试题总分都采用连续分数计分时,可用积差相关法来计算项目的区分度。用变量X表示学生在某项目 上的得分,用变量Y表示学生的测验总分,其积差相关系数即可代表该项目的区分度值。
(2)点二列相关:当项目以二分法计分、测验成绩以连续分数表示时,可用点二列相关公式计算区分度。
区分度的常用指标为D,取值在-1~1之间,值越大区分度越好。测量学家伊贝尔认为:
试题的区分度在0.4以上表明此题的区分度很好,
0.3~0.39表明此题的区分度较好,
0.2~0.29表明此题的区分度不太好需修改,
0.19以下表明此题的区分度不好应淘汰。
区分度的计算方法有两种:鉴别指数法和相关系数法。 比较测验总分高和总分低的两组被试在项目通过率上的差别得来。
D=PH-P L
PH为高分组(即得分最高的27%)被试在该题上的通过率,PL为低分组(即得分最低的27%)被试在该题上的通过率 通过计算某一题目得分与测验总得分或效标分数的相关系数来判定。相关越大,区分度越高。
(1)积差相关法。
当项目和试题总分都采用连续分数计分时,可用积差相关法来计算项目的区分度。用变量X表示学生在某项目 上的得分,用变量Y表示学生的测验总分,其积差相关系数即可代表该项目的区分度值。
(2)点二列相关。
当项目以二分法计分、测验成绩以连续分数表示时,可用点二列相关公式计算区分度。
区分度和难度
难度和区分度都是相对的,是针对一定团体而言的(绝对的难度和区分度是不存在的)。一般说来,较难的项目对高水平的被试区分度高,较易的项目对水平低的被试区分度高,中等难度的项目对中等水平的被试区分度高。
这与中等难度的项目区分度最高的说法并不矛盾,因为对被试总体是较难或较易的项目,对水平高或水平低的被试便成了中等难度。由于人的多数心理特征呈正态分布。
所以当需要把人作最大程度区分时,项目难度的分布也以正态为好,即特别难与特别容易的题目较少,接近中等难度的题目较多,而所有题目的平均难度为0.50。
什么情况下区分度高呢?或者说什么样的题目才能最大限度地区分不同水平的人群?这就引出了试题项目评价的第二个指标:难度。
题目的难度过高,很少人能答对,大部分得分都很低;难度过低,很少人会答错,分数分布在高分端。因而过难或过易的题目都不能很好地区分不同水平的个体。因而当题目的难度为中等时,区分度最高。
一个好的测验中是不是要求所有题目都是中等难度?那高考、研究生入学考试这样的高水平测试为何还有难度很大或很小的题目?这是因为在一个测验中如果都是中等难度的题目,就又走向另一个极端,即对中等程度的人有最佳
如果把成绩从高往低排序,前50%的考生为高分组,后50%为低分组。其计算公式为:D=2(XH—XL)/W,其中,D为区分度,XH为高分组平均分,XL为低分组平均分,W为试卷总分(一般为100分或150分)。
为了简单计算, 教师可以使用下面的一种方法进行计算区分度:
先将分数排序,P1=27%高分组的难度,P2=27%低分组的难度,区分度D=(27%高分组的平均分-27%低分组的平均分)÷满分值。
区分度一般在-1~+1之间,值越大区分度越好。试题的区分度在0.4以上表明此题的区分度很好,0.3~0.39表明此题的区分度较好,0.2~0.29表明此题的区分度不太好需修改,0.19以下表明此题的区分度不好应淘汰。
计算区分度的方法很多,需要特别注意的是对同一个试题的考试成绩采用不同的方法所得到的区分度的值是不同的。
项目区分度一般有三种方法。这三种方法都可以反映题目的区分度。
(1)项目鉴别力指数;D=PH-PL,就是你所说的高低组27%。PH和PL表示高分组和低分组的比率。鉴别力指数靠近0.5左右最好。
(2)方差法:方差法的原理,方差表示离散程度。被试在某一试题上的得分越分散,说明该题的区分度就比较好。
(3)相关法。包括项目与总分的相关,项目与组间的相关,项目效表相关。
项目与总分相关就是你说的题目分数与总分的相关。(其中包括二列相关和点二列相关)。项目与组间的相关指每个题目与题目的相关。效标相关是指根据你的量表题目和别人的区分度很好的量表的相关。(包括内在一致性和效度)
如果还有不懂的,可以继续留言给我。
试卷分析的四个度:难度、区分度、信度、效度 一、难度难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性。
一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于0.3的试题不能太多。1、难度的两种定义:(1)P=1—x/w x为某题得分的平均分数,w为该题的满分。
这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1。(2)P=x/w 这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1。
2、难度的计算:(1)主观性试题的难度 A 基本公式法:P=1—x/w B 极端分组法 P=1—(XH+XL)∕2W XH :高分组的平均得分(前27%),XL:低分组的平均得分(后27%)。(2)客观性试题的难度 A 基本公式法 :P=1—R/N R 为答对人数,N 为全体人数。
B 极端分组法: P=1—(PH+PL)∕2 PH=RH/n 叫高分组通过率,RH:高分组答对人数,n:总人数的前27%。PL=RL/n 叫低分组通过率,RL:低分组答对人数。
二、区分度区分度是区分应试者能力水平高低的指标。试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分,而区分度低则反映不出不同应试者的水平差异。
试题的区分度与试题的难度直接相关,通常来说,中等难度的试题区分度较大。另外,试题的区分度也与应试者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。
区分度指标的评价: -1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强。一般认为,区分度指数高于0.3,试题便可以被接受。
2、区分度的计算方法:基本公式法 :D=(H-L)÷N(D代表区分度指数,H代表高分组答对题的人数,L代表低分组答对题的人数,N代表一个组的人数即高分组与低分组人数之和)。极端分组法:(1)主观性试题:D=SH—SL∕n(WH-WL) SH:高分组得分总数,SL:低分组得分总数,WH:该题的最高得分,WL:该题的最低得分,n为高分组(或低分组)的人数,即总人数的27%。
(2) 客观性试题:D= PH—PL ,或D= RH—RL∕n (3) 一般也可以用D=XH—XL∕X满 计算。XH:高分组某试题的平均分,XL:低分组某试题的平均分,X满:该题的满分。
三、信度信度是指测得结果的一致性或稳定性,稳定性越大,意味着测评结果越可靠。相反,如果用某套试题对同一应试者先后进行两次测试,结果第一次得80分,第二次得50分,结果的可靠性就值得怀疑了。
信度通常以两次测评结果的相关系数来表示。相关系数为1,表明测评工具如试卷完全可靠;相关系数为0,则表明该试卷完全不可靠。
一般来说,要求信度在0.7以上。1、评价信度的方法:(1)重测法,(2)复本法—副题,(3)折半法,或者说:用再测信度、复本信度和内部一致信度三种方法来进行评估。
再测信度是指将同一试卷在相同的条件下对同一组考生先后实施两次,两次测评结果的相关系数。复本信度是指用两份或几份在构想、内容、难度、题型和题量等方面都平行的试卷进行测试,测评结果之间的相关系数。
内部一致信度是指试卷内部各题之间的一致性,通常是将试卷一分为二,然后计算一半试卷与另一半试卷之间的相关系数。2、信度系数 γxx=ST2∕SX2 ST2 叫真分数方差,SX2 为获得分数方差。
信度系数的最大值为1,表示测验的可靠性高,最小值为0,表示测验的信度低。当γxx≥0.70时,测验可用于团体间的比较。
当γxx≥0.85时,测验可用于个体之间的比较。四、效度效度是一个测试能够测试出它所要测试的东西的程度,即测试结果与测试目标的符合程度.任何测试工具,无论其它方面有多好,若效度太低,测试的结果不是它要测试的东西(如用英语试卷测试学生的数学能力),那么,对目前所要测试的东西,这个测试将是无价值的。
由于心理现象本身的特点,测评的效度尤为重要。心理属于精神方面的东西,目前人们还无法直接观察它,只能通过一个人的行为模式或者对测试题目的反应,来推论其心理特质。
如智力水于主要是借助于个体对一些问题的反应及正误等结果来推断的。效度是一个相对概念,即效度只有高低之分,没有全部有效和全部无效之分。
效度从种类上可分为卷面效度、内容效度、构想效度、预测效度和共时效度。
信度
测验的信度,又称测验的可靠度,是指一个测验经过多次测量所得结果的一致性程度,以及一次测量所得结果的准确性程度。
如果教师想通过一次测验就得到比较可信的评分,在编制测验时要注意保持必要的长度,即测验项目越全面、越多,测验的可靠性就越高。另一种提高测验信度的办法是采用难度适中的项目。
效度
测验的效度指一个测验能测出它所要测量的属性或特点的程度。学业成绩检查是要测量所学的学科基本知识技能,作为测量工具的试题就应和要检查的目标相关。
区分度
测验的区分度,指测验对考生的不同水平能够区分的程度,即具有区分不同水平考生的能力。 区分度与难度有关,只有在试卷中包含不同难度的试题,才能提高区分度,拉开考生得分差距。
信度和效度的关系和区别
1、信度低,效度不可能高。因为如果测量的数据不准确,也并不能有效地说明所研究的对象。
2、信度高,效度未必高。例如,如果我们准确地测量出某人的经济收入,也未必能够说明他的消费水平。
3、效度低,信度很可能高。例如,即是一项研究未能说明社会流动的原因,但它很有可能很精确很可靠地调查各个时期各种类型的人的流动数量。
4、效度高,信度也必然高。
扩展资料:
相关词:
负强化:中止某种(讨厌的)刺激以增强反应发生的概率。
例子:小明今天按时完成作业了,妈妈不让他做家务了,以后小明按时完成作业的次数越来越多了!
不让小明做家务是撤销了一个厌恶的刺激,强化了他按时完成作业的次数,因此是负强化。
惩罚:当有机体作出某一反应后,呈现一个厌恶刺激,或者消除愉快刺激,以消除或抑制此类反应发生的过程。
例子:落后就要挨打。
参考资料:百度百科-信度
声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
蜀ICP备2020033479号-4 Copyright © 2016 学习鸟. 页面生成时间:2.641秒