1、简单随机抽样
有放回简单随机抽样从总体中随机抽出一个样本单位,记录观测结果后,将其放回到总体中去,再抽取第二个,如此类推,一直到抽满n个单位为止。
单位有被重复抽中的可能,容易造成信息重叠而影响估计的效率,较少采用。
2、不放回简单随机抽样
从包含N个单元的总体中逐个随机抽取单元并无放回,每次都在所有尚未被抽入样本的单元中等概率的抽取下一个单元,直到抽取n个单元为止。
每个单位最多只能被抽中一次,不会由于样本单位被重复抽中而提供重叠信息,比放回抽样有更低的抽样误差。
3、分层抽样
先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机的抽取样本,这样所得到的样本称为分层样本。如果每层中的抽样都是简单随机抽样,则称为分层随机抽样。
4、系统抽样
系统抽样指先将总体中的所有单元按一定顺序排列,在规定范围内随机抽取一个初始单元,然后按事先规定的规则抽取其他样本单元。最简单的系统抽样是等距抽样。
5、整群抽样
整群抽样是将总体中所有的基本单位按照一定规则划分为互不重叠的群,抽样时直接抽取群,对抽中的群调查其全部的基本单位,对没有抽中的群则不进行调查。
扩展资料
概率抽样包括以下几个方面的优点:调查者可获得被抽取的不同年龄、不同层次的人们的信息; 能估算出抽样误差; 调查结果可以用来推断总体。
例如,在一项使用概率抽样法的调查中,如果有 5 %的被访者给出了某种特定回答,那么,调查者就可以以此百分比再结合抽样误差,推及总体情况。
另一方面,概率抽样也有一些弊病:在大多数案例中,同样规模的概率抽样的费用要比非概率抽样高;概率抽样比非概率抽样需要更多时间策划和实施;必须遵守的抽样计划执行程序会大量增加收集资料的时间。
参考资料来源:百度百科-概率抽样
1.简单随机抽样
若总体中每个个体被抽到的机会是均等的(即抽样的随机性),且在抽样取走一个个体之后总体内成分不变(即抽样的独立性),这种抽样方式称为简单随机抽样。
简单随机抽样一般用下述三种方法:
(1)抽签法。把总体中的每一个个体都编上号码,并做成签,充分混合后从中随机抽取一部分,这部分所对应的个体就组成一个样本。
(2)查表法。查随机数表,确定从总体中所抽取个体的号码,则号码所对应的个体就进入样本。随机数表可随意从任何一区、任何一个数目开始,依次向各个方向顺序进行。
(3)计算机造数法。用电子计算机编造随机数程序,把随机数作为总体中抽出个体进入样本的号码。
2.系统抽样(等距抽样)
系统抽样方法实际上是等间隔法的机械抽样。它把总体中所有个体按一定顺序编号,然后依固定间隔取样,间隔的大小视所需样本容量与总体中个体数目的比率而定,起始数字必须是随机决定的。等距抽样又有直线等距抽样,对称等距抽样和循环等距抽样三种。这种方法与简单随机抽样相比,方便、易学、易做,当总体按一定顺序排定后,第一个样本一经确定,其他样本也随之确定。但是,这种抽样方法在名单排列中,如果存在周期性部分,则会造成偏差。因此,在等距抽样间距确定以后,选择起点时,应根据掌握的信息,尽量避开总体可能存在周期的点。
3.分层抽样(类型抽样)分层抽样是先把总体按一定标志分成不同类型或层次,然后从各种不同类型中随机抽取若干单位组成样本。
分层抽样在各层中抽取的样本也可看成总的样本数在各层的分摊,它又有三种方法:
(1)等比例抽样。即各层所抽样本数占各层总体单位数的比例相等。
(2)按各层的离散情况分配样本。某层的离散程度大,则该层多分摊一些样本。
(3)最优分配。既考虑到各层的单位数的多少,又考虑到各层的离散情况。
4.整群抽样
整群抽样是先将各单位划分为若干群(组),然后以群为单位从中随机抽取一些群,对抽中的群的所有单位进行调查。
概率抽样包括有简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)、整群抽样、多段抽样、PPS抽样和户内抽样。
例如: 简单随机抽样是一种广为使用的概率抽样方法。是最完全的概率抽样。
如前面提到的,随机抽样就是总体中每个单位在抽选时有相等的被抽中的机会。在简单随机抽样条件下,抽样概率公式为:抽样概率=样本单位数∕总体单位数例如,如果总体单位数为 10000 ,样本单位数为 400 ,那么抽样概率为 4 %。
简单随机抽样的优点在于,它看起来简单,并且满足概率抽样的一切必要的要求,保证每个总体单位在抽选时都有相等的被抽中的机会。简单随机抽样可以通过电话随机拨号功能完成这个步骤,可以从电脑档案中挑选调查对象。
同样,简单随机抽样会遇到“样本可能分布不均匀”以及“没有好的抽样框”等问题。友邦顾问在简单随机抽样过程中常使用的技巧为“抽签法”和“随机表”法。
在定量抽样调查中,等距抽样常常代替简单随机抽样。由于该抽样方法简单实用,所以应用普遍。
等距抽样得到的样本几乎与简单随机抽样得到的样本是相同的。等距抽样的基本做法是,将总体中的各单元先按一定的顺序排列、编号,然后决定一个间隔,并在此间隔基础上选择被调查的单位个体。
样本距离可通过下面公式确定:样本距离 =总体单位数∕样本单位数例如,假设你使用本地电话本并确定样本距离为 100 ,那么 100 个中取 1 个组成样本。这个公式保证了整个列表的完整性。
等距抽样方式随意用一个起点,例如,如果你把一本电话本作为抽样框,必须随意取出一个号码决定从该页开始翻阅。假设从第 5 页开始,在该页上再另选一个数决定从该行开始。
假定选择从第 3 行开始,这就决定了实际开始的位置。等距抽样方式相对于简单随机抽样方式最主要的优势就是经济性。
等距抽样方式比简单随机抽样更为简单,花的时间更少,并且花费也少。使用等距抽样方式最大的缺陷在于总体单位的排列上。
一些总体单位数可能包含隐蔽的形态或者是“不合格样本”,调查者可能疏忽,把它们抽选为样本。 定量调查中的分层抽样是一种卓越的概率抽样方式,在友邦公司以往的调查中经常被使用。
分层抽样的具体程序是:把总体各单位分成两个或两个以上的相互独立的完全的组(如男性和女性),从两个或两个以上的组中进行简单随机抽样,样本相互独立。总体各单位按主要标志加以分组,分组的标志与我们关心的总体特征相关。
例如,我们正在进行有关啤酒品牌知名度方面的调查,初步判别,在啤酒方面男性的知识与和女性不相同,那么性别应是划分层次的适当标志。如果不以这种方式进行分层抽样,分层抽样就得不到什么效果,花再多时间、精力和物资也是白费。
分层抽样与简单随机抽样相比,我们往往选择分层抽样,因为它有显著的潜在统计效果。也就是说,如果我们从相同的总体中抽取两个样本,一个是分层样本,另一个是简单随机抽样样本,那么相对来说,分层样本的误差更小些。
另一方面,如果目标是获得一个确定的抽样误差水平,那么更小的分层样本将达到这一目标。在调查实践中,为提高分层样本的精确度实际上要付出一些代价。
通常,我们现实正确的分层抽样一般有三个步骤:首先,辩明突出的(重要的)人口统计特征和分类特征,这些特征与所研究的行为相关。例如,研究某种产品的消费率时,按常理认为男性和女性有不同的平均消费比率。
为了把性别作为有意义的分层标志,调查者肯定能够拿出资料证明男性与女性的消费水平明显不同。用这种方式可识别出各种不同的显著特征。
调查表明,一般来说,识别出 6 个重要的显著特征后,再增加显著特征的辨别对于提高样本代表性就没有多大帮助了。第二,确定在每个层次上总体的比例(如性别已被确定为一个显著的特征,那么总体中男性占多少比例,女性占多少比例呢?)。
利用这个比例,可计算出样本中每组(层)应调查的人数。最后,调查者必须从每层中抽取独立简单随机样本。
以上各种抽样类型全部是按单位抽取的,即按样本单位数,分别一个单位一个单位地抽取。在整群抽样中,样本是一组单位一组单位地抽取。
整群抽样有两个关键步骤:-同质总体被分为相互独立的完全的较小子集。-随机抽选子集构成样本。
如果调查者在抽中的子集中观察全部单位,我们就有了一级整群样本。如果在抽中的子集中再以概率方式抽取部分单位观察,我们就有了二级整群样本。
分层和整群抽样都要将总体分为相互独立的完全子集。它们的区别是,分层抽样的样本是从每个子集中抽取,而整群抽样则是抽取部分子集。
地理区域抽样是整群抽样的典型方式。挨门挨户去调查一个特定城市的调查者也许会随机抽选一些区域,较集中地访查一些群体,大量减少访问时间和经费。
整群抽样被认为是概率抽样技术,因为它随机抽出群和随机抽出单位。值得注意的是,在整群抽样下,我们假定群中单位与总体一样存在异质性。
如果一群中单位的特征非常相似,如果由于共同环境使群内差异小而群与群之间差异大。一般来说,要解决这个问题可以扩大群数,然后从各群中抽取少量单位数,以保证样本。
概率抽样方法 (Probability Sampling)
概率抽样包括有
1. 简单随机抽样(又称:单纯随机抽样)
2. 系统抽样(等距抽样)
3. 分层随机抽样(类型抽样)
4. 分群随机抽样
等方法。概率抽样又称几率抽样、可能率抽样,在实践中受到人们的普遍重视和广泛应用。概率抽样是以概率论与数理统计为基础,首先按照随机的原则选取调查样本,使调查母体中每一个子体均有被选中的可能性,即具有同等被选为样本的可能率,机遇均等。定量市场调查中的概率抽样是指在调查总体样本中的每个单位都具有同等可能性被抽中的机会。
概率抽样的基本原则是:样本量越大,抽样误差就越小,而样本量越大,则成本就越高。根据数理统计规律,样本量增加呈直线递增的情况下(样本量增加一倍,成本也增加一倍),而抽样误差只是样本量相对增长速度的平方根递减。因此,样本量的设计并不是越大越好,通常会受到经济条件的制约。
简单随机抽样简单随机抽样(simple random sampling)又称纯随机抽样,是概率抽样的最基本形式。
它是按等概率原则直接从含有N个元素的总体中随机抽取n个元素组成样本(N>n)。常用的办法类似于抽签,即把总体的每一个单位都编号,将这些号码写在一张张小纸条上,然后放入一容器(如纸盒、口袋)中,搅拌均匀后,从中任意抽取,直到抽够预定的样本数目。
这样,由抽中的号码所代表的元素组成的就是一个简单随机样本。比如,某系共有学生300人,系学生会打算采用简单随机抽样的办法,从中抽取出60人进行调查。
为了保证抽样的科学性,他们先从系办公室得到一份全系学生的名单,然后给名单中的每个学生都编上一个号(从001到300)。抽样框编好后,他们又用300张小纸条分别写上001,002,…,300。
他们把这300张写好不同号码的小纸条放在一个盒子里,搅乱后,随便摸出60张小纸条。然后,他们按这60张小纸条上的号码找到总体名单上所对应的60位同学。
这60位同学就构成了他们本次的样本。这种方法简便易学。
但当总体元素很多时,写号码的工作量就很大,搅拌均匀也不容易,因而此法往往在总体元素较少时使用。对于总体元素很多的情形,我们则采用随机数表来抽样。
本书后就附有一张随机数表,表中的数码和排列都是随机形成的,没有任何规律性(故也称为乱数表)。利用随机数表进行抽样的具体步骤是:(1)先取得一份总体所有元素的名单(即抽样框);(2)将总体中所有元素一一按顺序编号;(3)根据总体规模是几位数来确定从随机数表中选几位数码;(4)以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;(5)根据样本规模的要求选择出足够的数码个数;(6)依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素。
按上述步骤选择出来的元素的集合,就是所需要的样本。举例来说,某总体共3 000人(四位数),需要从中抽取100人作为样本进行调查。
首先,我们要得到一份总体成员的名单;然后对总体中的每一个人从1到3 000进行编号;再根据总体的规模,确定从随机数表中选择四位数。具体的选法是从随机数表的任意一行和任意一列的某一个四位数开始,按照从上到下的顺序,或者从左到右的顺序,以3 000为标准,对随机数表中依次出现的每个四位数进行取舍:凡小于或等于3 000的数码就选出来,凡大于3 000的数码以及已经选出的数码则不要,直到选够100个数码为止;最后按照所抽取的数码,从总体名单中找到它们所对应的100个成员。
这100个成员就构成一个随机样本。表6—2就是对3 000人的总体进行抽样时,我们采用随机数表对四位数码进行取舍的例子(采用后四位数,并按从上往下的顺序)。
表6—2随机数表抽样例随机数表中的数码选用的数码不选用的原因后面四位数大于后面四位数大于30001359866042后面四位数大于3 与所选的第三个数码重复27256511761176如果采用前四位数字,仍按从上往下的顺序,那么从表6—2中我们又可以抽取出1 053、0 139、1 359、2 725这四个号码;如果取中间的四位数字,所得到的则是2 990、1 404、1 912和0 582这四个号码了。二、系统抽样系统抽样(systematic sampling)又称等距抽样或间隔抽样。
它是把总体的单位进行编号排序后,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码来组成样本的方法。它和简单随机抽样一样,需要有完整的抽样框,样本的抽取也是直接从总体中抽取个体,而无其他中间环节。
系统抽样的具体步骤是:(1)给总体中的每一个个体按顺序编号,即制定出抽样框。(2)计算出抽样间距。
计算方法是用总体的规模除以样本的规模。假设总体规模为N,样本规模为n,那么抽样间距K就由下列公式求得:K(抽样间距)=N(总体规模)n(样本规模)(3)在最前面的K个个体中,采用简单随机抽样的方法抽取一个个体,记下这个个体的编号(假设所抽取的这个个体的编号为A),它称做随机的起点。
(4)在抽样框中,自A开始,每隔K个个体抽取一个个体,即所抽取个体的编号分别为A,A+K,A+2K,…,A+(n-1)K。(5)将这n个个体合起来,就构成了该总体的一个样本。
例如,要在某大学总共3 000名学生中,抽取一个容量为100的大学生样本。我们先将3 000名学生的名单依次编上号码,然后按上述公式可求得抽样间距为:K=3 000/100=30即每隔30人抽一名。
为此,我们先在1~30的数码中,采用简单随机抽样的方法抽取一个数字,假如抽到的是12,那么就以12为第一个号码,每隔30名再抽一个。这样,我们便可得到12,42,72,…,2 982总共100个号码。
我们再根据这100个号码,从总体名单中一一对应地找出100名学生,这100名学生就构成本次的一个样本。从上面的过程中我们不难看出,系统抽样较之于简单随机抽样来说,显然简便易行多了,尤其是当总体及样本的规模都较大时更是如此。
这也正是社会研究较少采用简单随机抽样而较多采用系统抽样的原因。值得注意的是。
声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
蜀ICP备2020033479号-4 Copyright © 2016 学习鸟. 页面生成时间:3.163秒