1. 什么是参数估计参数估计是在样本统计量概率分布的基础上,利用样本的信息推断所关心的总体参数的过程。
① 基于样本统计量的概率分布:如前所述,样本统计量是一个随机变量,有其自身的概率分布、期望、方差等。在分析一个样本集时,需要基于此统计学知识;② 利用样本的信息:样本是我们唯一有的数据,一切的统计基于样本数据;③ 推断所关心的总体参数是目的。
比如,利用样本的均值推断总体的均值,利用样本的方差推断总体的方差。PS1:利用样本的均值作为总体均值的估计,是直观且不需要解释的。
样本统计量(此处指均值)的概率分布,是为这个估计提供置信度等信息的。PS2:利用样本均值去估计总体均值时,总体均值是一个待被估计的总体参数,可以用\theta 表示。
样本均值叫做估计量,用\hat{\theta } 表示,是一个统计量;实际采集了一个样本算出了其平均值,这叫一个估计值2. 两种基本的估计方法2.1 点估计点估计指基于一个样本算出的估计量的一个具体取值,直接作为总体参数的估计值 的估计方式。这个话说的很车轱辘,举个栗子,当我要估计中国人的平均身高时,我采集了一个样本,其包含了1W个人的身高状况,然后我算出来均值,并用这个均值作为全体中国人平均身高的估计值。
就是这么简单。点估计的优点是很直观易理解,给小学生讲一下应该也能听懂。
不好懂的是点估计的缺点:点估计无法给出估计的可靠性。继续举栗子,当我们取了1W个平均身高并算出平均值是1.68时,我们并不能说,全国人民的平均身高100%就是1.68。
事实上,平均身高可能是1.86,就算这样我们也仍然有可能恰好采到了一个平均身高只有1.68的样本,只不过这个概率比较小而已。再说得反直觉一点,全国人民的平均身高恰恰好好就是1.68的可能性其实是非常低的,但落在[1.67,1.69]的可能性就比较大,至少比落在[1.80, +]的可能性是大多了。
问题就在于,点估计无法定量的给出这些区间以及对应的可能性大小。所以才有了更专业一点的区间估计。
矩估计法 用样本矩代替相应的总体矩,如用样本均值估计总体均值。
这称为Pearson替换原理。最小二乘法 为了选出使得模型输出与系统输出yt尽可能接近的参数估计值,可用模型与系统输出的误差的平方和来度量接近程度。
使误差平方和最小的参数值即为所求的估计值。极大似然法 选择参数θ,使已知数据Y在某种意义下最可能出现。
某种意义是指似然函数P(Y│θ)最大,这里P(Y│θ)是数据Y的概率分布函数。与最小二乘法不同的是,极大似然法需要已知这个概率分布函数P(Y│θ)。
在实践中这是困难的,一般可假设P(Y│θ)是正态分布函数,这时极大似然估计与最小二乘估计相同。 。
方法/步骤 1 创建工作文件,在file菜单中,依次点击new->workfile。
2 这时弹出Workfile Create对话框,选择数据类型并填入起止日期,如下图所示。 3 点击ok,工作文件建立完毕 4 创建和编辑数据,在命令窗口直接输入data Y X,然后回车。
5 弹出Group窗口,将数据填入其中。 6 在命令行输入ls Y C X,然后回车。
7 弹出Equation窗口,得到参数估计结果,该窗口中包含截距项、X前面的系数,标准误差、t统计量、p值、可决系数等。 8 点击Equation窗口中的Resid,可以得到模型的拟合图和残差图。
9 如何查看模型的方程式呢?在Equation窗口中依次点击proc->Make Model,弹出Model窗口。 10 在Model窗口中依次点击View->Source Text,即可得到我们建立的数学模型的方程。
去百度文库,查看完整内容>
内容来自用户:xiaobaizhua2
第三章参数估计
统计推断就是推断总体分布,可以用经验分布估计理论分布,且增多样本可以逼近所要求的精度,但是这需要大量样本,现实中难以实现。
实际问题总是认为总体分布形式已知,而是不知其中几个参数,因此估计问题变为如何估计这几个未知参数,分成两大类:点估计和区间估计。
§3.1点估计
设母体的分布函数形式已知,为待估未知参数向量,样本值为,点估计就是构造一个适当的统计量作为待估未知参数的近似值,统计量简单说就是样本值的函数,但是要求不可依赖未知参量,能够反映未知参量的信息,不同的未知参量对应了不同的统计量。如何构造呢?这里经典方法是矩估计方法和最大似然估计两种办法。
矩估计:子样的k阶原点矩,母体的k阶原点矩,假设=,那么我们就列L个方程=,求解。
例子:混合高斯分布
给你样本值为,来估计未知参数。
解释:混合高斯分布的均值为零,二阶矩为
我们只有样本,那么就用样本二阶矩代替,,那么得出未知参数的估计值为
最大似然估计:比如连续分布的母体概率密度函数为,为待估未知参数向量,样本值为,对于各样本值进行排序,总能找到,那么发生在区间的概率
我们将上述发生概率最大的参数作为真实值的估计,那么就是使得似然函数3解释:
区间估计的概念
区间估计是根据样本统计量,利用抽样分布的原理,用概率表示总体参数可能落在某数值区间之内的推算方法。
区间估计的原理
区间估计的理论依据是抽样分布理论。现在以总体平均数区间估计为例,说明区间估计的基本原理。
总体参数区间估计的计算方法
由于样本容量、总体分布状态等多方面因素对总体参数估计的可信度都会产生不同程度的影响,因此,在进行总体参数估计时要针对不同情况区别对待。
大样本总体平均数的区间估计
要对总体平均数μ做出比较准确的估计,就要合理地确定平均数样本分布的标准差即标准误。事实上,标准误与样本容量和总体分布的标准差关系密切。当样本容量n大于30的时候,样本标准差S与总体标准差σ相差不会很大,一般就可以利用S来做σ的估计值。同时,随着样本容量的增加,样本平均数与总体平均数的差距就会缩小,即标准误就会减小。
声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
蜀ICP备2020033479号-4 Copyright © 2016 学习鸟. 页面生成时间:3.033秒