8. 求统计量的期望与方差:
题目
设
(1) 证明:
(2) 已知
解答
(1)证明:
首先,对于正态分布的样本
卡方分布的二阶原点矩为
(2)已知
方差
根据问题(1)的结果,我们知道:
而方差的计算为:
其中,
代入到方差
题目要求
最终答案:
(1)
(2)
4
4、置信区间的求解。如:设总体
时,才能保证
设总体
置信区间公式:当总体方差已知时,
的 95% 置信区间为:其中
是标准正态分布的双侧分位数,对应 ,此时 。置信区间长度:置信区间的长度为:
题目要求该长度不大于
,即:代入已知条件:已知
,故 。代入上述不等式:化简不等式:
解得:
两边平方:
计算数值:
因此
至少为 31(向上取整)。验证:当
时,置信区间长度约为 ,满足条件;当 时,长度约为 ,不满足条件。
最终答案:
求正态总体的均值与方差的双侧置信区间?
当总体
均值 的双侧置信区间
方差已知
:- 样本容量为
,样本均值为 ,置信度为 。 - 置信区间为:其中,
是标准正态分布的分位数。
- 样本容量为
方差未知
:- 样本容量为
,样本均值为 ,样本标准差为 ,置信度为 。 - 置信区间为:其中,
是自由度为 的t分布的分位数。
- 样本容量为
方差 的双侧置信区间
- 样本容量为
,样本方差为 ,置信度为 。 - 置信区间为:其中,
和 是自由度为 的卡方分布的分位数。# 第二章统计量及其分布
判断一个式子是不是统计量(statistic)
统计量是样本的函数,它的取值只依赖于样本数据,不依赖于总体中未知的参数。
✅ 是否完全由样本数据组成?
- 统计量只能由样本
构成。 - 它不能包含未知的总体参数(如总体均值
、总体方差 、分布形式等)。
✅ 总结:记住一句话:
统计量 = 只依赖样本,不依赖总体参数的函数。
t分布
其中:
:标准正态分布 :自由度为 的卡方分布 和 相互独立 就服从自由度为 的 t 分布
这个公式说明了:t 分布是正态分布与卡方分布构成的比值,并通过卡方除以自由度进行标准化。自由度越大,t 分布越接近标准正态分布。
7. 无偏估计证明、有效率的证明。
如:设总体
(1)
(1)证明统计量 是 的无偏估计量。
计算期望值:
- 每个样本
服从正态分布 ,因此 。 - 对于正态分布
,其绝对值的期望值为 。
- 每个样本
统计量
的期望:- 统计量
。 - 期望值
。
- 统计量
因此,
(2)统计量 的有效率
计算方差:
- 单个项的方差
。 - 统计量
的方差 。
- 单个项的方差
Cramér-Rao 下界 (CRB):
- 对于正态分布
,参数 的 Fisher 信息量为 ,因此 CRB 为 。
- 对于正态分布
计算有效率:
- 有效率定义为 CRB 与统计量方差的比率:
。
- 有效率定义为 CRB 与统计量方差的比率:
最终答案
(1)
(2)统计量
证明一致估计
- 设
是参数 的估计量。 - 证明
是无偏估计,即 。 - 证明
。 - 根据切比雪夫不等式,
。 - 将
代入,得 。 - 当
时, ,所以 。 - 这证明了
依概率收敛于 ,即 是一致估计。
证明有效估计
- 写出样本的联合概率密度函数或概率质量函数(似然函数):
。 - 取对数似然函数:
。 - 对对数似然函数关于参数
求一阶偏导: 。 - 对一阶偏导再次关于参数
求偏导(二阶偏导): 。 - 计算费希尔信息量:
。对于独立同分布样本,也可以计算单个样本的费希尔信息量 ,则 。 - 得到Cramér-Rao下界 (CRLB):
。这是任何无偏估计量方差的下界。 - 证明估计量
是无偏的: 验证 。 - 计算估计量
的方差: 确定 。 - 比较方差与CRLB: 如果
,则 是有效估计量。
求均值的置信区间通常分两种情况:
情况一:总体方差
- 确定置信水平: 例如 95%。
- 找到对应的 Z 值: 对于 95% 置信水平,双侧 Z 值为
,其中 。例如,95% 对应置 信 水 平 。 - 计算标准误差:
,其中 是总体标准差, 是样本大小。 - 计算置信区间: 样本均值
。
区间为 。
情况二:总体方差
- 确定置信水平: 例如 95%。
- 计算样本标准差:
。 - 确定自由度:
。 - 找到对应的 t 值: 对于给定的置信水平和自由度,找到双侧 t 值
。 - 计算标准误差:
。 - 计算置信区间: 样本均值
。
区间为 。
注意:
- 这些方法假设样本来自正态分布总体,或者样本量足够大(根据中心极限定理)。
是显著性水平, 。置 信 水 平