0%

数理统计期末复习.md

8. 求统计量的期望与方差:

题目

是来自总体 的样本,则

(1) 证明:

(2) 已知 ,试求 k,使得

解答

(1)证明:

首先,对于正态分布的样本 ,我们知道 服从自由度为 的卡方分布乘以 ,即:

卡方分布的二阶原点矩为 。因此,

(2)已知 ,试求 使得

方差 的计算为:

根据问题(1)的结果,我们知道:

而方差的计算为:

其中,,因此:

代入到方差 中:

题目要求 ,解得:

最终答案:
(1)
(2)

4

4、置信区间的求解。如:设总体 ,已知 ,若 ,则样本容量 至少为
时,才能保证 的 95%的置信区间长度不大于

设总体 ,已知 ,求样本容量 至少为多少时,才能保证 的 95% 的置信区间长度不大于

  1. 置信区间公式:当总体方差已知时, 的 95% 置信区间为:

    其中 是标准正态分布的双侧分位数,对应 ,此时

  2. 置信区间长度:置信区间的长度为:

    题目要求该长度不大于 ,即:

  3. 代入已知条件:已知 ,故 。代入上述不等式:

  4. 化简不等式

    解得:

    两边平方:

  5. 计算数值

    因此 至少为 31(向上取整)。

  6. 验证:当 时,置信区间长度约为 ,满足条件;当 时,长度约为 ,不满足条件。

最终答案:

求正态总体的均值与方差的双侧置信区间?

当总体 时,其均值 和方差 的双侧置信区间的求法如下:

均值 的双侧置信区间

  1. 方差已知

    • 样本容量为 ,样本均值为 ,置信度为
    • 置信区间为:其中, 是标准正态分布的分位数。
  2. 方差未知

    • 样本容量为 ,样本均值为 ,样本标准差为 ,置信度为
    • 置信区间为:其中, 是自由度为 的t分布的分位数。

方差 的双侧置信区间

  • 样本容量为 ,样本方差为 ,置信度为
  • 置信区间为:其中, 是自由度为 的卡方分布的分位数。# 第二章统计量及其分布

判断一个式子是不是统计量(statistic)

统计量是样本的函数,它的取值只依赖于样本数据,不依赖于总体中未知的参数。

是否完全由样本数据组成?

  • 统计量只能由样本 构成。
  • 它不能包含未知的总体参数(如总体均值 、总体方差 、分布形式等)。

总结:记住一句话

统计量 = 只依赖样本,不依赖总体参数的函数。


t分布

其中:

  • :标准正态分布
  • :自由度为 的卡方分布
  • 相互独立
  • 就服从自由度为 t 分布

这个公式说明了:t 分布是正态分布与卡方分布构成的比值,并通过卡方除以自由度进行标准化。自由度越大,t 分布越接近标准正态分布。

7. 无偏估计证明、有效率的证明。

如:设总体 的样本, 为已知。证明:

(1) 的无偏估计量;(2) 统计量 的有效率为

(1)证明统计量 的无偏估计量。

  1. 计算期望值

    • 每个样本 服从正态分布 ,因此
    • 对于正态分布 ,其绝对值的期望值为
  2. 统计量 的期望

    • 统计量
    • 期望值

因此, 的无偏估计量。

(2)统计量 的有效率

  1. 计算方差

    • 单个项的方差
    • 统计量 的方差
  2. Cramér-Rao 下界 (CRB)

    • 对于正态分布 ,参数 的 Fisher 信息量为 ,因此 CRB 为
  3. 计算有效率

    • 有效率定义为 CRB 与统计量方差的比率:

最终答案

(1) 的无偏估计量;

(2)统计量 的有效率为

证明一致估计

  1. 是参数的估计量。
  2. 证明是无偏估计,即
  3. 证明
  4. 根据切比雪夫不等式,
  5. 代入,得
  6. 时,,所以
  7. 这证明了依概率收敛于,即是一致估计。

证明有效估计

  1. 写出样本的联合概率密度函数或概率质量函数(似然函数):
  2. 取对数似然函数:
  3. 对对数似然函数关于参数求一阶偏导:
  4. 对一阶偏导再次关于参数求偏导(二阶偏导):
  5. 计算费希尔信息量: 。对于独立同分布样本,也可以计算单个样本的费希尔信息量,则
  6. 得到Cramér-Rao下界 (CRLB): 。这是任何无偏估计量方差的下界。
  7. 证明估计量是无偏的: 验证
  8. 计算估计量的方差: 确定
  9. 比较方差与CRLB: 如果,则是有效估计量。

求均值的置信区间通常分两种情况:

情况一:总体方差 已知

  1. 确定置信水平: 例如 95%。
  2. 找到对应的 Z 值: 对于 95% 置信水平,双侧 Z 值为 ,其中 。例如,95% 对应
  3. 计算标准误差: ,其中 是总体标准差, 是样本大小。
  4. 计算置信区间: 样本均值
    区间为

情况二:总体方差 未知

  1. 确定置信水平: 例如 95%。
  2. 计算样本标准差:
  3. 确定自由度:
  4. 找到对应的 t 值: 对于给定的置信水平和自由度,找到双侧 t 值
  5. 计算标准误差:
  6. 计算置信区间: 样本均值
    区间为

注意:

  • 这些方法假设样本来自正态分布总体,或者样本量足够大(根据中心极限定理)。
  • 是显著性水平,