置信区间 (Confidence Intervals)

type

Post

status

Published

date

Jul 31, 2025

slug

confidence-intervals

summary

置信区间用于量化参数估计的不确定性，是统计推断的核心概念之一。本文介绍了置信区间的定义、计算方法（精确与近似）、R 语言实现以及如何在实际研究中选择合适的置信水平。

1️⃣ 核心概念

定义：

给定一个置信水平 1−α，置信区间是一个随机区间，在多次重复抽样中，覆盖总体参数真值的比例为 1−α。

常用置信水平：

90%
95%（最常用）
99%

解释：

95% 置信区间 ≠ “参数有 95% 概率落在区间内”。

它的真实含义是：如果无限次重复相同的实验，约 95% 的置信区间会包含真实参数。

2️⃣ 精确置信区间与近似置信区间

像统计检验一样，置信区间也分为 精确 (Exact) 和 近似 (Approximate) 两类。

🔹 精确置信区间 (Exact Confidence Intervals)

特点：

覆盖率 ≥ 1−α
基于精确分布（如二项分布、超几何分布）
小样本更准确，避免低估不确定性

示例：

Clopper-Pearson 区间，用于二项比例的精确置信区间：

🔹 近似置信区间 (Approximate Confidence Intervals)

特点：

基于渐近理论（中心极限定理）
覆盖率接近 1−α，但可能略低
适用于大样本，计算快速

示例：

Wald 区间，用于二项比例的近似置信区间：

📊 对比总结

类型	方法	覆盖率	样本量要求	计算复杂度
精确区间	Clopper-Pearson, exact	≥ 设定值	小样本优先	高
近似区间	Wald, 正态近似	≈ 设定值	样本量大	低

3️⃣ 置信水平与区间宽度的权衡

置信水平越高 → 区间越宽

例如：90% CI < 95% CI < 99% CI

如果我们希望更有把握地覆盖真实参数，就必须扩大区间；

但区间过宽会降低实用性（信息量不足）。

示例：

输出结果显示，随着置信水平提高，置信区间的上下限扩展，宽度增加。

4️⃣ 不同参数的置信区间计算

🔹 均值的置信区间

对于正态分布总体或大样本（使用 t 分布）：

🔹 比例的置信区间

🔹 方差或标准差的置信区间

🔑 小结

置信区间提供了比点估计更直观的不确定性度量。

小样本：优先使用 精确置信区间

大样本：近似置信区间足够准确

置信水平越高，区间越宽 → 需要在 覆盖率 与 区间宽度 之间平衡。

从混乱到规范：文件命名、变量命名与版本控制最佳实践

卡方检验（Chi-squared Test）