Evan の Logbook
✨ Updates
🎨 Style Guide
🧠 Creative Resources
🗒️ Mind Notes
🧭 Knowbase
📘 SOPs
🩺 Medical Research
🛠️ Tech Chronicles
💰 Fortune Blueprint
📈 R Visionary
📊 Statistics
🖼️ BioVis
置信区间 (Confidence Intervals)
type
status
date
slug
summary
tags
category
icon
password
comment
置信区间是统计推断中最常用的工具之一,用于为未知总体参数(如均值、比例、回归系数)提供一个基于样本的区间估计。相比单一的点估计,置信区间更直观地展示了参数估计的不确定性。
1️⃣ 核心概念
- 定义:
给定一个置信水平 1−α,置信区间是一个随机区间,在多次重复抽样中,覆盖总体参数真值的比例为 1−α。
- 常用置信水平:
- 90%
- 95%(最常用)
- 99%
- 解释:
95% 置信区间 ≠ “参数有 95% 概率落在区间内”。
它的真实含义是:如果无限次重复相同的实验,约 95% 的置信区间会包含真实参数。
2️⃣ 精确置信区间与近似置信区间
像统计检验一样,置信区间也分为 精确 (Exact) 和 近似 (Approximate) 两类。
🔹 精确置信区间 (Exact Confidence Intervals)
- 特点:
- 覆盖率 ≥ 1−α
- 基于精确分布(如二项分布、超几何分布)
- 小样本更准确,避免低估不确定性
- 示例:
Clopper-Pearson 区间,用于二项比例的精确置信区间:
🔹 近似置信区间 (Approximate Confidence Intervals)
- 特点:
- 基于渐近理论(中心极限定理)
- 覆盖率接近 1−α,但可能略低
- 适用于大样本,计算快速
- 示例:
Wald 区间,用于二项比例的近似置信区间:
📊 对比总结
类型 | 方法 | 覆盖率 | 样本量要求 | 计算复杂度 |
精确区间 | Clopper-Pearson, exact | ≥ 设定值 | 小样本优先 | 高 |
近似区间 | Wald, 正态近似 | ≈ 设定值 | 样本量大 | 低 |
3️⃣ 置信水平与区间宽度的权衡
- 置信水平越高 → 区间越宽
- 例如:90% CI < 95% CI < 99% CI
- 如果我们希望更有把握地覆盖真实参数,就必须扩大区间;
- 但区间过宽会降低实用性(信息量不足)。
示例:
- 输出结果显示,随着置信水平提高,置信区间的上下限扩展,宽度增加。
4️⃣ 不同参数的置信区间计算
🔹 均值的置信区间
对于正态分布总体或大样本(使用 t 分布):
🔹 比例的置信区间
🔹 方差或标准差的置信区间
🔑 小结
- 置信区间提供了比点估计更直观的不确定性度量。
- 小样本:优先使用 精确置信区间
- 大样本:近似置信区间足够准确
- 置信水平越高,区间越宽 → 需要在 覆盖率 与 区间宽度 之间平衡。
Prev
从混乱到规范:文件命名、变量命名与版本控制最佳实践
Next
卡方检验(Chi-squared Test)
Loading...
YouTube 使用笔记