🏢Cohort study VS Case-control

type
status
date
slug
summary
tags
category
icon
password
comment

✍️ 引言

在医学研究中,观察性研究(Observational Studies) 是探索疾病病因、风险因素和干预效果的重要工具。与随机对照试验(RCT)相比,观察性研究更贴近真实临床环境,但设计选择对结果的可靠性影响巨大。其中,队列研究(Cohort Study)病例对照研究(Case–Control Study) 是两种最常用的设计,却常常被混淆。
本文基于权威综述 (ref 1) 和 STROBE 指南,系统解读这两种研究方法,包括定义、设计、统计分析、优缺点和适用场景,并通过对比帮助你科学选择研究设计。

👀 观察性研究类型与时间逻辑

  • Cohort Study(队列研究):分为前瞻性(从现在或暴露起点随访未来)和回顾性(利用既往资料,从过去的暴露追踪至现在结局)。
  • Case-Control Study(病例对照研究):先选病例/对照,回顾暴露史。
  • Case Series(病例系列):只描述一组病例,无对照组、不作比较,仅用于现象描述。
时间轴示意:
  • Cross-sectional:横断面,一次性调查。
  • Prospective Cohort:暴露起点→未来结局。
  • Retrospective Cohort:历史暴露→追溯结局。
  • Case-Control:结局起点→回顾暴露。

1️⃣ 队列研究(Cohort Study)

📖 定义

以是否暴露于某因素分组,从无病人群起点开始随访,比较暴露组与未暴露组的结局(发病率、死亡率等)。

🔑 特点

  • 时间顺序:暴露 → 结果
  • 可前瞻性或回顾性
  • 常用指标:RR、RD、HR
  • 数据:随访、登记、健康体检、病历系统等

✅ 优点

  • 能直接计算发病率和风险差异
  • 时间因果关系明确
  • 可分析多个结局
  • 对罕见暴露适用

⚠️ 缺点

  • 成本高、周期长
  • 难以研究罕见病
  • 易受失访、混杂影响

1.1 前瞻性 vs. 回顾性队列

类型
起点
数据特点
常见局限
前瞻性队列
现在→未来
专门收集,数据完整
成本高、随访长、失访偏倚
回顾性队列
过去→现在
利用既往资料或病历
信息/回忆偏倚,变量有限

1.2 方法学要点

要点
说明
同源来源人群
两组(暴露/未暴露)必须来自同一来源人群,确保可比性
排除既往病例
入组前排除已患病或无风险者
样本策略
明确纳入/排除标准,社区/医院/登记库抽样
对照组 vs. 病例系列
若只有单组随访=病例系列;只有有对照(未暴露组)才算cohort

1.3 偏倚与控制

偏倚类型
控制措施
失访偏倚(Attrition)
设计时预估、加强随访、流失率≤20%
信息偏倚
标准化收集,盲法结局判定
混杂偏倚
设计时匹配/限制,分析时多变量回归/倾向评分

1.4 何时选择队列研究?

  • 研究罕见暴露
  • 需直接测量发病率或推断因果
  • 已有大规模随访数据
  • 有足够资源长期跟踪

1.5 回顾性队列 vs. 病例系列(Case Series)

关键问题
回顾性 Cohort Study
Case Series
研究对象分组
暴露组+未暴露组(有对照)
仅病例(无对照)
研究起点
先定义暴露,追踪结局
只描述已发生结局的病例
可计算指标
发病率、RR、RD、HR
只能描述频数、比例
推断能力
可以推断暴露-结局关联
仅为描述性,不能推断
常见应用
药物流行病学、灾害健康影响、职业暴露
罕见疾病报告、创新疗法、疗效信号
关键判断:“先暴露后比较,才叫cohort;只病例无比较,就是case series。”

2️⃣ 病例对照研究(Case–Control Study)

📖 定义

以结局(有病/无病)分组,回顾暴露史,通过病例组与对照组的暴露率比较,推断暴露与结局的关联。

🔑 特点

  • 时间顺序:结果 → 暴露
  • 只能计算比值比(OR)
  • 适合问卷、病历、登记资料

✅ 优点

  • 适合罕见病、长潜伏期
  • 快速、低成本
  • 样本量需求小
  • 可研究多个暴露因素

⚠️ 缺点

  • 回忆偏倚(Recall Bias):病例更易记住/夸大暴露
  • 选择偏倚:对照组来源和可比性要求高
  • 不能直接算发病率、RR
  • 混杂控制有限、过度匹配风险

2.1 方法学关键点

步骤
风险
控制策略
病例选择
诊断异质
明确标准,统一病理或影像诊断
对照选择
选择偏倚
同来源人群、纳入标准一致
暴露评估
回忆/信息偏倚
结构化问卷、盲法访谈、优先客观记录
匹配
过度匹配
仅限主要混杂变量,分析用条件Logistic回归
Multiple Controls
罕见结局样本不足
每病例配1-4对照提升功效,>4效益递减
混杂控制
多重暴露/混杂
多变量Logistic回归、倾向评分

2.2 优缺点一览

优势
缺点
🚀 罕见病/长潜伏期
🧠 回忆偏倚,病例更可能记住/夸大暴露
⏱️ 快速、低成本
📄 信息验证难、现有记录不完整
💰 样本量需求低,现有资料可用
🏷️ 选择合适对照组难,易生选择偏倚
🔍 可评估多个暴露因素
⚖️ 只能得OR,不能得发病率/RR
➕ 多对照提升功效
🔄 混杂控制有限,过度匹配风险

特别提示
  • 回忆偏倚:病例受疾病影响,回忆暴露更细致甚至夸大。缓解:用客观记录、对照相同方式、回忆窗口缩短。
  • Multiple Controls:每病例配2–4名对照提升功效,>4效益有限。

3️⃣ 三者本质比较表(回顾性Cohort、Case-Control、Case Series)

核心特征
回顾性Cohort Study
Case-Control Study
Case Series
分组起点
暴露
结局(病例/对照)
单病例组
对照组
必须有(未暴露/对照)
必须有(无病/对照)
时间逻辑
先暴露→结局(回顾性追溯)
先结局→回顾暴露
仅描述结局
可推断力
能推断暴露-结局关联
不能直接推断RR,仅能得OR
仅描述性
统计分析
发生率、RR、RD、HR
OR,多变量Logistic回归
频数、比例
应用
药物、灾害、职业健康等
罕见病、初步关联分析
新疾病、创新疗效信号
常见误区
无对照组时≠cohort,仅为病例系列
对照组可比性差,暴露估计偏倚
错用为因果推断

4️⃣ 结论

  • 队列研究(无论前瞻或回顾)必须有对照,才能做关联推断,否则仅为病例系列。
  • 病例对照研究依靠病例/对照分组,适合罕见病但有回忆偏倚等问题。
  • 病例系列仅用于现象描述、信号提示,不能做暴露与结局的比较推断。
  • 选择哪种设计,需结合疾病特点、资料可得性、时间资源、推断目标等多因素权衡。

参考文献

  1. Song JW, Chung KC. Observational studies: cohort and case-control studies. Plast Reconstr Surg. 2010 Dec;126(6):2234-2242. PMC2998589
  1. STROBE Statement: www.strobe-statement.org
Prev
统计建模的三大学派:频率学派、贝叶斯学派与机器学
Next
gtsummary 回归模型
Loading...
Article List
Evan の Logbook
✨ Updates
🎨 Style Guide
🧠 Creative Resources
🗒️ Mind Notes
🧭 Knowbase
📘 SOPs
🩺 Medical Research
🛠️ Tech Chronicles
💰 Fortune Blueprint
📈 R Visionary
📊 Statistics
🖼️ BioVis