Lazy loaded imageSurvival Analysis

type
status
date
slug
summary
tags
category
icon
password
comment

1. 生存分析简介

生存分析(Survival Analysis)用于研究从起始事件到目标事件发生所经历的时间分布,广泛应用于医学(如总生存期、无进展生存期)、工程(零件失效时间)、经济等领域。
特点:
  • 能处理**删失(censoring)**数据
  • 能展示时间与生存概率的关系
  • 可进行不同组之间的比较

2. 生存分析所需数据

生存分析至少需要两个核心变量:
  1. time:从起始时间点到事件发生或观察截止的时间(单位可为天、月、年)
  1. status:事件状态
      • 1 = 事件已发生(如死亡、复发)
      • 0 = 删失(观测截止时未发生事件 / 失访)

3. time 与 status 的含义

  • time:时间长度,例如“患者从手术到死亡的天数”
  • status:0 表示删失(还活着或未复发),1 表示事件已发生(死亡、复发等)

4. 常用 R 包与函数

  • 核心包survival(拟合模型)、survminer(绘图与可视化)
  • 常用函数
    • Surv(time, status):创建生存对象
    • survfit():拟合 Kaplan–Meier 生存曲线
    • ggsurvplot():绘制 KM 曲线(survminer 包)

5. 示例数据:lung 数据集

survival 包自带的肺癌患者数据,核心变量:
  • time:随访时间(天)
  • status:1 = 删失,2 = 死亡(需要转换成 0/1)

6. 中位生存时间

中位生存时间(Median Survival Time):生存概率降到 50% 时的时间点。

7. 95% 置信区间

可以直接从 summary() 结果获取,也可以用 Hmisc::bootkm() 进行 bootstrap 估计:

8. 多分组比较

除了二分类变量(如性别),也可以用多分类变量(如 ph.ecog):

9. 两两比较

多组间生存差异可以用 pairwise_survdiff()
默认是 log-rank 检验,可选择 p 值调整方法(如 "BH")。

10. 累积风险函数

累积风险(Cumulative Hazard)描述随时间累积的事件风险,可用:
曲线上升越快,说明单位时间内事件发生的概率越大。
Prev
apply 家族核心函数
Next
list.files
Loading...
Article List
Evan の Logbook
✨ Updates
🎨 Style Guide
🧠 Creative Resources
🗒️ Mind Notes
🧭 Knowbase
📘 SOPs
🩺 Medical Research
🛠️ Tech Chronicles
💰 Fortune Blueprint
📈 R Visionary
📊 Statistics
🖼️ BioVis