Lazy loaded image多因素逻辑回归

type
status
date
slug
summary
tags
category
icon
password
comment

1. 引言

逻辑回归是统计与数据科学中最常用的分类模型之一,当结局变量是二分类(如疾病/无疾病)时,它能有效刻画自变量与结局之间的关系。
当我们同时考虑多个影响因素时,就需要用到 多因素逻辑回归(Multivariable Logistic Regression)
相比单因素分析,多因素模型能:
  • 控制混杂因素
  • 提供每个自变量在控制其他变量后的独立效应
  • 为预测模型奠定基础

2. 模型原理

2.1 数学表达式

逻辑回归通过 logit 变换,将概率限制在 0–1 之间:

2.2 系数解释

  • 系数 β :对数优势比(log odds)
  • 指数化后:优势比(Odds Ratio, OR)
    • OR > 1:风险增加
    • OR < 1:风险降低
    • OR = 1:无关联

3. 数据准备与模拟

我们模拟一个包含 500 个样本的数据集,包括:
  • 年龄(age):连续变量
  • 性别(sex):二分类变量
  • 吸烟(smoking):二分类变量
  • BMI:连续变量
  • 高血压(hypertension):结局变量(二分类)

4. 模型拟合

输出结果会显示:
  • 每个变量的系数、标准误、z 值和 p 值
  • AIC、残差偏差等整体拟合指标

5. 系数转换为 OR

解释:
  • OR:在其他变量保持不变的情况下,该变量每增加一个单位(或从参照组切换到该水平),结局的优势变化倍数
  • LCL/UCL:95% 置信区间

6. 模型拟合度评价

6.1 偏差检验(Deviance)

  • summary(m) 中比较 Null deviance 与 Residual deviance
  • 差值显著(用卡方检验)说明模型拟合显著优于空模型

6.2 Hosmer–Lemeshow 检验

  • p 值 > 0.05:预测概率与实际观测一致性较好

6.3 ROC & AUC

  • AUC 越接近 1,模型区分能力越强

6.4 校准曲线

  • 检查预测概率与实际概率的吻合程度

7. 结果报告建议

在正式分析报告中,可以这样组织:
  1. 研究问题(结局、主要暴露、协变量)
  1. 模型形式(逻辑回归)
  1. 系数、OR 与 95% CI
  1. 显著性检验结果
  1. 模型拟合度指标(AIC、Hosmer–Lemeshow、AUC)
  1. 校准度评价

8. 小结

  • 多因素逻辑回归可同时评估多个变量的独立效应
  • 结果解读时务必报告 OR 及置信区间
  • 模型评价要结合 拟合度 + 区分能力 + 校准度
  • 在临床或政策研究中,建议进一步结合决策曲线分析(DCA)
Prev
方差分析(ANOVA)
Next
单因素逻辑回归
Loading...
Article List
Evan の Logbook
✨ Updates
🎨 Style Guide
🧠 Creative Resources
🗒️ Mind Notes
🧭 Knowbase
📘 SOPs
🩺 Medical Research
🛠️ Tech Chronicles
💰 Fortune Blueprint
📈 R Visionary
📊 Statistics
🖼️ BioVis