🧬coloc R 包实用笔记与数据格式梳理

type
status
date
slug
summary
tags
category
icon
password
comment

1. 基础说明

  • coloc:常用的 summary-level 共定位分析 R 包,适合 GWAS/eQTL/mQTL/pQTL/表型等多组学数据,判断两个信号是否共用同一因果突变。
  • 支持贝叶斯方法 (coloc.abf)、细化分析 (finemap.abf)、多信号/多因子场景 (coloc.susie)。
  • 数据格式要求极高:建议反复 check_dataset()

2. 输入数据格式总结

必备字段(取决于能否获得 beta,varbeta,sdY...):
字段
说明
必要性
说明
beta
效应值
推荐
必须与 varbeta 配合
varbeta
效应值方差
推荐
若无则需 p/N/MAF 估算
snp
SNP 编号
必须
需与 LD 矩阵对齐
position
染色体位置
推荐
方便可视化
type
“quant” 或 “cc”
推荐
定量/二元性状
sdY
表型标准差
推荐
若无可用 N/MAF 估算
MAF
次要等位基因频率
可选
缺 sdY 时必须
N
样本量
可选
估算效应量时必需
pvalues
p 值
可选
缺 beta/varbeta 时必需
判断逻辑
  • betavarbeta,最好;否则需 pvaluesNMAF 估算。
  • 定量型需 type="quant",二元型需 type="cc" 且可加 s(case 占比)。

3. 数据检查与最小化格式化流程


4. 数据集可视化与校准


5. 共定位与细化 (fine-mapping)

单个信号(经典 abf)

灵敏度分析(prior 敏感性)


6. 多信号场景:susie 分析

  • 如果有 LD 信息、多个因果信号,推荐用 susieR + coloc.susie。

7. 补充

  • coloc.susie 需要 LD,是 SNP x SNP 方阵,名字与 snp 字段严格对齐。
  • finemap.abf():对单个数据做信号细化。

8. 参考与学习资源

 
Prev
SMR 共定位分析
Next
ggpubr - 让科研图表高效“出版就绪”的R扩展包
Loading...
Article List
Evan の Logbook
✨ Updates
🎨 Style Guide
🧠 Creative Resources
🗒️ Mind Notes
🧭 Knowbase
📘 SOPs
🩺 Medical Research
🛠️ Tech Chronicles
💰 Fortune Blueprint
📈 R Visionary
📊 Statistics
🖼️ BioVis