Evan の Logbook
✨ Updates
🎨 Style Guide
🧠 Creative Resources
🗒️ Mind Notes
🧭 Knowbase
📘 SOPs
🩺 Medical Research
🛠️ Tech Chronicles
💰 Fortune Blueprint
📈 R Visionary
📊 Statistics
🖼️ BioVis
🧬coloc R 包实用笔记与数据格式梳理
type
status
date
slug
summary
tags
category
icon
password
comment
1. 基础说明
- coloc:常用的 summary-level 共定位分析 R 包,适合 GWAS/eQTL/mQTL/pQTL/表型等多组学数据,判断两个信号是否共用同一因果突变。
- 支持贝叶斯方法 (
coloc.abf)、细化分析 (finemap.abf)、多信号/多因子场景 (coloc.susie)。
- 数据格式要求极高:建议反复
check_dataset()。
2. 输入数据格式总结
必备字段(取决于能否获得 beta,varbeta,sdY...):
字段 | 说明 | 必要性 | 说明 |
beta | 效应值 | 推荐 | 必须与 varbeta 配合 |
varbeta | 效应值方差 | 推荐 | 若无则需 p/N/MAF 估算 |
snp | SNP 编号 | 必须 | 需与 LD 矩阵对齐 |
position | 染色体位置 | 推荐 | 方便可视化 |
type | “quant” 或 “cc” | 推荐 | 定量/二元性状 |
sdY | 表型标准差 | 推荐 | 若无可用 N/MAF 估算 |
MAF | 次要等位基因频率 | 可选 | 缺 sdY 时必须 |
N | 样本量 | 可选 | 估算效应量时必需 |
pvalues | p 值 | 可选 | 缺 beta/varbeta 时必需 |
判断逻辑:
- 有
beta和varbeta,最好;否则需pvalues、N、MAF估算。
- 定量型需
type="quant",二元型需type="cc"且可加s(case 占比)。
3. 数据检查与最小化格式化流程
4. 数据集可视化与校准
5. 共定位与细化 (fine-mapping)
单个信号(经典 abf)
灵敏度分析(prior 敏感性)
6. 多信号场景:susie 分析
- 如果有 LD 信息、多个因果信号,推荐用 susieR + coloc.susie。
7. 补充
coloc.susie需要 LD,是 SNP x SNP 方阵,名字与snp字段严格对齐。
finemap.abf():对单个数据做信号细化。
8. 参考与学习资源
Prev
SMR 共定位分析
Next
ggpubr - 让科研图表高效“出版就绪”的R扩展包
Loading...
YouTube 使用笔记