🔬msigdbr 包

type
status
date
slug
summary
tags
category
icon
password
comment
简介
msigdbr 是 R 语言中访问 MSigDB(Molecular Signatures Database)基因集的利器,提供了基于物种、集合(collection)和子集合(subcollection)的灵活筛选与下载接口。本篇演示从安装到常见操作,教你如何快速拿到自己需要的基因集。

1. 安装与加载


2. 下载所有小鼠(Mus musculus)基因集

  • species 可以写全名("Mus musculus")或缩写("mouse")。

3. 只看 Hallmark (H) 基因集

  • Hallmark 基因集用于捕捉信号通路的核心“高置信度”基因模式。

4. 统计每个 Hallmark 基因集的基因数


5. 查看 C2:CGP(化合物与基因署名)子集合

  • collection="C2" 涵盖化合物、基因敲除/过表达署名等多种子集,通过 subcollection 精确挑选。

6. 探索元信息


7. 数据规模与快速概览

  • object.size() 帮你评估内存占用,决定是否需要拆分下载。
  • skim() 则可一键了解每列类型、非空率及分布。

小结
  • msigdbr 强大且易用,只需 msigdbr() 一步,即可获取丰富的 MSigDB 基因集。
  • 通过 collectionsubcollection 参数,可精准拿到自己研究需要的信号通路与基因署名。
  • 配合 dplyr/table/skimr 等工具,能快速统计、筛选与探索数据集。
Prev
ggthemes 常用主题
Next
CMplot 绘制曼哈顿图
Loading...
Article List
Evan の Logbook
✨ Updates
🎨 Style Guide
🧠 Creative Resources
🗒️ Mind Notes
🧭 Knowbase
📘 SOPs
🩺 Medical Research
🛠️ Tech Chronicles
💰 Fortune Blueprint
📈 R Visionary
📊 Statistics
🖼️ BioVis