Browse

Links

Resource

Ctrl+K

Evan の Logbook

🎨 Design

Lazy loaded image

Font · 字体手册

🗂 Collection

Lazy loaded image

Name · 名以载道

Lazy loaded image

Quote · 字里行间

🧭 Research

Lazy loaded image

biorxiv 与预印本

🇬🇧 UK Biobank 数据库介绍

🇬🇧 UK Biobank 数据库申请指南

Lazy loaded image

BioRender 使用与订阅笔记

📝 AUCell 流程笔记

🏢 Cohort study VS Case-control

Lazy loaded image

访问和下载 FinnGen GWAS 汇总数据

🏥 Declaration of Helsinki｜赫尔辛基宣言

📘 SOPs

🆕 创建账号 · Google

🌍 生成境外地址

🍎 创建账号 · Apple

🧠 创建账号 · ChatGPT

🚀 科学上网指南：信息时代的通行证

🤖 NFC 卡读取与写入流程

🛠️ Tech

💰 Finance

📗 期权基础：概念、类型与风险

📗 期权交易策略：从单腿到组合

🕟 美股交易时间：盘前、盘中、盘后与隔夜交易

🧩 Concepts

Lazy loaded image

🕊️ 鸽派、鹰派、左派与右派

📈 R & Data Science

Lazy loaded image

R 的 future 包（异步与并行）

Lazy loaded image

R 中加载与使用系统字体

Lazy loaded image

R 中的数据类型完整指南

Lazy loaded image

R 与 RStudio 安装笔记

🔃 purrr 包学习笔记

🔁 apply 家族核心函数

📁 list.files：R 基础文件列举函数

📊 R中excel表格读取

Lazy loaded image

make_date() & make_datetime()：从字段构造时间对象

📦 为什么使用 lubridate？

⏳ ISO 8601 国际时间标准

Lazy loaded image

forcats: 分类变量处理

📏 separate_wider_position()：按固定宽度横向拆分为多列

📐 separate_wider_delim()：按分隔符拆分为多列

🪓 separate_longer_position()：按固定宽度切分为多行

Lazy loaded image

pmin() & pmax()：向量按元素逐位比较

🔢 parse_double() vs parse_number()

Lazy loaded image

geom_tile()：构建热图 / 网格图的砖块图层

🎨 常用美学参数详解：position, fill, alpha 等

Lazy loaded image

facet_wrap() 与 facet_grid() 用法解析

🌳 高亮特定数据子集：多图层叠加法

Lazy loaded image

三种 geom_smooth() 写法解析

🔻 geom_smooth() 的 shape 限制

🎨 ggplot2 颜色映射

Lazy loaded image

ggplot2 的 shape 限制与解决方案

Lazy loaded image

R语言字符串大小写变换

Lazy loaded image

R语言数字取整与格式化。

Lazy loaded image

gtsummary 回归模型

Lazy loaded image

gtsummary + gt：R语言三线表实践

🔁 pivot_wider()：长表转宽表

🔢 parse_number()：提取字符串中的数字

🔁 pivot_longer()：宽表转长表

⚡ .by：轻量级分组操作的新方式

🔓 ungroup()：取消分组结构

✂️ slice()：按位置切片提取行

🧮 group_by()：分组操作的基础

🧭 relocate()：调整列顺序

Lazy loaded image

select()：灵活选择列

📲 mutate()：创建新列与列位置

🔢 count()：快速计数分组频次

Lazy loaded image

distinct(): 去重

🔺 ggplot2 点形状

Lazy loaded image

ggthemr：为 ggplot2 一键换肤

Lazy loaded image

ggthemes 常用主题

🔬 msigdbr 包

📈 CMplot 绘制曼哈顿图

Lazy loaded image

SMR 共定位分析

🧬 coloc R 包实用笔记与数据格式梳理

📊 ggpubr · 让科研图表高效“出版就绪”的R扩展包

🎨 theme_pubr · 出版级 R ggplot2 主题美化指南

✂️ 用 patchwork 优雅组合你的 ggplot2 图表

🔤 R 正则表达式语法与字符串操作速查

📐 R基础数学与统计函数速查

📚 R包管理基础：.libPaths() 与 library()

📦 R工作空间对象管理：ls 与 rm

🔗 R集合归属与反归属运算符：%in% 与 %nin%

🕳️ R缺失值与空值处理（na.omit & evanverse::is_void）

🔎 R字符串匹配 grep 与 grepl 实用技巧

📊 R基础数据结构与分布探索技巧

↕️ R常用向量操作与排序技巧

🔍 R匹配函数 match 的实用技巧

🔗 R字符串拼接 paste/paste0 典型用法

Lazy loaded image

R集合操作与典型用法

Lazy loaded image

R apply函数速查与典型用法

Lazy loaded image

R变量命名规范与覆盖机制

➗ R取余、整除与分批处理技巧

Lazy loaded image

R设置CRAN与Bioconductor镜像速查

Lazy loaded image

R版本升级与包迁移实用指南

Lazy loaded image

R查询当前环境和包信息（sessionInfo）

Lazy loaded image

创建文件夹与目录管理基础

Lazy loaded image

RStudio常用快捷键与界面恢复技巧

Lazy loaded image

提取字符向量子串的实用技巧

Lazy loaded image

高效读取表格与大文件：fread与自定义read_table_flex

Lazy loaded image

foreach包批量循环

Lazy loaded image

R基因ID转换与批量注释

Lazy loaded image

R批量获取和筛选文件名

Lazy loaded image

R常用序列与模拟数据生成

Lazy loaded image

R数据框（df）条件筛选实用技巧

Lazy loaded image

R Visionary - Introduction

🎄 Forestplot in R

📊 Statistics

Lazy loaded image

生存分析 · Survival Analysis

Lazy loaded image

方差分析 · ANOVA

Lazy loaded image

多因素逻辑回归

Lazy loaded image

单因素逻辑回归

Lazy loaded image

R语言中的常见统计分布及其应用

Lazy loaded image

数据分析的可复现性：原则与实践

📂 p值操纵与文件抽屉

Lazy loaded image

如何规范报告统计结果？

Lazy loaded image

相关性检验

Lazy loaded image

多重检验 · Multiple Testing

Lazy loaded image

t 检验 · t-test

Lazy loaded image

置信区间 · Confidence Intervals

Lazy loaded image

卡方检验 · Chi-squared Test

Lazy loaded image

统计功效（Power）与样本量（Sample Size）

Lazy loaded image

假设检验 & p值

Lazy loaded image

频率表、比例表与列联表笔记

🏫 统计学三大学派概览

Lazy loaded image

t-test: Principles and Application in R

🔁pivot_longer()：宽表转长表

type

Post

status

Published

date

Jul 25, 2025

slug

tidyr-pivot-longer

summary

掌握 `tidyr::pivot_longer()`：将宽格式数据转成长格式，支持列名拆分、辅助选择与缺失值处理，打造“tidy”数据。

tags

R

数据清洗

tidyr

category

📈 R & Data Science

icon

password

comment

Show

pivot_longer() 是 tidyr 中将多列“压缩”为两列（变量名列 + 值列）的核心函数，它能将数据转换为“tidy 格式”，非常适合后续可视化、建模或汇总分析。

1. 函数原型

参数	说明
`data`	输入的宽格式数据框
`cols`	要“拉长”的列（可用列名、范围、或 `select()` 语法指定）
`names_to`	新生成的“变量名”列的列名，默认 `"name"`
`values_to`	新生成的“值”列的列名，默认 `"value"`
`names_prefix`	去除原列名中的前缀（`stringr::str_remove()`）
`names_sep`	按分隔符拆分列名，生成多个新列（等同于 `names_to = c(...)`, `names_sep = "_"`）
`names_pattern`	按正则表达式拆分列名（捕获组决定拆分后新列），通常与 `names_to = c(...)` 配合使用
`values_drop_na`	是否删除 `NA` 值的行（默认 `FALSE`：保留所有组合）

2. 基础示例

示例数据

2.1 将 `gene_A` 和 `gene_B` 拉长

输出

id	gene	expression
1	gene_A	10
1	gene_B	15
2	gene_A	20
…	…	…

3. 辅助选择

利用 select() 语法，快速选择一组列：

4. 列名拆分

当列名中蕴含多个信息时，可拆分为多列：

输出

id	type	replicate	value
1	A	1	5
1	A	2	7
1	B	1	9
…	…	…	…

5. 正则拆分

使用正则捕获组更灵活：

6. 去除缺失值

当部分组合不存在时，可删除 NA 行：

7. 使用建议

可视化前：将宽表拉成长表后，便可直接用 ggplot(aes(color = gene)) + geom_line(aes(x = id, y = expression))

模型输入：许多建模工具都要求“长格式”或“一行一观测”

分组拆分：结合 names_sep/names_pattern，快速从列名提取元信息

与 pivot_wider() 对应：二者配合，可在多表连接和数据 reshape 间自由切换

总结
pivot_longer() 是实现“tidy data” 的重要一环。无论是简单合并多列，还是复杂拆分列名，它都能让数据变得整洁，后续分析流程更顺畅！

parse_number()：提取字符串中的数字

.by：轻量级分组操作的新方式

Loading...

Catalog

Last update: 2025-07-25

Article List

Evan の Logbook

🎨 Design

Lazy loaded image

Font · 字体手册

🗂 Collection

Lazy loaded image

Name · 名以载道

Lazy loaded image

Quote · 字里行间

🧭 Research

Lazy loaded image

biorxiv 与预印本

🇬🇧 UK Biobank 数据库介绍

🇬🇧 UK Biobank 数据库申请指南

Lazy loaded image

BioRender 使用与订阅笔记

📝 AUCell 流程笔记

🏢 Cohort study VS Case-control

Lazy loaded image

访问和下载 FinnGen GWAS 汇总数据

🏥 Declaration of Helsinki｜赫尔辛基宣言

📘 SOPs

🆕 创建账号 · Google

🌍 生成境外地址

🍎 创建账号 · Apple

🧠 创建账号 · ChatGPT

🚀 科学上网指南：信息时代的通行证

🤖 NFC 卡读取与写入流程

🛠️ Tech

💰 Finance

📗 期权基础：概念、类型与风险

📗 期权交易策略：从单腿到组合

🕟 美股交易时间：盘前、盘中、盘后与隔夜交易

🧩 Concepts

Lazy loaded image

🕊️ 鸽派、鹰派、左派与右派

📈 R & Data Science

Lazy loaded image

R 的 future 包（异步与并行）

Lazy loaded image

R 中加载与使用系统字体

Lazy loaded image

R 中的数据类型完整指南

Lazy loaded image

R 与 RStudio 安装笔记

🔃 purrr 包学习笔记

🔁 apply 家族核心函数

📁 list.files：R 基础文件列举函数

📊 R中excel表格读取

Lazy loaded image

make_date() & make_datetime()：从字段构造时间对象

📦 为什么使用 lubridate？

⏳ ISO 8601 国际时间标准

Lazy loaded image

forcats: 分类变量处理

📏 separate_wider_position()：按固定宽度横向拆分为多列

📐 separate_wider_delim()：按分隔符拆分为多列

🪓 separate_longer_position()：按固定宽度切分为多行

Lazy loaded image

pmin() & pmax()：向量按元素逐位比较

🔢 parse_double() vs parse_number()

Lazy loaded image

geom_tile()：构建热图 / 网格图的砖块图层

🎨 常用美学参数详解：position, fill, alpha 等

Lazy loaded image

facet_wrap() 与 facet_grid() 用法解析

🌳 高亮特定数据子集：多图层叠加法

Lazy loaded image

三种 geom_smooth() 写法解析

🔻 geom_smooth() 的 shape 限制

🎨 ggplot2 颜色映射

Lazy loaded image

ggplot2 的 shape 限制与解决方案

Lazy loaded image

R语言字符串大小写变换

Lazy loaded image

R语言数字取整与格式化。

Lazy loaded image

gtsummary 回归模型

Lazy loaded image

gtsummary + gt：R语言三线表实践

🔁 pivot_wider()：长表转宽表

🔢 parse_number()：提取字符串中的数字

🔁 pivot_longer()：宽表转长表

⚡ .by：轻量级分组操作的新方式

🔓 ungroup()：取消分组结构

✂️ slice()：按位置切片提取行

🧮 group_by()：分组操作的基础

🧭 relocate()：调整列顺序

Lazy loaded image

select()：灵活选择列

📲 mutate()：创建新列与列位置

🔢 count()：快速计数分组频次

Lazy loaded image

distinct(): 去重

🔺 ggplot2 点形状

Lazy loaded image

ggthemr：为 ggplot2 一键换肤

Lazy loaded image

ggthemes 常用主题

🔬 msigdbr 包

📈 CMplot 绘制曼哈顿图

Lazy loaded image

SMR 共定位分析

🧬 coloc R 包实用笔记与数据格式梳理

📊 ggpubr · 让科研图表高效“出版就绪”的R扩展包

🎨 theme_pubr · 出版级 R ggplot2 主题美化指南

✂️ 用 patchwork 优雅组合你的 ggplot2 图表

🔤 R 正则表达式语法与字符串操作速查

📐 R基础数学与统计函数速查

📚 R包管理基础：.libPaths() 与 library()

📦 R工作空间对象管理：ls 与 rm

🔗 R集合归属与反归属运算符：%in% 与 %nin%

🕳️ R缺失值与空值处理（na.omit & evanverse::is_void）

🔎 R字符串匹配 grep 与 grepl 实用技巧

📊 R基础数据结构与分布探索技巧

↕️ R常用向量操作与排序技巧

🔍 R匹配函数 match 的实用技巧

🔗 R字符串拼接 paste/paste0 典型用法

Lazy loaded image

R集合操作与典型用法

Lazy loaded image

R apply函数速查与典型用法

Lazy loaded image

R变量命名规范与覆盖机制

➗ R取余、整除与分批处理技巧

Lazy loaded image

R设置CRAN与Bioconductor镜像速查

Lazy loaded image

R版本升级与包迁移实用指南

Lazy loaded image

R查询当前环境和包信息（sessionInfo）

Lazy loaded image

创建文件夹与目录管理基础

Lazy loaded image

RStudio常用快捷键与界面恢复技巧

Lazy loaded image

提取字符向量子串的实用技巧

Lazy loaded image

高效读取表格与大文件：fread与自定义read_table_flex

Lazy loaded image

foreach包批量循环

Lazy loaded image

R基因ID转换与批量注释

Lazy loaded image

R批量获取和筛选文件名

Lazy loaded image

R常用序列与模拟数据生成

Lazy loaded image

R数据框（df）条件筛选实用技巧

Lazy loaded image

R Visionary - Introduction

🎄 Forestplot in R

📊 Statistics

Lazy loaded image

生存分析 · Survival Analysis

Lazy loaded image

方差分析 · ANOVA

Lazy loaded image

多因素逻辑回归

Lazy loaded image

单因素逻辑回归

Lazy loaded image

R语言中的常见统计分布及其应用

Lazy loaded image

数据分析的可复现性：原则与实践

📂 p值操纵与文件抽屉

Lazy loaded image

如何规范报告统计结果？

Lazy loaded image

相关性检验

Lazy loaded image

多重检验 · Multiple Testing

Lazy loaded image

t 检验 · t-test

Lazy loaded image

置信区间 · Confidence Intervals

Lazy loaded image

卡方检验 · Chi-squared Test

Lazy loaded image

统计功效（Power）与样本量（Sample Size）

Lazy loaded image

假设检验 & p值

Lazy loaded image

频率表、比例表与列联表笔记

🏫 统计学三大学派概览

Lazy loaded image

t-test: Principles and Application in R