Browse

Links

Resource

Ctrl+K

Evan の Logbook

🎨 Design

Lazy loaded image

Font · 字体手册

🗂 Collection

Lazy loaded image

Name · 名以载道

Lazy loaded image

Quote · 字里行间

🧭 Research

Lazy loaded image

biorxiv 与预印本

🇬🇧 UK Biobank 数据库介绍

🇬🇧 UK Biobank 数据库申请指南

Lazy loaded image

BioRender 使用与订阅笔记

📝 AUCell 流程笔记

🏢 Cohort study VS Case-control

Lazy loaded image

访问和下载 FinnGen GWAS 汇总数据

🏥 Declaration of Helsinki｜赫尔辛基宣言

📘 SOPs

🆕 创建账号 · Google

🌍 生成境外地址

🍎 创建账号 · Apple

🧠 创建账号 · ChatGPT

🚀 科学上网指南：信息时代的通行证

🤖 NFC 卡读取与写入流程

🛠️ Tech

💰 Finance

📗 期权基础：概念、类型与风险

📗 期权交易策略：从单腿到组合

🕟 美股交易时间：盘前、盘中、盘后与隔夜交易

🧩 Concepts

Lazy loaded image

🕊️ 鸽派、鹰派、左派与右派

📈 R & Data Science

Lazy loaded image

R 的 future 包（异步与并行）

Lazy loaded image

R 中加载与使用系统字体

Lazy loaded image

R 中的数据类型完整指南

Lazy loaded image

R 与 RStudio 安装笔记

🔃 purrr 包学习笔记

🔁 apply 家族核心函数

📁 list.files：R 基础文件列举函数

📊 R中excel表格读取

Lazy loaded image

make_date() & make_datetime()：从字段构造时间对象

📦 为什么使用 lubridate？

⏳ ISO 8601 国际时间标准

Lazy loaded image

forcats: 分类变量处理

📏 separate_wider_position()：按固定宽度横向拆分为多列

📐 separate_wider_delim()：按分隔符拆分为多列

🪓 separate_longer_position()：按固定宽度切分为多行

Lazy loaded image

pmin() & pmax()：向量按元素逐位比较

🔢 parse_double() vs parse_number()

Lazy loaded image

geom_tile()：构建热图 / 网格图的砖块图层

🎨 常用美学参数详解：position, fill, alpha 等

Lazy loaded image

facet_wrap() 与 facet_grid() 用法解析

🌳 高亮特定数据子集：多图层叠加法

Lazy loaded image

三种 geom_smooth() 写法解析

🔻 geom_smooth() 的 shape 限制

🎨 ggplot2 颜色映射

Lazy loaded image

ggplot2 的 shape 限制与解决方案

Lazy loaded image

R语言字符串大小写变换

Lazy loaded image

R语言数字取整与格式化。

Lazy loaded image

gtsummary 回归模型

Lazy loaded image

gtsummary + gt：R语言三线表实践

🔁 pivot_wider()：长表转宽表

🔢 parse_number()：提取字符串中的数字

🔁 pivot_longer()：宽表转长表

⚡ .by：轻量级分组操作的新方式

🔓 ungroup()：取消分组结构

✂️ slice()：按位置切片提取行

🧮 group_by()：分组操作的基础

🧭 relocate()：调整列顺序

Lazy loaded image

select()：灵活选择列

📲 mutate()：创建新列与列位置

🔢 count()：快速计数分组频次

Lazy loaded image

distinct(): 去重

🔺 ggplot2 点形状

Lazy loaded image

ggthemr：为 ggplot2 一键换肤

Lazy loaded image

ggthemes 常用主题

🔬 msigdbr 包

📈 CMplot 绘制曼哈顿图

Lazy loaded image

SMR 共定位分析

🧬 coloc R 包实用笔记与数据格式梳理

📊 ggpubr · 让科研图表高效“出版就绪”的R扩展包

🎨 theme_pubr · 出版级 R ggplot2 主题美化指南

✂️ 用 patchwork 优雅组合你的 ggplot2 图表

🔤 R 正则表达式语法与字符串操作速查

📐 R基础数学与统计函数速查

📚 R包管理基础：.libPaths() 与 library()

📦 R工作空间对象管理：ls 与 rm

🔗 R集合归属与反归属运算符：%in% 与 %nin%

🕳️ R缺失值与空值处理（na.omit & evanverse::is_void）

🔎 R字符串匹配 grep 与 grepl 实用技巧

📊 R基础数据结构与分布探索技巧

↕️ R常用向量操作与排序技巧

🔍 R匹配函数 match 的实用技巧

🔗 R字符串拼接 paste/paste0 典型用法

Lazy loaded image

R集合操作与典型用法

Lazy loaded image

R apply函数速查与典型用法

Lazy loaded image

R变量命名规范与覆盖机制

➗ R取余、整除与分批处理技巧

Lazy loaded image

R设置CRAN与Bioconductor镜像速查

Lazy loaded image

R版本升级与包迁移实用指南

Lazy loaded image

R查询当前环境和包信息（sessionInfo）

Lazy loaded image

创建文件夹与目录管理基础

Lazy loaded image

RStudio常用快捷键与界面恢复技巧

Lazy loaded image

提取字符向量子串的实用技巧

Lazy loaded image

高效读取表格与大文件：fread与自定义read_table_flex

Lazy loaded image

foreach包批量循环

Lazy loaded image

R基因ID转换与批量注释

Lazy loaded image

R批量获取和筛选文件名

Lazy loaded image

R常用序列与模拟数据生成

Lazy loaded image

R数据框（df）条件筛选实用技巧

Lazy loaded image

R Visionary - Introduction

🎄 Forestplot in R

📊 Statistics

Lazy loaded image

生存分析 · Survival Analysis

Lazy loaded image

方差分析 · ANOVA

Lazy loaded image

多因素逻辑回归

Lazy loaded image

单因素逻辑回归

Lazy loaded image

R语言中的常见统计分布及其应用

Lazy loaded image

数据分析的可复现性：原则与实践

📂 p值操纵与文件抽屉

Lazy loaded image

如何规范报告统计结果？

Lazy loaded image

相关性检验

Lazy loaded image

多重检验 · Multiple Testing

Lazy loaded image

t 检验 · t-test

Lazy loaded image

置信区间 · Confidence Intervals

Lazy loaded image

卡方检验 · Chi-squared Test

Lazy loaded image

统计功效（Power）与样本量（Sample Size）

Lazy loaded image

假设检验 & p值

Lazy loaded image

频率表、比例表与列联表笔记

🏫 统计学三大学派概览

Lazy loaded image

t-test: Principles and Application in R

⚡.by：轻量级分组操作的新方式

type

Post

status

Published

date

Jul 25, 2025

slug

dplyr-by

summary

掌握 `dplyr` 1.1.0 的轻量级分组新语法 `.by`：在 `summarise()`、`mutate()`、`filter()` 等函数中直接分组，无需显式 `group_by()`，代码更简洁。

tags

R

dplyr

数据清洗

category

📈 R & Data Science

icon

password

comment

Show

从 dplyr 1.1.0 起，你可以在 summarise()、mutate()、filter() 等函数中用 .by 参数，一行完成分组 + 计算，不再需要先写 group_by()，也无需再手动 ungroup()。

1. 为什么用 `.by`

省去 group_by()/ungroup()，让管道更简洁

直接在目标函数内指定分组，意图更直观

默认不保留分组结构，后续操作回归全局数据

2. 函数原型

.by 可传单列名，也可传向量 c(col1, col2)

等价于：

3. 示例数据

4. 核心用法示例

4.1 `.by` + `summarise()`

按 group 计算组内平均，结果不保留分组结构：

group	mean_score
A	11
B	14.5
C	13

4.2 `.by` + `mutate()`

按 group 计算组均值并新增列：

效果：df 中每行多了一列 group_mean，值为对应分组的平均分。

4.3 多列分组

同时按 (group, gender) 分组计算：

效果：得到每个 (group, gender) 的平均分，分组更细。

4.4 `.by` + `filter()`

按组筛选：例如保留每组分数大于组均值的行：

5. 小贴士

链式阅读：把分组逻辑直接写在操作函数中，减少管道层级

无分组残留：无需再写 ungroup()，避免分组影响后续步骤

可用于所有分组敏感函数：summarise()、mutate()、filter()、甚至 arrange()

适合一次性、临时分组计算：当不需要后续继续分组时，首选 .by

总结
.by 让你的分组计算更简洁、直观，无需再写 group_by()/ungroup()。在日常数据分析中，凡是“一次性”的聚合、变换或筛选，都可以优先考虑使用 .by！

pivot_longer()：宽表转长表

ungroup()：取消分组结构

Loading...

Catalog

Last update: 2025-07-25

Article List

Evan の Logbook

🎨 Design

Lazy loaded image

Font · 字体手册

🗂 Collection

Lazy loaded image

Name · 名以载道

Lazy loaded image

Quote · 字里行间

🧭 Research

Lazy loaded image

biorxiv 与预印本

🇬🇧 UK Biobank 数据库介绍

🇬🇧 UK Biobank 数据库申请指南

Lazy loaded image

BioRender 使用与订阅笔记

📝 AUCell 流程笔记

🏢 Cohort study VS Case-control

Lazy loaded image

访问和下载 FinnGen GWAS 汇总数据

🏥 Declaration of Helsinki｜赫尔辛基宣言

📘 SOPs

🆕 创建账号 · Google

🌍 生成境外地址

🍎 创建账号 · Apple

🧠 创建账号 · ChatGPT

🚀 科学上网指南：信息时代的通行证

🤖 NFC 卡读取与写入流程

🛠️ Tech

💰 Finance

📗 期权基础：概念、类型与风险

📗 期权交易策略：从单腿到组合

🕟 美股交易时间：盘前、盘中、盘后与隔夜交易

🧩 Concepts

Lazy loaded image

🕊️ 鸽派、鹰派、左派与右派

📈 R & Data Science

Lazy loaded image

R 的 future 包（异步与并行）

Lazy loaded image

R 中加载与使用系统字体

Lazy loaded image

R 中的数据类型完整指南

Lazy loaded image

R 与 RStudio 安装笔记

🔃 purrr 包学习笔记

🔁 apply 家族核心函数

📁 list.files：R 基础文件列举函数

📊 R中excel表格读取

Lazy loaded image

make_date() & make_datetime()：从字段构造时间对象

📦 为什么使用 lubridate？

⏳ ISO 8601 国际时间标准

Lazy loaded image

forcats: 分类变量处理

📏 separate_wider_position()：按固定宽度横向拆分为多列

📐 separate_wider_delim()：按分隔符拆分为多列

🪓 separate_longer_position()：按固定宽度切分为多行

Lazy loaded image

pmin() & pmax()：向量按元素逐位比较

🔢 parse_double() vs parse_number()

Lazy loaded image

geom_tile()：构建热图 / 网格图的砖块图层

🎨 常用美学参数详解：position, fill, alpha 等

Lazy loaded image

facet_wrap() 与 facet_grid() 用法解析

🌳 高亮特定数据子集：多图层叠加法

Lazy loaded image

三种 geom_smooth() 写法解析

🔻 geom_smooth() 的 shape 限制

🎨 ggplot2 颜色映射

Lazy loaded image

ggplot2 的 shape 限制与解决方案

Lazy loaded image

R语言字符串大小写变换

Lazy loaded image

R语言数字取整与格式化。

Lazy loaded image

gtsummary 回归模型

Lazy loaded image

gtsummary + gt：R语言三线表实践

🔁 pivot_wider()：长表转宽表

🔢 parse_number()：提取字符串中的数字

🔁 pivot_longer()：宽表转长表

⚡ .by：轻量级分组操作的新方式

🔓 ungroup()：取消分组结构

✂️ slice()：按位置切片提取行

🧮 group_by()：分组操作的基础

🧭 relocate()：调整列顺序

Lazy loaded image

select()：灵活选择列

📲 mutate()：创建新列与列位置

🔢 count()：快速计数分组频次

Lazy loaded image

distinct(): 去重

🔺 ggplot2 点形状

Lazy loaded image

ggthemr：为 ggplot2 一键换肤

Lazy loaded image

ggthemes 常用主题

🔬 msigdbr 包

📈 CMplot 绘制曼哈顿图

Lazy loaded image

SMR 共定位分析

🧬 coloc R 包实用笔记与数据格式梳理

📊 ggpubr · 让科研图表高效“出版就绪”的R扩展包

🎨 theme_pubr · 出版级 R ggplot2 主题美化指南

✂️ 用 patchwork 优雅组合你的 ggplot2 图表

🔤 R 正则表达式语法与字符串操作速查

📐 R基础数学与统计函数速查

📚 R包管理基础：.libPaths() 与 library()

📦 R工作空间对象管理：ls 与 rm

🔗 R集合归属与反归属运算符：%in% 与 %nin%

🕳️ R缺失值与空值处理（na.omit & evanverse::is_void）

🔎 R字符串匹配 grep 与 grepl 实用技巧

📊 R基础数据结构与分布探索技巧

↕️ R常用向量操作与排序技巧

🔍 R匹配函数 match 的实用技巧

🔗 R字符串拼接 paste/paste0 典型用法

Lazy loaded image

R集合操作与典型用法

Lazy loaded image

R apply函数速查与典型用法

Lazy loaded image

R变量命名规范与覆盖机制

➗ R取余、整除与分批处理技巧

Lazy loaded image

R设置CRAN与Bioconductor镜像速查

Lazy loaded image

R版本升级与包迁移实用指南

Lazy loaded image

R查询当前环境和包信息（sessionInfo）

Lazy loaded image

创建文件夹与目录管理基础

Lazy loaded image

RStudio常用快捷键与界面恢复技巧

Lazy loaded image

提取字符向量子串的实用技巧

Lazy loaded image

高效读取表格与大文件：fread与自定义read_table_flex

Lazy loaded image

foreach包批量循环

Lazy loaded image

R基因ID转换与批量注释

Lazy loaded image

R批量获取和筛选文件名

Lazy loaded image

R常用序列与模拟数据生成

Lazy loaded image

R数据框（df）条件筛选实用技巧

Lazy loaded image

R Visionary - Introduction

🎄 Forestplot in R

📊 Statistics

Lazy loaded image

生存分析 · Survival Analysis

Lazy loaded image

方差分析 · ANOVA

Lazy loaded image

多因素逻辑回归

Lazy loaded image

单因素逻辑回归

Lazy loaded image

R语言中的常见统计分布及其应用

Lazy loaded image

数据分析的可复现性：原则与实践

📂 p值操纵与文件抽屉

Lazy loaded image

如何规范报告统计结果？

Lazy loaded image

相关性检验

Lazy loaded image

多重检验 · Multiple Testing

Lazy loaded image

t 检验 · t-test

Lazy loaded image

置信区间 · Confidence Intervals

Lazy loaded image

卡方检验 · Chi-squared Test

Lazy loaded image

统计功效（Power）与样本量（Sample Size）

Lazy loaded image

假设检验 & p值

Lazy loaded image

频率表、比例表与列联表笔记

🏫 统计学三大学派概览

Lazy loaded image

t-test: Principles and Application in R