Browse

Links

Resource

Ctrl+K

Evan の Logbook

🎨 Design

Lazy loaded image

Font · 字体手册

🗂 Collection

Lazy loaded image

Name · 名以载道

Lazy loaded image

Quote · 字里行间

🧭 Research

Lazy loaded image

biorxiv 与预印本

🇬🇧 UK Biobank 数据库介绍

🇬🇧 UK Biobank 数据库申请指南

Lazy loaded image

BioRender 使用与订阅笔记

📝 AUCell 流程笔记

🏢 Cohort study VS Case-control

Lazy loaded image

访问和下载 FinnGen GWAS 汇总数据

🏥 Declaration of Helsinki｜赫尔辛基宣言

📘 SOPs

🆕 创建账号 · Google

🌍 生成境外地址

🍎 创建账号 · Apple

🧠 创建账号 · ChatGPT

🚀 科学上网指南：信息时代的通行证

🤖 NFC 卡读取与写入流程

🛠️ Tech

💰 Finance

📗 期权基础：概念、类型与风险

📗 期权交易策略：从单腿到组合

🕟 美股交易时间：盘前、盘中、盘后与隔夜交易

🧩 Concepts

Lazy loaded image

🕊️ 鸽派、鹰派、左派与右派

📈 R & Data Science

Lazy loaded image

R 的 future 包（异步与并行）

Lazy loaded image

R 中加载与使用系统字体

Lazy loaded image

R 中的数据类型完整指南

Lazy loaded image

R 与 RStudio 安装笔记

🔃 purrr 包学习笔记

🔁 apply 家族核心函数

📁 list.files：R 基础文件列举函数

📊 R中excel表格读取

Lazy loaded image

make_date() & make_datetime()：从字段构造时间对象

📦 为什么使用 lubridate？

⏳ ISO 8601 国际时间标准

Lazy loaded image

forcats: 分类变量处理

📏 separate_wider_position()：按固定宽度横向拆分为多列

📐 separate_wider_delim()：按分隔符拆分为多列

🪓 separate_longer_position()：按固定宽度切分为多行

Lazy loaded image

pmin() & pmax()：向量按元素逐位比较

🔢 parse_double() vs parse_number()

Lazy loaded image

geom_tile()：构建热图 / 网格图的砖块图层

🎨 常用美学参数详解：position, fill, alpha 等

Lazy loaded image

facet_wrap() 与 facet_grid() 用法解析

🌳 高亮特定数据子集：多图层叠加法

Lazy loaded image

三种 geom_smooth() 写法解析

🔻 geom_smooth() 的 shape 限制

🎨 ggplot2 颜色映射

Lazy loaded image

ggplot2 的 shape 限制与解决方案

Lazy loaded image

R语言字符串大小写变换

Lazy loaded image

R语言数字取整与格式化。

Lazy loaded image

gtsummary 回归模型

Lazy loaded image

gtsummary + gt：R语言三线表实践

🔁 pivot_wider()：长表转宽表

🔢 parse_number()：提取字符串中的数字

🔁 pivot_longer()：宽表转长表

⚡ .by：轻量级分组操作的新方式

🔓 ungroup()：取消分组结构

✂️ slice()：按位置切片提取行

🧮 group_by()：分组操作的基础

🧭 relocate()：调整列顺序

Lazy loaded image

select()：灵活选择列

📲 mutate()：创建新列与列位置

🔢 count()：快速计数分组频次

Lazy loaded image

distinct(): 去重

🔺 ggplot2 点形状

Lazy loaded image

ggthemr：为 ggplot2 一键换肤

Lazy loaded image

ggthemes 常用主题

🔬 msigdbr 包

📈 CMplot 绘制曼哈顿图

Lazy loaded image

SMR 共定位分析

🧬 coloc R 包实用笔记与数据格式梳理

📊 ggpubr · 让科研图表高效“出版就绪”的R扩展包

🎨 theme_pubr · 出版级 R ggplot2 主题美化指南

✂️ 用 patchwork 优雅组合你的 ggplot2 图表

🔤 R 正则表达式语法与字符串操作速查

📐 R基础数学与统计函数速查

📚 R包管理基础：.libPaths() 与 library()

📦 R工作空间对象管理：ls 与 rm

🔗 R集合归属与反归属运算符：%in% 与 %nin%

🕳️ R缺失值与空值处理（na.omit & evanverse::is_void）

🔎 R字符串匹配 grep 与 grepl 实用技巧

📊 R基础数据结构与分布探索技巧

↕️ R常用向量操作与排序技巧

🔍 R匹配函数 match 的实用技巧

🔗 R字符串拼接 paste/paste0 典型用法

Lazy loaded image

R集合操作与典型用法

Lazy loaded image

R apply函数速查与典型用法

Lazy loaded image

R变量命名规范与覆盖机制

➗ R取余、整除与分批处理技巧

Lazy loaded image

R设置CRAN与Bioconductor镜像速查

Lazy loaded image

R版本升级与包迁移实用指南

Lazy loaded image

R查询当前环境和包信息（sessionInfo）

Lazy loaded image

创建文件夹与目录管理基础

Lazy loaded image

RStudio常用快捷键与界面恢复技巧

Lazy loaded image

提取字符向量子串的实用技巧

Lazy loaded image

高效读取表格与大文件：fread与自定义read_table_flex

Lazy loaded image

foreach包批量循环

Lazy loaded image

R基因ID转换与批量注释

Lazy loaded image

R批量获取和筛选文件名

Lazy loaded image

R常用序列与模拟数据生成

Lazy loaded image

R数据框（df）条件筛选实用技巧

Lazy loaded image

R Visionary - Introduction

🎄 Forestplot in R

📊 Statistics

Lazy loaded image

生存分析 · Survival Analysis

Lazy loaded image

方差分析 · ANOVA

Lazy loaded image

多因素逻辑回归

Lazy loaded image

单因素逻辑回归

Lazy loaded image

R语言中的常见统计分布及其应用

Lazy loaded image

数据分析的可复现性：原则与实践

📂 p值操纵与文件抽屉

Lazy loaded image

如何规范报告统计结果？

Lazy loaded image

相关性检验

Lazy loaded image

多重检验 · Multiple Testing

Lazy loaded image

t 检验 · t-test

Lazy loaded image

置信区间 · Confidence Intervals

Lazy loaded image

卡方检验 · Chi-squared Test

Lazy loaded image

统计功效（Power）与样本量（Sample Size）

Lazy loaded image

假设检验 & p值

Lazy loaded image

频率表、比例表与列联表笔记

🏫 统计学三大学派概览

Lazy loaded image

t-test: Principles and Application in R

forcats: 分类变量处理

type

Post

status

Published

date

Aug 12, 2025

slug

forcats

summary

介绍 forcats 包的核心用途与常用函数，包括因子的排序、重命名、合并、删除、频率排序等操作，并配合示例展示其在 tidyverse 中的便利性。

tags

forcats

R

category

📈 R & Data Science

icon

password

comment

Show

在 R 中，factor 是表示分类变量（categorical variable）的基础数据类型。

虽然 factor() 可以创建因子，但在实际数据分析中，我们经常需要对因子进行：

排序（改变绘图或分析的顺序）

重命名（让类别标签更直观）

合并（减少稀有类别）

删除（去掉未使用的 levels）

重新编码（方便分析与可视化）

原生 R 语法可以完成这些任务，但通常较繁琐且可读性差。

forcats 是 tidyverse 生态中的因子处理工具包，它提供了一套以 fct_ 开头的函数，语义清晰、风格统一、可与 dplyr、ggplot2 无缝配合。

📦 核心函数速查表

函数名	用途说明	常见场景
`fct_inorder()`	按因子首次出现顺序创建 levels	保留原始顺序绘图
`fct_infreq()`	按频率降序排列 levels	条形图按频率排序
`fct_relevel()`	手动调整因子水平顺序	把关键类别放前面
`fct_rev()`	反转 levels 顺序	翻转坐标轴显示
`fct_drop()`	删除未使用的 levels	清理多余类别
`fct_lump()`	聚合低频因子为 `"Other"`	压缩稀有类别
`fct_recode()`	重命名 levels（类似 `rename()`）	改标签
`fct_collapse()`	多个 levels 合并为一个新组	归类
`fct_count()`	统计每个 level 频数（类似 `count()`）	快速检查类别分布
`fct_match()`	检查因子是否包含特定水平	数据验证

✨ 详细使用场景与示例

1️⃣ 创建分类变量

fct_inorder() 会根据数据首次出现的顺序来设定 levels，非常适合保留原始顺序绘图。

2️⃣ 重排序水平

重排序对 ggplot2 特别重要，可直接影响 x 轴或 y 轴类别的排列。

3️⃣ 按频率排序（常用于绘图）

频率高的类别会排在前面，绘制条形图时非常直观。

4️⃣ 聚合低频类别

n 可以指定保留的类别数量，或者用 prop 保留占比。

5️⃣ 删除未使用的 levels

清理数据后很实用，避免无意义的空类别干扰分析。

6️⃣ 重命名 & 合并组别

fct_recode() 适合简单重命名，fct_collapse() 则适合大规模合并。

💡 总结

forcats 让因子处理更直观、可读性高、代码更短。

与 dplyr 和 ggplot2 配合时，特别适合用在 mutate() 或绘图的美学映射中。

如果你在做分类变量的整理、排序、清理、合并，forcats 是必备工具。

ISO 8601 国际时间标准

separate_wider_position()：按固定宽度横向拆分为多列

Loading...

Catalog

Last update: 2025-08-12

Article List

Evan の Logbook

🎨 Design

Lazy loaded image

Font · 字体手册

🗂 Collection

Lazy loaded image

Name · 名以载道

Lazy loaded image

Quote · 字里行间

🧭 Research

Lazy loaded image

biorxiv 与预印本

🇬🇧 UK Biobank 数据库介绍

🇬🇧 UK Biobank 数据库申请指南

Lazy loaded image

BioRender 使用与订阅笔记

📝 AUCell 流程笔记

🏢 Cohort study VS Case-control

Lazy loaded image

访问和下载 FinnGen GWAS 汇总数据

🏥 Declaration of Helsinki｜赫尔辛基宣言

📘 SOPs

🆕 创建账号 · Google

🌍 生成境外地址

🍎 创建账号 · Apple

🧠 创建账号 · ChatGPT

🚀 科学上网指南：信息时代的通行证

🤖 NFC 卡读取与写入流程

🛠️ Tech

💰 Finance

📗 期权基础：概念、类型与风险

📗 期权交易策略：从单腿到组合

🕟 美股交易时间：盘前、盘中、盘后与隔夜交易

🧩 Concepts

Lazy loaded image

🕊️ 鸽派、鹰派、左派与右派

📈 R & Data Science

Lazy loaded image

R 的 future 包（异步与并行）

Lazy loaded image

R 中加载与使用系统字体

Lazy loaded image

R 中的数据类型完整指南

Lazy loaded image

R 与 RStudio 安装笔记

🔃 purrr 包学习笔记

🔁 apply 家族核心函数

📁 list.files：R 基础文件列举函数

📊 R中excel表格读取

Lazy loaded image

make_date() & make_datetime()：从字段构造时间对象

📦 为什么使用 lubridate？

⏳ ISO 8601 国际时间标准

Lazy loaded image

forcats: 分类变量处理

📏 separate_wider_position()：按固定宽度横向拆分为多列

📐 separate_wider_delim()：按分隔符拆分为多列

🪓 separate_longer_position()：按固定宽度切分为多行

Lazy loaded image

pmin() & pmax()：向量按元素逐位比较

🔢 parse_double() vs parse_number()

Lazy loaded image

geom_tile()：构建热图 / 网格图的砖块图层

🎨 常用美学参数详解：position, fill, alpha 等

Lazy loaded image

facet_wrap() 与 facet_grid() 用法解析

🌳 高亮特定数据子集：多图层叠加法

Lazy loaded image

三种 geom_smooth() 写法解析

🔻 geom_smooth() 的 shape 限制

🎨 ggplot2 颜色映射

Lazy loaded image

ggplot2 的 shape 限制与解决方案

Lazy loaded image

R语言字符串大小写变换

Lazy loaded image

R语言数字取整与格式化。

Lazy loaded image

gtsummary 回归模型

Lazy loaded image

gtsummary + gt：R语言三线表实践

🔁 pivot_wider()：长表转宽表

🔢 parse_number()：提取字符串中的数字

🔁 pivot_longer()：宽表转长表

⚡ .by：轻量级分组操作的新方式

🔓 ungroup()：取消分组结构

✂️ slice()：按位置切片提取行

🧮 group_by()：分组操作的基础

🧭 relocate()：调整列顺序

Lazy loaded image

select()：灵活选择列

📲 mutate()：创建新列与列位置

🔢 count()：快速计数分组频次

Lazy loaded image

distinct(): 去重

🔺 ggplot2 点形状

Lazy loaded image

ggthemr：为 ggplot2 一键换肤

Lazy loaded image

ggthemes 常用主题

🔬 msigdbr 包

📈 CMplot 绘制曼哈顿图

Lazy loaded image

SMR 共定位分析

🧬 coloc R 包实用笔记与数据格式梳理

📊 ggpubr · 让科研图表高效“出版就绪”的R扩展包

🎨 theme_pubr · 出版级 R ggplot2 主题美化指南

✂️ 用 patchwork 优雅组合你的 ggplot2 图表

🔤 R 正则表达式语法与字符串操作速查

📐 R基础数学与统计函数速查

📚 R包管理基础：.libPaths() 与 library()

📦 R工作空间对象管理：ls 与 rm

🔗 R集合归属与反归属运算符：%in% 与 %nin%

🕳️ R缺失值与空值处理（na.omit & evanverse::is_void）

🔎 R字符串匹配 grep 与 grepl 实用技巧

📊 R基础数据结构与分布探索技巧

↕️ R常用向量操作与排序技巧

🔍 R匹配函数 match 的实用技巧

🔗 R字符串拼接 paste/paste0 典型用法

Lazy loaded image

R集合操作与典型用法

Lazy loaded image

R apply函数速查与典型用法

Lazy loaded image

R变量命名规范与覆盖机制

➗ R取余、整除与分批处理技巧

Lazy loaded image

R设置CRAN与Bioconductor镜像速查

Lazy loaded image

R版本升级与包迁移实用指南

Lazy loaded image

R查询当前环境和包信息（sessionInfo）

Lazy loaded image

创建文件夹与目录管理基础

Lazy loaded image

RStudio常用快捷键与界面恢复技巧

Lazy loaded image

提取字符向量子串的实用技巧

Lazy loaded image

高效读取表格与大文件：fread与自定义read_table_flex

Lazy loaded image

foreach包批量循环

Lazy loaded image

R基因ID转换与批量注释

Lazy loaded image

R批量获取和筛选文件名

Lazy loaded image

R常用序列与模拟数据生成

Lazy loaded image

R数据框（df）条件筛选实用技巧

Lazy loaded image

R Visionary - Introduction

🎄 Forestplot in R

📊 Statistics

Lazy loaded image

生存分析 · Survival Analysis

Lazy loaded image

方差分析 · ANOVA

Lazy loaded image

多因素逻辑回归

Lazy loaded image

单因素逻辑回归

Lazy loaded image

R语言中的常见统计分布及其应用

Lazy loaded image

数据分析的可复现性：原则与实践

📂 p值操纵与文件抽屉

Lazy loaded image

如何规范报告统计结果？

Lazy loaded image

相关性检验

Lazy loaded image

多重检验 · Multiple Testing

Lazy loaded image

t 检验 · t-test

Lazy loaded image

置信区间 · Confidence Intervals

Lazy loaded image

卡方检验 · Chi-squared Test

Lazy loaded image

统计功效（Power）与样本量（Sample Size）

Lazy loaded image

假设检验 & p值

Lazy loaded image

频率表、比例表与列联表笔记

🏫 统计学三大学派概览

Lazy loaded image

t-test: Principles and Application in R