Browse

Links

Resource

Ctrl+K

Evan の Logbook

🎨 Design

Lazy loaded image

Font · 字体手册

🗂 Collection

Lazy loaded image

Name · 名以载道

Lazy loaded image

Quote · 字里行间

🧭 Research

Lazy loaded image

biorxiv 与预印本

🇬🇧 UK Biobank 数据库介绍

🇬🇧 UK Biobank 数据库申请指南

Lazy loaded image

BioRender 使用与订阅笔记

📝 AUCell 流程笔记

🏢 Cohort study VS Case-control

Lazy loaded image

访问和下载 FinnGen GWAS 汇总数据

🏥 Declaration of Helsinki｜赫尔辛基宣言

📘 SOPs

🆕 创建账号 · Google

🌍 生成境外地址

🍎 创建账号 · Apple

🧠 创建账号 · ChatGPT

🚀 科学上网指南：信息时代的通行证

🤖 NFC 卡读取与写入流程

🛠️ Tech

💰 Finance

📗 期权基础：概念、类型与风险

📗 期权交易策略：从单腿到组合

🕟 美股交易时间：盘前、盘中、盘后与隔夜交易

🧩 Concepts

Lazy loaded image

🕊️ 鸽派、鹰派、左派与右派

📈 R & Data Science

Lazy loaded image

R 的 future 包（异步与并行）

Lazy loaded image

R 中加载与使用系统字体

Lazy loaded image

R 中的数据类型完整指南

Lazy loaded image

R 与 RStudio 安装笔记

🔃 purrr 包学习笔记

🔁 apply 家族核心函数

📁 list.files：R 基础文件列举函数

📊 R中excel表格读取

Lazy loaded image

make_date() & make_datetime()：从字段构造时间对象

📦 为什么使用 lubridate？

⏳ ISO 8601 国际时间标准

Lazy loaded image

forcats: 分类变量处理

📏 separate_wider_position()：按固定宽度横向拆分为多列

📐 separate_wider_delim()：按分隔符拆分为多列

🪓 separate_longer_position()：按固定宽度切分为多行

Lazy loaded image

pmin() & pmax()：向量按元素逐位比较

🔢 parse_double() vs parse_number()

Lazy loaded image

geom_tile()：构建热图 / 网格图的砖块图层

🎨 常用美学参数详解：position, fill, alpha 等

Lazy loaded image

facet_wrap() 与 facet_grid() 用法解析

🌳 高亮特定数据子集：多图层叠加法

Lazy loaded image

三种 geom_smooth() 写法解析

🔻 geom_smooth() 的 shape 限制

🎨 ggplot2 颜色映射

Lazy loaded image

ggplot2 的 shape 限制与解决方案

Lazy loaded image

R语言字符串大小写变换

Lazy loaded image

R语言数字取整与格式化。

Lazy loaded image

gtsummary 回归模型

Lazy loaded image

gtsummary + gt：R语言三线表实践

🔁 pivot_wider()：长表转宽表

🔢 parse_number()：提取字符串中的数字

🔁 pivot_longer()：宽表转长表

⚡ .by：轻量级分组操作的新方式

🔓 ungroup()：取消分组结构

✂️ slice()：按位置切片提取行

🧮 group_by()：分组操作的基础

🧭 relocate()：调整列顺序

Lazy loaded image

select()：灵活选择列

📲 mutate()：创建新列与列位置

🔢 count()：快速计数分组频次

Lazy loaded image

distinct(): 去重

🔺 ggplot2 点形状

Lazy loaded image

ggthemr：为 ggplot2 一键换肤

Lazy loaded image

ggthemes 常用主题

🔬 msigdbr 包

📈 CMplot 绘制曼哈顿图

Lazy loaded image

SMR 共定位分析

🧬 coloc R 包实用笔记与数据格式梳理

📊 ggpubr · 让科研图表高效“出版就绪”的R扩展包

🎨 theme_pubr · 出版级 R ggplot2 主题美化指南

✂️ 用 patchwork 优雅组合你的 ggplot2 图表

🔤 R 正则表达式语法与字符串操作速查

📐 R基础数学与统计函数速查

📚 R包管理基础：.libPaths() 与 library()

📦 R工作空间对象管理：ls 与 rm

🔗 R集合归属与反归属运算符：%in% 与 %nin%

🕳️ R缺失值与空值处理（na.omit & evanverse::is_void）

🔎 R字符串匹配 grep 与 grepl 实用技巧

📊 R基础数据结构与分布探索技巧

↕️ R常用向量操作与排序技巧

🔍 R匹配函数 match 的实用技巧

🔗 R字符串拼接 paste/paste0 典型用法

Lazy loaded image

R集合操作与典型用法

Lazy loaded image

R apply函数速查与典型用法

Lazy loaded image

R变量命名规范与覆盖机制

➗ R取余、整除与分批处理技巧

Lazy loaded image

R设置CRAN与Bioconductor镜像速查

Lazy loaded image

R版本升级与包迁移实用指南

Lazy loaded image

R查询当前环境和包信息（sessionInfo）

Lazy loaded image

创建文件夹与目录管理基础

Lazy loaded image

RStudio常用快捷键与界面恢复技巧

Lazy loaded image

提取字符向量子串的实用技巧

Lazy loaded image

高效读取表格与大文件：fread与自定义read_table_flex

Lazy loaded image

foreach包批量循环

Lazy loaded image

R基因ID转换与批量注释

Lazy loaded image

R批量获取和筛选文件名

Lazy loaded image

R常用序列与模拟数据生成

Lazy loaded image

R数据框（df）条件筛选实用技巧

Lazy loaded image

R Visionary - Introduction

🎄 Forestplot in R

📊 Statistics

Lazy loaded image

生存分析 · Survival Analysis

Lazy loaded image

方差分析 · ANOVA

Lazy loaded image

多因素逻辑回归

Lazy loaded image

单因素逻辑回归

Lazy loaded image

R语言中的常见统计分布及其应用

Lazy loaded image

数据分析的可复现性：原则与实践

📂 p值操纵与文件抽屉

Lazy loaded image

如何规范报告统计结果？

Lazy loaded image

相关性检验

Lazy loaded image

多重检验 · Multiple Testing

Lazy loaded image

t 检验 · t-test

Lazy loaded image

置信区间 · Confidence Intervals

Lazy loaded image

卡方检验 · Chi-squared Test

Lazy loaded image

统计功效（Power）与样本量（Sample Size）

Lazy loaded image

假设检验 & p值

Lazy loaded image

频率表、比例表与列联表笔记

🏫 统计学三大学派概览

Lazy loaded image

t-test: Principles and Application in R

🔢parse_number()：提取字符串中的数字

type

Post

status

Published

date

Jul 25, 2025

slug

readr-parse-number

summary

使用 `readr::parse_number()` 从混合文字中快速提取数值，支持不同地区格式、带单位字符串与百分比清洗。

tags

R

readr

数据清洗

category

📈 R & Data Science

icon

password

comment

Show

parse_number() 是 readr 包中用于从混合文本中解析数值的便捷函数。它会忽略非数字字符（如单位、货币符号、百分号等），并将提取出的数字转换为双精度数值（double）。

1. 函数原型

参数	说明
`x`	要解析的字符向量（`character`）
`locale`	本地化设置，可控制小数点符号、千分位分隔符、货币符号等（`readr::default_locale()`）
`...`	其他传递给底层解析器的参数

2. 基本示例

3. 场景演示

3.1 带单位的数据

3.2 清洗价格或金额

3.3 处理百分比

4. 批量清洗示例

配合 dplyr::mutate() 和 across()，一次处理多列：

5. 小贴士

自动忽略所有前后非数字字符，保留纯数字及小数点。

字符串中无数字时返回 NA。

若要处理带分组千分位（如 1,234）或欧式小数格式（1.234,56），需调整 locale：

对百分比除以 100，可写作 parse_number(x) / 100。

对于复杂的格式（如负号、括号表示负值），可结合正则预处理或后续 sign() 调整。

总结
parse_number() 在清洗带有单位、符号或千分位分隔符的字符数据时极其高效，配合 dplyr 管道可快速完成批量数值提取，是日常数据预处理的必备武器。

pivot_wider()：长表转宽表

pivot_longer()：宽表转长表

Loading...

Catalog

Last update: 2025-07-25

Article List

Evan の Logbook

🎨 Design

Lazy loaded image

Font · 字体手册

🗂 Collection

Lazy loaded image

Name · 名以载道

Lazy loaded image

Quote · 字里行间

🧭 Research

Lazy loaded image

biorxiv 与预印本

🇬🇧 UK Biobank 数据库介绍

🇬🇧 UK Biobank 数据库申请指南

Lazy loaded image

BioRender 使用与订阅笔记

📝 AUCell 流程笔记

🏢 Cohort study VS Case-control

Lazy loaded image

访问和下载 FinnGen GWAS 汇总数据

🏥 Declaration of Helsinki｜赫尔辛基宣言

📘 SOPs

🆕 创建账号 · Google

🌍 生成境外地址

🍎 创建账号 · Apple

🧠 创建账号 · ChatGPT

🚀 科学上网指南：信息时代的通行证

🤖 NFC 卡读取与写入流程

🛠️ Tech

💰 Finance

📗 期权基础：概念、类型与风险

📗 期权交易策略：从单腿到组合

🕟 美股交易时间：盘前、盘中、盘后与隔夜交易

🧩 Concepts

Lazy loaded image

🕊️ 鸽派、鹰派、左派与右派

📈 R & Data Science

Lazy loaded image

R 的 future 包（异步与并行）

Lazy loaded image

R 中加载与使用系统字体

Lazy loaded image

R 中的数据类型完整指南

Lazy loaded image

R 与 RStudio 安装笔记

🔃 purrr 包学习笔记

🔁 apply 家族核心函数

📁 list.files：R 基础文件列举函数

📊 R中excel表格读取

Lazy loaded image

make_date() & make_datetime()：从字段构造时间对象

📦 为什么使用 lubridate？

⏳ ISO 8601 国际时间标准

Lazy loaded image

forcats: 分类变量处理

📏 separate_wider_position()：按固定宽度横向拆分为多列

📐 separate_wider_delim()：按分隔符拆分为多列

🪓 separate_longer_position()：按固定宽度切分为多行

Lazy loaded image

pmin() & pmax()：向量按元素逐位比较

🔢 parse_double() vs parse_number()

Lazy loaded image

geom_tile()：构建热图 / 网格图的砖块图层

🎨 常用美学参数详解：position, fill, alpha 等

Lazy loaded image

facet_wrap() 与 facet_grid() 用法解析

🌳 高亮特定数据子集：多图层叠加法

Lazy loaded image

三种 geom_smooth() 写法解析

🔻 geom_smooth() 的 shape 限制

🎨 ggplot2 颜色映射

Lazy loaded image

ggplot2 的 shape 限制与解决方案

Lazy loaded image

R语言字符串大小写变换

Lazy loaded image

R语言数字取整与格式化。

Lazy loaded image

gtsummary 回归模型

Lazy loaded image

gtsummary + gt：R语言三线表实践

🔁 pivot_wider()：长表转宽表

🔢 parse_number()：提取字符串中的数字

🔁 pivot_longer()：宽表转长表

⚡ .by：轻量级分组操作的新方式

🔓 ungroup()：取消分组结构

✂️ slice()：按位置切片提取行

🧮 group_by()：分组操作的基础

🧭 relocate()：调整列顺序

Lazy loaded image

select()：灵活选择列

📲 mutate()：创建新列与列位置

🔢 count()：快速计数分组频次

Lazy loaded image

distinct(): 去重

🔺 ggplot2 点形状

Lazy loaded image

ggthemr：为 ggplot2 一键换肤

Lazy loaded image

ggthemes 常用主题

🔬 msigdbr 包

📈 CMplot 绘制曼哈顿图

Lazy loaded image

SMR 共定位分析

🧬 coloc R 包实用笔记与数据格式梳理

📊 ggpubr · 让科研图表高效“出版就绪”的R扩展包

🎨 theme_pubr · 出版级 R ggplot2 主题美化指南

✂️ 用 patchwork 优雅组合你的 ggplot2 图表

🔤 R 正则表达式语法与字符串操作速查

📐 R基础数学与统计函数速查

📚 R包管理基础：.libPaths() 与 library()

📦 R工作空间对象管理：ls 与 rm

🔗 R集合归属与反归属运算符：%in% 与 %nin%

🕳️ R缺失值与空值处理（na.omit & evanverse::is_void）

🔎 R字符串匹配 grep 与 grepl 实用技巧

📊 R基础数据结构与分布探索技巧

↕️ R常用向量操作与排序技巧

🔍 R匹配函数 match 的实用技巧

🔗 R字符串拼接 paste/paste0 典型用法

Lazy loaded image

R集合操作与典型用法

Lazy loaded image

R apply函数速查与典型用法

Lazy loaded image

R变量命名规范与覆盖机制

➗ R取余、整除与分批处理技巧

Lazy loaded image

R设置CRAN与Bioconductor镜像速查

Lazy loaded image

R版本升级与包迁移实用指南

Lazy loaded image

R查询当前环境和包信息（sessionInfo）

Lazy loaded image

创建文件夹与目录管理基础

Lazy loaded image

RStudio常用快捷键与界面恢复技巧

Lazy loaded image

提取字符向量子串的实用技巧

Lazy loaded image

高效读取表格与大文件：fread与自定义read_table_flex

Lazy loaded image

foreach包批量循环

Lazy loaded image

R基因ID转换与批量注释

Lazy loaded image

R批量获取和筛选文件名

Lazy loaded image

R常用序列与模拟数据生成

Lazy loaded image

R数据框（df）条件筛选实用技巧

Lazy loaded image

R Visionary - Introduction

🎄 Forestplot in R

📊 Statistics

Lazy loaded image

生存分析 · Survival Analysis

Lazy loaded image

方差分析 · ANOVA

Lazy loaded image

多因素逻辑回归

Lazy loaded image

单因素逻辑回归

Lazy loaded image

R语言中的常见统计分布及其应用

Lazy loaded image

数据分析的可复现性：原则与实践

📂 p值操纵与文件抽屉

Lazy loaded image

如何规范报告统计结果？

Lazy loaded image

相关性检验

Lazy loaded image

多重检验 · Multiple Testing

Lazy loaded image

t 检验 · t-test

Lazy loaded image

置信区间 · Confidence Intervals

Lazy loaded image

卡方检验 · Chi-squared Test

Lazy loaded image

统计功效（Power）与样本量（Sample Size）

Lazy loaded image

假设检验 & p值

Lazy loaded image

频率表、比例表与列联表笔记

🏫 统计学三大学派概览

Lazy loaded image

t-test: Principles and Application in R