Browse

Links

Resource

Ctrl+K

Evan の Logbook

🎨 Design

Lazy loaded image

Font · 字体手册

🗂 Collection

Lazy loaded image

Name · 名以载道

Lazy loaded image

Quote · 字里行间

🧭 Research

Lazy loaded image

biorxiv 与预印本

🇬🇧 UK Biobank 数据库介绍

🇬🇧 UK Biobank 数据库申请指南

Lazy loaded image

BioRender 使用与订阅笔记

📝 AUCell 流程笔记

🏢 Cohort study VS Case-control

Lazy loaded image

访问和下载 FinnGen GWAS 汇总数据

🏥 Declaration of Helsinki｜赫尔辛基宣言

📘 SOPs

🆕 创建账号 · Google

🌍 生成境外地址

🍎 创建账号 · Apple

🧠 创建账号 · ChatGPT

🚀 科学上网指南：信息时代的通行证

🤖 NFC 卡读取与写入流程

🛠️ Tech

💰 Finance

📗 期权基础：概念、类型与风险

📗 期权交易策略：从单腿到组合

🕟 美股交易时间：盘前、盘中、盘后与隔夜交易

🧩 Concepts

Lazy loaded image

🕊️ 鸽派、鹰派、左派与右派

📈 R & Data Science

Lazy loaded image

R 的 future 包（异步与并行）

Lazy loaded image

R 中加载与使用系统字体

Lazy loaded image

R 中的数据类型完整指南

Lazy loaded image

R 与 RStudio 安装笔记

🔃 purrr 包学习笔记

🔁 apply 家族核心函数

📁 list.files：R 基础文件列举函数

📊 R中excel表格读取

Lazy loaded image

make_date() & make_datetime()：从字段构造时间对象

📦 为什么使用 lubridate？

⏳ ISO 8601 国际时间标准

Lazy loaded image

forcats: 分类变量处理

📏 separate_wider_position()：按固定宽度横向拆分为多列

📐 separate_wider_delim()：按分隔符拆分为多列

🪓 separate_longer_position()：按固定宽度切分为多行

Lazy loaded image

pmin() & pmax()：向量按元素逐位比较

🔢 parse_double() vs parse_number()

Lazy loaded image

geom_tile()：构建热图 / 网格图的砖块图层

🎨 常用美学参数详解：position, fill, alpha 等

Lazy loaded image

facet_wrap() 与 facet_grid() 用法解析

🌳 高亮特定数据子集：多图层叠加法

Lazy loaded image

三种 geom_smooth() 写法解析

🔻 geom_smooth() 的 shape 限制

🎨 ggplot2 颜色映射

Lazy loaded image

ggplot2 的 shape 限制与解决方案

Lazy loaded image

R语言字符串大小写变换

Lazy loaded image

R语言数字取整与格式化。

Lazy loaded image

gtsummary 回归模型

Lazy loaded image

gtsummary + gt：R语言三线表实践

🔁 pivot_wider()：长表转宽表

🔢 parse_number()：提取字符串中的数字

🔁 pivot_longer()：宽表转长表

⚡ .by：轻量级分组操作的新方式

🔓 ungroup()：取消分组结构

✂️ slice()：按位置切片提取行

🧮 group_by()：分组操作的基础

🧭 relocate()：调整列顺序

Lazy loaded image

select()：灵活选择列

📲 mutate()：创建新列与列位置

🔢 count()：快速计数分组频次

Lazy loaded image

distinct(): 去重

🔺 ggplot2 点形状

Lazy loaded image

ggthemr：为 ggplot2 一键换肤

Lazy loaded image

ggthemes 常用主题

🔬 msigdbr 包

📈 CMplot 绘制曼哈顿图

Lazy loaded image

SMR 共定位分析

🧬 coloc R 包实用笔记与数据格式梳理

📊 ggpubr · 让科研图表高效“出版就绪”的R扩展包

🎨 theme_pubr · 出版级 R ggplot2 主题美化指南

✂️ 用 patchwork 优雅组合你的 ggplot2 图表

🔤 R 正则表达式语法与字符串操作速查

📐 R基础数学与统计函数速查

📚 R包管理基础：.libPaths() 与 library()

📦 R工作空间对象管理：ls 与 rm

🔗 R集合归属与反归属运算符：%in% 与 %nin%

🕳️ R缺失值与空值处理（na.omit & evanverse::is_void）

🔎 R字符串匹配 grep 与 grepl 实用技巧

📊 R基础数据结构与分布探索技巧

↕️ R常用向量操作与排序技巧

🔍 R匹配函数 match 的实用技巧

🔗 R字符串拼接 paste/paste0 典型用法

Lazy loaded image

R集合操作与典型用法

Lazy loaded image

R apply函数速查与典型用法

Lazy loaded image

R变量命名规范与覆盖机制

➗ R取余、整除与分批处理技巧

Lazy loaded image

R设置CRAN与Bioconductor镜像速查

Lazy loaded image

R版本升级与包迁移实用指南

Lazy loaded image

R查询当前环境和包信息（sessionInfo）

Lazy loaded image

创建文件夹与目录管理基础

Lazy loaded image

RStudio常用快捷键与界面恢复技巧

Lazy loaded image

提取字符向量子串的实用技巧

Lazy loaded image

高效读取表格与大文件：fread与自定义read_table_flex

Lazy loaded image

foreach包批量循环

Lazy loaded image

R基因ID转换与批量注释

Lazy loaded image

R批量获取和筛选文件名

Lazy loaded image

R常用序列与模拟数据生成

Lazy loaded image

R数据框（df）条件筛选实用技巧

Lazy loaded image

R Visionary - Introduction

🎄 Forestplot in R

📊 Statistics

Lazy loaded image

生存分析 · Survival Analysis

Lazy loaded image

方差分析 · ANOVA

Lazy loaded image

多因素逻辑回归

Lazy loaded image

单因素逻辑回归

Lazy loaded image

R语言中的常见统计分布及其应用

Lazy loaded image

数据分析的可复现性：原则与实践

📂 p值操纵与文件抽屉

Lazy loaded image

如何规范报告统计结果？

Lazy loaded image

相关性检验

Lazy loaded image

多重检验 · Multiple Testing

Lazy loaded image

t 检验 · t-test

Lazy loaded image

置信区间 · Confidence Intervals

Lazy loaded image

卡方检验 · Chi-squared Test

Lazy loaded image

统计功效（Power）与样本量（Sample Size）

Lazy loaded image

假设检验 & p值

Lazy loaded image

频率表、比例表与列联表笔记

🏫 统计学三大学派概览

Lazy loaded image

t-test: Principles and Application in R

高效读取表格与大文件：fread与自定义read_table_flex

type

Post

status

Published

date

Jul 24, 2025

slug

r-table-read-flex

summary

R中用fread及自定义read_table_flex灵活高效读取表格文件，包括分隔符自动识别、压缩兼容和CLI友好提示。

tags

R

数据读取

evanverse

category

📈 R & Data Science

icon

password

comment

Show

生信和数据分析中，经常需要高效读取各种格式（csv/tsv/txt/gz等）的超大表格。这里总结两种方法：主流的data.table::fread，以及自定义的read_table_flex()，后者兼容更多场景、自动分隔符、友好CLI反馈。

1. 用data.table::fread高效读取大文件

支持csv/tsv/txt/gz等常见表格

手动设定sep适应不同分隔符

适合大文件/批量读取/高并发分析

2. 自定义evanverse::read_table_flex自动适配

安装与载入

函数介绍

read_table_flex() 是我自己封装的高适配度表格读取函数，支持自动识别分隔符，可直接读.csv/.tsv/.txt/.gz等压缩或普通文件，并集成CLI友好提示。

主要参数

file_path: 文件路径，支持压缩格式

sep: 可手动指定分隔符，否则自动根据扩展名判断

encoding: 文件编码，默认为"UTF-8"

header: 是否有表头

verbose: 是否显示详细CLI提示

典型用法

优势：无需手动指定分隔符，文件名一改直接兼容。压缩/多格式支持更好，CLI提示友好，批量分析和脚本流程都很稳健。

3. 典型应用场景

生信/转录组/GWAS等大文件批量读取

多格式/多来源表格（csv/tsv/txt/gz）自动导入分析

自动化数据管道/流程/定制化脚本

4. 易错与补充

fread默认data.table对象，如需和dplyr/传统代码兼容可设data.table=FALSE

read_table_flex适配常见扩展名（.csv/.tsv/.txt/.gz），其它新格式可扩展自定义

批量导入建议搭配list.files等批处理函数

本页长期补充fread与自定义批量读取脚本的经验和踩坑点。

提取字符向量子串的实用技巧

foreach包批量循环

Loading...

Catalog

Last update: 2025-07-24

Article List

Evan の Logbook

🎨 Design

Lazy loaded image

Font · 字体手册

🗂 Collection

Lazy loaded image

Name · 名以载道

Lazy loaded image

Quote · 字里行间

🧭 Research

Lazy loaded image

biorxiv 与预印本

🇬🇧 UK Biobank 数据库介绍

🇬🇧 UK Biobank 数据库申请指南

Lazy loaded image

BioRender 使用与订阅笔记

📝 AUCell 流程笔记

🏢 Cohort study VS Case-control

Lazy loaded image

访问和下载 FinnGen GWAS 汇总数据

🏥 Declaration of Helsinki｜赫尔辛基宣言

📘 SOPs

🆕 创建账号 · Google

🌍 生成境外地址

🍎 创建账号 · Apple

🧠 创建账号 · ChatGPT

🚀 科学上网指南：信息时代的通行证

🤖 NFC 卡读取与写入流程

🛠️ Tech

💰 Finance

📗 期权基础：概念、类型与风险

📗 期权交易策略：从单腿到组合

🕟 美股交易时间：盘前、盘中、盘后与隔夜交易

🧩 Concepts

Lazy loaded image

🕊️ 鸽派、鹰派、左派与右派

📈 R & Data Science

Lazy loaded image

R 的 future 包（异步与并行）

Lazy loaded image

R 中加载与使用系统字体

Lazy loaded image

R 中的数据类型完整指南

Lazy loaded image

R 与 RStudio 安装笔记

🔃 purrr 包学习笔记

🔁 apply 家族核心函数

📁 list.files：R 基础文件列举函数

📊 R中excel表格读取

Lazy loaded image

make_date() & make_datetime()：从字段构造时间对象

📦 为什么使用 lubridate？

⏳ ISO 8601 国际时间标准

Lazy loaded image

forcats: 分类变量处理

📏 separate_wider_position()：按固定宽度横向拆分为多列

📐 separate_wider_delim()：按分隔符拆分为多列

🪓 separate_longer_position()：按固定宽度切分为多行

Lazy loaded image

pmin() & pmax()：向量按元素逐位比较

🔢 parse_double() vs parse_number()

Lazy loaded image

geom_tile()：构建热图 / 网格图的砖块图层

🎨 常用美学参数详解：position, fill, alpha 等

Lazy loaded image

facet_wrap() 与 facet_grid() 用法解析

🌳 高亮特定数据子集：多图层叠加法

Lazy loaded image

三种 geom_smooth() 写法解析

🔻 geom_smooth() 的 shape 限制

🎨 ggplot2 颜色映射

Lazy loaded image

ggplot2 的 shape 限制与解决方案

Lazy loaded image

R语言字符串大小写变换

Lazy loaded image

R语言数字取整与格式化。

Lazy loaded image

gtsummary 回归模型

Lazy loaded image

gtsummary + gt：R语言三线表实践

🔁 pivot_wider()：长表转宽表

🔢 parse_number()：提取字符串中的数字

🔁 pivot_longer()：宽表转长表

⚡ .by：轻量级分组操作的新方式

🔓 ungroup()：取消分组结构

✂️ slice()：按位置切片提取行

🧮 group_by()：分组操作的基础

🧭 relocate()：调整列顺序

Lazy loaded image

select()：灵活选择列

📲 mutate()：创建新列与列位置

🔢 count()：快速计数分组频次

Lazy loaded image

distinct(): 去重

🔺 ggplot2 点形状

Lazy loaded image

ggthemr：为 ggplot2 一键换肤

Lazy loaded image

ggthemes 常用主题

🔬 msigdbr 包

📈 CMplot 绘制曼哈顿图

Lazy loaded image

SMR 共定位分析

🧬 coloc R 包实用笔记与数据格式梳理

📊 ggpubr · 让科研图表高效“出版就绪”的R扩展包

🎨 theme_pubr · 出版级 R ggplot2 主题美化指南

✂️ 用 patchwork 优雅组合你的 ggplot2 图表

🔤 R 正则表达式语法与字符串操作速查

📐 R基础数学与统计函数速查

📚 R包管理基础：.libPaths() 与 library()

📦 R工作空间对象管理：ls 与 rm

🔗 R集合归属与反归属运算符：%in% 与 %nin%

🕳️ R缺失值与空值处理（na.omit & evanverse::is_void）

🔎 R字符串匹配 grep 与 grepl 实用技巧

📊 R基础数据结构与分布探索技巧

↕️ R常用向量操作与排序技巧

🔍 R匹配函数 match 的实用技巧

🔗 R字符串拼接 paste/paste0 典型用法

Lazy loaded image

R集合操作与典型用法

Lazy loaded image

R apply函数速查与典型用法

Lazy loaded image

R变量命名规范与覆盖机制

➗ R取余、整除与分批处理技巧

Lazy loaded image

R设置CRAN与Bioconductor镜像速查

Lazy loaded image

R版本升级与包迁移实用指南

Lazy loaded image

R查询当前环境和包信息（sessionInfo）

Lazy loaded image

创建文件夹与目录管理基础

Lazy loaded image

RStudio常用快捷键与界面恢复技巧

Lazy loaded image

提取字符向量子串的实用技巧

Lazy loaded image

高效读取表格与大文件：fread与自定义read_table_flex

Lazy loaded image

foreach包批量循环

Lazy loaded image

R基因ID转换与批量注释

Lazy loaded image

R批量获取和筛选文件名

Lazy loaded image

R常用序列与模拟数据生成

Lazy loaded image

R数据框（df）条件筛选实用技巧

Lazy loaded image

R Visionary - Introduction

🎄 Forestplot in R

📊 Statistics

Lazy loaded image

生存分析 · Survival Analysis

Lazy loaded image

方差分析 · ANOVA

Lazy loaded image

多因素逻辑回归

Lazy loaded image

单因素逻辑回归

Lazy loaded image

R语言中的常见统计分布及其应用

Lazy loaded image

数据分析的可复现性：原则与实践

📂 p值操纵与文件抽屉

Lazy loaded image

如何规范报告统计结果？

Lazy loaded image

相关性检验

Lazy loaded image

多重检验 · Multiple Testing

Lazy loaded image

t 检验 · t-test

Lazy loaded image

置信区间 · Confidence Intervals

Lazy loaded image

卡方检验 · Chi-squared Test

Lazy loaded image

统计功效（Power）与样本量（Sample Size）

Lazy loaded image

假设检验 & p值

Lazy loaded image

频率表、比例表与列联表笔记

🏫 统计学三大学派概览

Lazy loaded image

t-test: Principles and Application in R