Evan の Logbook
✨ Updates
🎨 Style Guide
🧠 Creative Resources
🗒️ Mind Notes
🧭 Knowbase
📘 SOPs
🩺 Medical Research
🛠️ Tech Chronicles
💰 Fortune Blueprint
📈 R Visionary
📊 Statistics
🖼️ BioVis
提取字符向量子串的实用技巧
type
status
date
slug
summary
tags
category
icon
password
comment
在处理标签、ID、样本名、文件名等字符串时,常需要批量提取某一段字符(子串/substring)。R有基础和tidyverse两套常用方法。
1. 基础R:substring()
- 起止均为正整数,下标从1开始,区间为闭区间
2. stringr::str_sub()(更灵活,支持负数)
- 支持负数下标,-1代表倒数第1位
- 向量化兼容性更好,推荐复杂批量场景优先用
3. 常见应用场景
- 批量截取ID/条形码/日期(如只保留前6位或后4位)
- 处理批量文件名/样本标签重命名
- 提取生信分析中的染色体/位点/批次编号
4. 易错与tips
- substring只支持正下标,str_sub支持负下标
- str_sub向量化更优,复杂字符串建议优先用
- 两者都支持向量输入,自动recycle参数
5. 典型例子对比
Prev
RStudio常用快捷键与界面恢复技巧
Next
高效读取表格与大文件:fread与自定义read_table_flex
Loading...
YouTube 使用笔记