Lazy loaded image提取字符向量子串的实用技巧

type
status
date
slug
summary
tags
category
icon
password
comment
在处理标签、ID、样本名、文件名等字符串时,常需要批量提取某一段字符(子串/substring)。R有基础和tidyverse两套常用方法。

1. 基础R:substring()

  • 起止均为正整数,下标从1开始,区间为闭区间

2. stringr::str_sub()(更灵活,支持负数)

  • 支持负数下标,-1代表倒数第1位
  • 向量化兼容性更好,推荐复杂批量场景优先用

3. 常见应用场景

  • 批量截取ID/条形码/日期(如只保留前6位或后4位)
  • 处理批量文件名/样本标签重命名
  • 提取生信分析中的染色体/位点/批次编号

4. 易错与tips

  • substring只支持正下标,str_sub支持负下标
  • str_sub向量化更优,复杂字符串建议优先用
  • 两者都支持向量输入,自动recycle参数

5. 典型例子对比

Prev
RStudio常用快捷键与界面恢复技巧
Next
高效读取表格与大文件:fread与自定义read_table_flex
Loading...
Article List
Evan の Logbook
✨ Updates
🎨 Style Guide
🧠 Creative Resources
🗒️ Mind Notes
🧭 Knowbase
📘 SOPs
🩺 Medical Research
🛠️ Tech Chronicles
💰 Fortune Blueprint
📈 R Visionary
📊 Statistics
🖼️ BioVis