t-test: Principles and Application in R

type

status

date

slug

summary

1. 背景与简介

在日常科研、医学分析或数据挖掘中，我们经常会遇到这样的问题：

两组数据之间的均值差异是否具有统计学意义？

例如：

比较两种治疗方式对患者某项指标的影响

比较药物干预前后血压的变化

比较不同组之间的基因表达水平是否有显著差异

在这类场景中，t 检验（t-test） 是最经典也最常用的方法之一。

t 检验由英国统计学家 William Sealy Gosset（笔名 Student）于 1908 年提出，旨在解决小样本条件下的均值推断问题。当总体标准差未知、样本较小、数据近似服从正态分布时，t 检验提供了一种合理的统计推断方式。

在 R 语言中，我们可以使用内置函数 t.test() 快速执行各类 t 检验，也可结合 ggpubr、rstatix 等 tidyverse 风格的包完成更加整洁、可视化的统计分析。

2. t 检验的类型

类型	适用场景
单样本 t 检验	比较一个样本均值是否与某个理论值有差异
独立样本 t 检验	比较两个独立组之间的均值差异
配对样本 t 检验	比较同一样本在两个时间点或条件下的均值（如干预前后）

3. 使用前提

在进行 t 检验之前，应确认以下假设条件是否成立：

数据是连续型变量（interval 或 ratio 类型）

数据近似服从正态分布（可以使用 shapiro.test() 检查）

样本之间独立（独立样本）或一一对应（配对样本）

若为独立样本 t 检验，默认使用 Welch 检验（方差不齐）；若假设方差齐，可加 var.equal = TRUE

4. R 中执行 t 检验

4.1 示例数据

4.2 独立样本 t 检验

4.3 配对样本 t 检验

4.4 单样本 t 检验

4.5 使用 rstatix 进行 t 检验（推荐 tidyverse 风格）

5. 基于内置数据集的完整 t 检验示例

本节将基于 R 的内置数据集 ToothGrowth，展示一个标准的独立样本 t 检验流程，涵盖：

数据加载与预处理

使用 rstatix 进行 t 检验

提取关键信息

可视化结果（ggpubr）

保存统计分析结果

5.1 数据集简介

ToothGrowth 是 R 自带的数据集，记录了维生素 C 对豚鼠牙齿长度的影响，包含以下变量：

变量	含义
`len`	牙齿增长长度
`supp`	给药方式（VC：维生素 C、OJ：橙汁）
`dose`	剂量（数值型：0.5、1、2）

使用 glimpse() 查看结构：

我们将从中筛选出 剂量为 0.5 的数据，比较 VC 与 OJ 两种给药方式在该剂量下的效果差异。

5.2 数据预处理

5.3 进行独立样本 t 检验

查看结果：

5.4 提取关键信息

你也可以访问 ttest_result$p、ttest_result$p.signif 等字段作为后续报告输入。

5.5 可视化结果（添加显著性标注）

该图会自动标注 p 值，并展示两组差异的显著性。

5.6 保存分析结果

5.7 小结

通过 ToothGrowth 数据集的实战演示，我们完成了一个标准的独立样本 t 检验流程：

使用 glimpse() 快速了解数据结构

筛选指定子集并处理分组变量

通过 rstatix::t_test() 完成统计检验并提取结果

使用 ggpubr 进行可视化并居中展示显著性差异

最后将分析结果保存为 .csv 和 .rds 以便复用

这一流程非常适合作为日常科研或项目数据分析中的可复用模板。

6. 延伸建议

为了进一步扩展分析能力，建议考虑以下方向：

多组比较（ANOVA）：当处理组数量 ≥ 3 时，使用 anova_test() 替代 t 检验，并结合事后检验（如 Tukey HSD）

配对样本分析：若同一对象在两个条件下重复测量，可使用 t.test(..., paired = TRUE) 或 rstatix::t_test(..., paired = TRUE)

非参数检验：当正态性假设不满足时，可使用 wilcox_test() 替代

多重检验校正：若有多组比较，使用 adjust_pvalue() 方法进行 p 值校正（如 FDR、Bonferroni）

报告整合：可将分析结果和图表整合到 R Markdown / Quarto / Logbook 报告中，便于输出归档

7. 总结

t 检验 是统计分析中最常用、最基础但也最实用的差异检验工具之一。掌握其原理的同时，构建一套清晰、标准化的分析流程至关重要。

在本篇笔记中，我们通过：

回顾基本理论与使用前提

学习基础用法（t.test()）与 tidyverse 风格（rstatix）

结合实际数据完成一个标准流程（数据探索 → t 检验 → 可视化 → 保存结果）

恢复 Win11 右键菜单为 Win10 经典样式

统计建模的三大学派：频率学派、贝叶斯学派与机器学