Lazy loaded image频率表、比例表与列联表

type
status
date
slug
summary
tags
category
icon
password
comment
在统计分析的基础阶段,我们经常需要对单个变量的分布、不同变量之间的联合分布进行汇总与可视化。常用方法包括频率表、比例表和列联表。

1. 频率表(Frequency Table)

概念说明
频率表用于汇总单个分类变量的分布。它包含该变量所有可能取值,以及每个值在数据中出现的次数(频率)或出现的比例(百分比)。
species
n
%
Adelie
152
44%
Chinstrap
68
20%
Gentoo
124
36%
R 代码示例
扩展工具
ivo.table 包和 gtsummary 包都可以生成更美观、功能丰富的频率表和比例表。
参数补充
  • 更换配色和字体:
    • 长表格式(适合变量水平较多时):

      2. 列联表(Contingency Table / Cross-Tabulation)

      概念说明
      列联表用于同时展示两个或多个分类变量之间的联合分布关系,也称为交叉表、交联表。
      常用于探索变量之间是否有关联(如卡方检验)。
      species
      Biscoe
      Dream
      Torgersen
      Adelie
      44
      56
      52
      Chinstrap
      0
      68
      0
      Gentoo
      124
      0
      0
      R 代码示例
      三元、四元交联表
      species
      island
      male
      female
      missing
      Adelie
      Biscoe
      20
      24
      0
      Adelie
      Dream
      28
      28
      0
      Adelie
      Torgersen
      26
      26
      0
      Chinstrap
      Dream
      34
      34
      0
      Gentoo
      Biscoe
      60
      64
      0
      多维交联表可用于展示三个及以上分类变量的联合分布。
      gtsummary 三元交联表

      总结

      • 频率表/比例表适用于单变量分布描述
      • 列联表/交联表适用于多变量联合分布和相关性探索
      • ivo.tablegtsummary 包可大幅提升表格美观性和功能性
      • 多维交联表适合复杂分类数据的可视化与分析
       
      Prev
      假设检验 & p值
      Next
      统计建模的三大学派:频率学派、贝叶斯学派与机器学
      Loading...
      Article List
      Evan の Logbook
      ✨ Updates
      🎨 Style Guide
      🧠 Creative Resources
      🗒️ Mind Notes
      🧭 Knowbase
      📘 SOPs
      🩺 Medical Research
      🛠️ Tech Chronicles
      💰 Fortune Blueprint
      📈 R Visionary
      📊 Statistics
      🖼️ BioVis