6.4 ヒストグラムと箱ひげ図

1つの量的変数の分布をみる場合はヒストグラムを使います。ggplot2では、geom_hist()関数を用います。mpgデータで高速道路の燃費hwyの分布をみる場合は以下のようにします。

ggplot(mpg, aes(hwy)) +
  geom_histogram(binwidth = 2)

binwidthは階級幅になります。指定しない場合は自動で設定されますが、警告表示が出力されます。

質的変数のカテゴリごとの量的変数の分布を見たい場合は、箱ひげ図を使います。ggplot2では、geom_boxplot()関数を使います。mpgデータで、classごとのhwyの分布をみる場合は以下のようにします。

ggplot(mpg, aes(class, hwy)) +
  geom_boxplot()