6.4 ヒストグラムと箱ひげ図
1つの量的変数の分布をみる場合はヒストグラムを使います。ggplot2では、geom_hist()
関数を用います。mpg
データで高速道路の燃費hwy
の分布をみる場合は以下のようにします。
ggplot(mpg, aes(hwy)) +
geom_histogram(binwidth = 2)
binwidth
は階級幅になります。指定しない場合は自動で設定されますが、警告表示が出力されます。
質的変数のカテゴリごとの量的変数の分布を見たい場合は、箱ひげ図を使います。ggplot2では、geom_boxplot()
関数を使います。mpg
データで、class
ごとのhwy
の分布をみる場合は以下のようにします。
ggplot(mpg, aes(class, hwy)) +
geom_boxplot()