3.2 tidyverse

tidyverseとは、tidy data(整然データ、整理データ)を軸としたデータサイエンスプロジェクトのためのパッケージ群です。tidyverseをインストールすると多くのパッケージがインストールされますが、主要なパッケージとしては以下のようなものになります。

  • dplyr : データの操作に関する一貫した文法を持つ関数を提供する
  • ggplot2Grammer of Graphics(グラフィックスの文法)に基づいて統計グラフを出力するための関数を提供する
  • tidyr:tidy dataを得るために必要な関数を提供する
  • readr:長方形のデータ(csvtsvfwfなど)を高速に読み込むための関数を提供する
  • purr:Rにおける関数型プログラミング環境を提供する
  • tibble:データフレームを拡張したクラスを提供する
  • stringr:文字列処理を簡単に実行するための関数を提供する
  • forcats:因子型を効率的に処理するための関数を提供する

これらのパッケージが提供する関数は

library(tidyverse)

とすることで、一括して直接利用できるようになります。