Rによるデータ解析入門
1 Rの基礎(データ構造とデータ型)
ここでは、データは数値や文字の集まりであると考えます。Rで標準的に利用できるデータの格納方法(データ構造)は以下の4つです。
- ベクトル(vector)
- 配列・行列(array, matrix)
- リスト(list)
- データフレーム(data frame)
基本はベクトルであり、それ以外のデータ構造はベクトルの拡張として定義されます(後述)。一方、個々のデータそのものの種類をデータ型と呼び、Rでは主に以下の3つを利用します。
- 論理型(logical)
- 整数型 (integer)
- 倍精度小数点型(実数型)(double)
- 文字型(character)
また、厳密にはデータ型ではない(クラス:属性(後述)などを利用して拡張したデータ構造のようなもの)ですが、データ型のような感覚で利用できるものに因子型(factor)があります。これは、ベクトルに付加する情報(属性など)を使って定義されるもので、他のプログラミング言語にはない、統計解析環境であるRならではの概念になっています。