8 Webからのデータ取得(1)「e-Stat API」
オープンデータとは以下の性質を持つデータ、あるいはその普及を目指す考え方のことを言います。
- インターネット経由でダウンロードできる
- 再利用と再配布ができる
- 誰でも利用できる
- 使いやすく、変更可能な形式である
近年、この考え方に基づいて、様々なデータがインターネット上に公開されるようになりました。一方で、「使いやすく、変更可能な形式」という点においては、十分でないものも多いです。例えば、印刷されたデータをスキャンしたPDFファイルであれば、そのデータを利用したい場合には、利用者がエクセルなどに入力する必要があります。それがWordやExcelから変換されたものであったとしても、データ部分を抽出するには手間がかかってしまいます。一方、政府の統計データを公開しているe-Statにおいては、多くのエクセルファイルなどをダウンロードできるようになっていますが、印刷することを意識したレイアウトになっているものが多く、Rのデータフレームとして取り込むためには、無駄な部分を取り除いたり、列名を調整したりするなどの処理を手動で行う必要があります。
このような問題を解決できるのがApplication Programing Inteface(API)と呼ばれる仕組みです。APIを利用すると、あるプログラムやソフトウェア(ここでは、e-Statのデータを取得するためのプログラム)を外部のプログラム(ここではR)から呼び出して利用することができます。特に、利用したいプログラムやソフトウェアをインターネット経由で利用できるようになっている場合、そのAPIをWeb APIと呼ぶこともあります。APIを使うことで、例えば
- 独自のTwitterアプリを開発
- 独自のLINEのchatbotを開発
- TwitterデータをRで直接取得
- e-StatのデータをRで直接取得
などのことができるようになります。