Amazon Athena編～サンプルを試してみる～

投稿日 2017年1月20日
著者 aws-recipe-user
カテゴリーコンピューティング

前回は『Amazon Machine Learning編～別アカウントS3でDatasourcesを試してみる～』と題して、
Amazon Machine Learningで別アカウントS3をDatasuorcesにして試してみました。

今回は『Amazon Athena編～サンプルを試してみる～』と題して、Amazon Athenaでサンプルを試してみたいと思います。

Amazon Athenaとは

Amazon Athena はAmazon S3 内のデータを標準的な SQL を使用して簡単に分析できるサーバーレスクエリサービスで大型データセットをすばやく、簡単に分析できるようになります。

Athena はAmazon S3 にあるデータを指定して、スキーマを定義し、標準的な SQL を使ってデータのクエリを開始する事ができます。
Athenaがクエリを並列化して分散処理してるため多くの場合、数秒で結果が出てきます。
また、エンジンはPresto が使われており、CSV、JSON、ORC、Parquet などのさまざまな標準データフォーマットに対応します。
※PrestoとはFacebookが公開した新しい分散処理基盤

実行したクエリに対してのみ料金が発生します。

AthenaにはサンプルとしてELBのLOGが用意されております。
今回はそれを触ってイメージをつかみたいと思います。

1.試してみる
AthenaのサービスページでDATABASEに「sampledb」を設定してみます。