こんにちは!HEROです。
前回はAWSのDBサービスにはどんなものがあるが簡単にご紹介させてただきましたが、今回も各サービスの詳細についてご紹介していきます。
今回はRedshiftについてです。
▼ 前回の記事はこちら
AWSデータベース紹介編~AWSの様々なDBサービス編③~
◯Redshiftって?
前回のおさらいです。
・Amazon Redshift
RedshiftはDWH用フルマネージド・超並列カラムナ型(列思考型)データベースサービスです。
破壊的プロダクトと呼ばれたサービスで従来型の多くのデータウェアハウスソリューションの10分の1以下(!)のコストで利用可能です。
◯DWHとは
ではそもそもDWHとはなんなのか?
DWHとはデータウェアハウスの略で、大量データの中から関連性の分析をするシステムです。
例えば「○○を買った人は○○も一緒に買うことが多い」や「雨の日には○○が売れている」など、各要素間の関連を導きだすことができます。
既存の物理製品ではOracleExadataや、Netezzaなどがあります。
◯Redshiftの特徴
・圧倒的コストパフォーマンス
従来のDWHは年間数千万という単位でコストがかかってしまうところをRedshiftですと初期費無料かつ時間単位で利用することが出来ます。ライセンス費用もかかりません。
もちろんAWSなので必要な時に必要なだけ立ち上げておくことも可能です。
・拡張性
実際にクエリを実行するコンピュートノードは柔軟に変更することができるのでデータ格納領域を用意に拡張することができます。
また数百GBから数PBまで拡張することが出来ます。
これ以外にも、kinesisやEMR、BIツールと組み合わせることでリアルタイム分析や視覚的にも分析結果がわかるなどシナジー効果があります。
◯Redshiftの使い方
データのインポートはkinesisやEMRはもちろん、既存のERPやCRM、業務アプリからも可能です。
対応フォーマットはCSV及びTSVになります。
これらのデータは取り込み用S3に一端保存されます。
つまりS3も必要になってくるわけですね。
データのエクスポートに関してですが既存の BI ツールやMySQL などが利用できます。
またBIツールの接続方式としてはODBC/JDBC/PG接続があげられます。
こちら(Amazon Redshift編~接続方法(ODBC/JDBC/PG接続)別パフォーマンス比較~http://recipe.kc-cloud.jp/archives/2277)の記事で接続法別の比較をしておりますので参考にしてみてください!
◯Redshiftの料金体系
Redshiftはノードのスペックによって料金が変わります。
dw1.xlarge、dw1.8xlarge、dw2.large、dw2.8xlargeの4つのタイプを選択できます。
vCPU | ECU | メモリ(GiB) | ストレージ | I/O | 価格 | |
---|---|---|---|---|---|---|
DW1 | ||||||
dw1.xlarge | 2 | 4.4 | 15 | 2TB HDD | 0.30GB/s | $1.190 /1 時間 |
dw1.8xlarge | 16 | 35 | 120 | 16TB HDD | 2.40GB/s | $9.520 /1 時間 |
DW2 | ||||||
dw2.large | 2 | 7 | 15 | 0.16TB SSD | 0.20GB/s | $0.314 /1 時間 |
dw2.8xlarge | 32 | 104 | 244 | 2.56TB SSD | 3.70GB/s | $6.095 /1 時間 |
dw2ファミリーなら安価にDWHを利用することが可能です!
いかがでしたでしょうか?
次回もお楽しみに!