Amazon Redshift編~複数クエリ同時実行時パフォーマンス比較(XL vs 8XL)~

Pocket

こんにちは!中の人です。

前回までのレシピでは『Amazon Redshift編~複数クエリ同時実行時パフォーマンス比較(シングル)~』『Amazon Redshift編~複数クエリ同時実行時パフォーマンス比較(マルチ)~』ということで、RedshiftのXLノード1~数台に対して様々なSQLを実行してパフォーマンス比較をおこないました。

今回は『Amazon Redshift編~複数クエリ同時実行時パフォーマンス比較(XL vs 8XL)~』と題して、8XLノードに対して複数クエリを同時実行した場合、マシンのスペックによって、どのくらい差が出てくるかパフォーマンス比較をしてみます。

条件は前回のレシピと同じく、以下のテーブルを用意して検索してみました。

・約8千行
・約60万行
・約4000万行

Redshiftは8XL ノードをマルチ構成での検証です。
※8XLにはシングルノードは無いのでマルチのみとなります。

XLと8XLでは時間単価が10倍違います。(2013年6月現在)
8XLはマルチノードのみなので、XLシングルとは20倍料金が異なってきます。パフォーマンスや用途に合わせて使い分ける必要があります。

を実行して比較しております。

なお、接続方式としては、」前回同様PG接続で行なっております。
※マルチ編と同じデータでテストを行なっております。

■ 約8千行(10回平均)
<8XLノード:2台>

同時数1 同時数2 同時数6
平均実行速度(秒) 0.12 0.14 0.49
最高実行速度(秒) 0.1 0.12 0.34
最低実行速度(秒) 0.15 0.29 1.01
CPU負荷(ピーク) 3% 3% 11%

※通常時のCPU負荷率は3%です。

<xlノード:2台>

同時数1 同時数2 同時数6
平均実行速度(秒) 0.10 0.12 0.28
最高実行速度(秒) 0.08 0.09 0.17
最低実行速度(秒) 0.11 0.20 0.41
CPU負荷(ピーク) 11% 43% 71%

※通常時のCPU負荷率は11%です。

■ 約60万行(10回平均)
<8XLノード:2台>

同時数1 同時数2 同時数6
平均実行速度(秒) 0.59 1.06 3.06
最高実行速度(秒) 0.57 1.03 2.69
最低実行速度(秒) 0.61 1.13 3.27
CPU負荷(ピーク) 6% 8% 14%

<xlノード:2台>

同時数1 同時数2 同時数6
平均実行速度(秒) 0.72 1.01 1.91
最高実行速度(秒) 0.58 0.86 1.30
最低実行速度(秒) 0.82 1.18 2.69
CPU負荷(ピーク) 16% 51% 70%

■ 約4000万行(10回平均)
<8XLノード:2台>

同時数1 同時数2 同時数6
平均実行速度(秒) 6.34 8.9 15.21
最高実行速度(秒) 5.48 8.66 13.30
最低実行速度(秒) 6.87 9.62 22.26
CPU負荷(ピーク) 12% 26% 14%

<xlノード>

同時数1 同時数2 同時数 6
平均実行速度(秒) 12.43 17.52 28.82
最高実行速度(秒) 11.64 11.56 17.28
最低実行速度(秒) 16.65 21.67 94.15
CPU負荷(ピーク) 40% 73% 91%

いかがでしたでしょうか?

8XLノードではXLノードと比較すると高いパフォーマンスが発揮されることが確認できました。
特にデータが大きくなるほど傾向が顕著になってきます。

データサイズが大きくなってもそれほどCPU負荷が上がらない事やXLノードと異なりリーダーノードが1番CPU負荷が低くなる事も確認できました。
ただし、データサイズが極端に小さい場合にはXLノードのほうが早くなることもあるので、コスト含めて適切な場所での利用が必要となってきます。

次回は『Amazon Redshift編~複数クエリ同時実行時パフォーマンス比較(まとめ)~』と題して、ノードサイズ等によるパフォーマンス検証結果をグラフ等にまとめます。
お楽しみに!
 

——————————————————————————————————
ナレコムクラウドのFacebookに『いいね!』をクリックして頂くと
最新のお役立ちレシピが配信されます★

┏━━━━━━━━━━━━━┓
┃ナレコムクラウド Facebook┃
┗━━━━━━━━━━━━━┛
——————————————————————————————————