Amazon Redshift編~複数クエリ同時実行時パフォーマンス比較(まとめ)~

Pocket

こんにちは!中の人です。

前回までのレシピでは、下記の3回にわたってRedshiftに対して負荷をかけるテストを行って来ました。

Amazon Redshift編~複数クエリ同時実行時パフォーマンス比較(シングル)~
Amazon Redshift編~複数クエリ同時実行時パフォーマンス比較(マルチ)~
Amazon Redshift編~複数クエリ同時実行時パフォーマンス比較(XL vs 8XL)~

今回は、それらの内容のまとめをお話したいと思います。

■ 約8千行(10回平均)に対するクエリ実行
分かりやすくグラフにまとめてみました。

Redshift 8千行への実行結果

棒グラフ:実行時間(秒)
折れ線グラフ:CPU負荷率(%)
となっております。

CPUは8XLが圧倒的に安定していますが、処理速度は件数が少ない場合にはかえってパフォーマンスが落ちることが確認できます。

■ 約60万行(10回平均)に対するクエリ実行

Redshift 60万行への実行結果

棒グラフ:実行時間(秒)
折れ線グラフ:CPU負荷率(%)
となっております。

60万行でもCPUは8XLが圧倒的に安定していますが、ここでも処理によってはXLノードを複数台稼働させる方がパフォーマンスは高い場合もしばしばです。

このように8XLノードのスペックに合わない件数の場合、コストはもちろんですがパフォーマンス面でもXLノードに負けてしまうこともあります。

■ 約4000万行(10回平均)に対するクエリ実行

Redshift 4千万行への実行結果

棒グラフ:実行時間(秒)
折れ線グラフ:CPU負荷率(%)
となっております。

件数が増えてくるとかなり8XLノードのパフォーマンスが生きてきます。
サンプルで用意したものが4000万件でしたが、数億件以上のレコードであればかなり8XLによるメリットが受けられたと思われます。

いかがでしたでしょうか?
データの大きさや処理に合わせて最適なサイズ・台数を揃えることで高いパフォーマンスが得られることがわかります。

次回は『Amazon Redshift編~パフォーマンス比較(MySQL vs Redshift)前編~』と題して、MySQLに同じデータを流し込み、比較してみます。
お楽しみに!

——————————————————————————————————
ナレコムクラウドのFacebookに『いいね!』をクリックして頂くと
最新のお役立ちレシピが配信されます★

┏━━━━━━━━━━━━━┓
┃ナレコムクラウド Facebook┃
┗━━━━━━━━━━━━━┛
——————————————————————————————————