こんにちは!中の人です。
前回までのレシピでは、下記の3回にわたってRedshiftに対して負荷をかけるテストを行って来ました。
■Amazon Redshift編~複数クエリ同時実行時パフォーマンス比較(シングル)~
■Amazon Redshift編~複数クエリ同時実行時パフォーマンス比較(マルチ)~
■Amazon Redshift編~複数クエリ同時実行時パフォーマンス比較(XL vs 8XL)~
今回は、それらの内容のまとめをお話したいと思います。
■ 約8千行(10回平均)に対するクエリ実行
分かりやすくグラフにまとめてみました。
棒グラフ:実行時間(秒)
折れ線グラフ:CPU負荷率(%)
となっております。
CPUは8XLが圧倒的に安定していますが、処理速度は件数が少ない場合にはかえってパフォーマンスが落ちることが確認できます。
■ 約60万行(10回平均)に対するクエリ実行
棒グラフ:実行時間(秒)
折れ線グラフ:CPU負荷率(%)
となっております。
60万行でもCPUは8XLが圧倒的に安定していますが、ここでも処理によってはXLノードを複数台稼働させる方がパフォーマンスは高い場合もしばしばです。
このように8XLノードのスペックに合わない件数の場合、コストはもちろんですがパフォーマンス面でもXLノードに負けてしまうこともあります。
■ 約4000万行(10回平均)に対するクエリ実行
棒グラフ:実行時間(秒)
折れ線グラフ:CPU負荷率(%)
となっております。
件数が増えてくるとかなり8XLノードのパフォーマンスが生きてきます。
サンプルで用意したものが4000万件でしたが、数億件以上のレコードであればかなり8XLによるメリットが受けられたと思われます。
いかがでしたでしょうか?
データの大きさや処理に合わせて最適なサイズ・台数を揃えることで高いパフォーマンスが得られることがわかります。
次回は『Amazon Redshift編~パフォーマンス比較(MySQL vs Redshift)前編~』と題して、MySQLに同じデータを流し込み、比較してみます。
お楽しみに!
——————————————————————————————————
ナレコムクラウドのFacebookに『いいね!』をクリックして頂くと
最新のお役立ちレシピが配信されます★
┏━━━━━━━━━━━━━┓
┃ナレコムクラウド Facebook┃
┗━━━━━━━━━━━━━┛
——————————————————————————————————