リニューアル! Amazon EMR編~ElasticMapReduceの使い方パート②~


※本記事は以前のものをリニューアルした記事になります。

こんにちは!Tamaです!

前回は「Renewal! Amazon EMR編~ElasticMapReduceの使い方パート①~」と題してEMRを使用するための準備を行いました。
今回は実際にEMRの立ち上げを行います。

クラスターの立ち上げ

クラスターの設定を行います。

ログ記録 作成したS3バケットのlogフォルダのパスを選択します
起動モード ステップ実行
ステップタイプ ストリーミングプログラム
インスタンスタイプ m1.medium(サンプルプログラムのため今回は最小を選択)

上記以外はデフォルトにしました。

選択後、ステップ追加の「設定」をクリックし処理の設定を行います。

名前 任意
マッパー s3://emr-knowcom-test/wordSplitter.py
リデューサー aggregate
S3の場所の入力 s3://emr-knowcom-test/input/
S3の場所の出力 s3://emr-knowcom-test/output/

ステップの追加が完了後「クラスターの作成」をクリックします。

以上でクラスターの作成と処理の設定が出来ました!

今回は以上になります!
お疲れさまでした!

次回は実行した結果を見ていきたいと思います。
[Renewal! Amazon EMR編~ElasticMapReduceの使い方パート③~]

次回記事:Renewal! Amazon EMR編~ElasticMapReduceの使い方パート③~

またお会いしましょう!