※本記事は以前のものをリニューアルした記事になります。
こんにちは!Tamaです!
前回は「Renewal! Amazon EMR編~ElasticMapReduceの使い方パート①~」と題してEMRを使用するための準備を行いました。
今回は実際にEMRの立ち上げを行います。
クラスターの立ち上げ
クラスターの設定を行います。
ログ記録 | 作成したS3バケットのlogフォルダのパスを選択します |
起動モード | ステップ実行 |
ステップタイプ | ストリーミングプログラム |
インスタンスタイプ | m1.medium(サンプルプログラムのため今回は最小を選択) |
上記以外はデフォルトにしました。
選択後、ステップ追加の「設定」をクリックし処理の設定を行います。
名前 | 任意 |
マッパー | s3://emr-knowcom-test/wordSplitter.py |
リデューサー | aggregate |
S3の場所の入力 | s3://emr-knowcom-test/input/ |
S3の場所の出力 | s3://emr-knowcom-test/output/ |
ステップの追加が完了後「クラスターの作成」をクリックします。
以上でクラスターの作成と処理の設定が出来ました!
今回は以上になります!
お疲れさまでした!
次回は実行した結果を見ていきたいと思います。
[Renewal! Amazon EMR編~ElasticMapReduceの使い方パート③~]
次回記事:Renewal! Amazon EMR編~ElasticMapReduceの使い方パート③~
またお会いしましょう!