Amazon EMR編~ElasticMapReduceの使い方パート③~


こんにちは! JQです。

前回は『Amazon EMR編~ElasticMapReduceの使い方パート②~』ということで、実際にJob Flowを立ち上げるところまでをお話しました。 

今回も引き続き、『Amazon EMR編~ElasticMapReduce使い方パート③~』と題して、出力した結果などを確認していきたいと思います。

前回起動したJob FlowのStateを確認

1. まずは前回起動したJobFlowのStateを確認してみます。
「COMPLETED」になっていれば成功です。

20130514_01_01

詳細を確認

2. Descriptionでは設定した内容を確認出来ます。

20130514_01_02

3. StepsではJobFlowがどういうステップで行われたかが確認出来ます。

20130514_01_03

4. Bootstrap Actionsは今回では利用していない為、空になります。

20130514_01_04

5. Instance Groupsでは設定したインスタンスの結果を確認出来ます。
aliveオプションを設定していない為、終了後にTerminateされているのが確認出来ます。

20130514_01_05

6. Monitoringでは各種の数値を確認出来ます。

20130514_01_06

出力データの確認

それでは実際に出力されたデータを確認してみましょう。

7. 出力先に指定したS3のパスにアクセスします。

20130514_01_07

8. 上記の結果ファイルの「Part-xxxx」を右クリックからDownloadを選択して取得します。

20130514_01_08

取得結果をエディタ等で開いてみると次のように言葉を数えた結果になっていれば成功です!
また、“_SUCCESS”のファイルはJobFlowの結果を示すファイルになります。

・part-00000

・part-00001

・part-00002

いかがでしたでしょうか?

次回は『Amazon Redshift編~Redshiftをはじめてみよう!パート①~』ということで、お話していきたいと思います。
お楽しみに!