SageMakerを利用した、kerasによるMNISTの3層ニューラルネットワーク解析

Pocket

はじめに

本稿では Udemy の 【4日で体験しよう!】 TensorFlow, Keras, Python 3 で学ぶディープラーニング体験講座 の内容を参考に記事を作成しました。
記事を2つに分けて投稿します。
その1 : SageMaker での環境構築と keras による MNIST の3層ニューラルネットワーク解析 ←(本稿)
その2 : keras による fashion MNIST の3層ニューラルネットワークとCNN(畳み込みニューラルネットワーク)解析
※ Udemy では Anaconda を使用してますが、自分は Amazon SageMaker を使用しました。
※環境構築についても Amazon SageMaker を使用した手順を記載します。

前提

AWS のアカウントを用意します。
※AWSアカウント作成の流れはこちら

環境構築と準備

Amazon SageMaker でノートブックインスタンスを作成し、Jupyter を開きます。
・AWS にログインし、Amazon SageMaker を検索。

・左の一覧からノートブックインスタンスを選択。

・右上のノートブックインスタンスの作成を選択。

・ノートブックインスタンス名を入力(インスタンス名は任意)

下にスライドして、上の赤枠の部分を選択して、新しいロールの作成を選択。

・任意の S3 バケットを選択し、ロールの作成を選択します。
※今回は任意の S3 バケットを選択していますが、実際に運用する際は適切な IAM ロールを設定して下さい。

・赤枠のように表示されたら IAM ロールの作成は成功です。

・下にスライドして、ノートブックインスタンスの作成を選択。

・画像上部の赤枠のように表示されたらノートブックインスタンスの作成は完了です。
ステータスが「 Pending 」 → 「 InService 」 になるまで待ちます。

・ステータスが InService になったら、開く Jupyter を選択して Jupyter を開きます。

・Jupyter が開けたら、この後ダウンロードしたデータを保存するフォルダを作成します。
Newを選択。

・一覧から conda_tensorflow_p36 を選択して、ノートブックを作成してください。

・ノートブックが開けたら、ノートブックの名前を変更しておきます。Untitled を選択。

好きな名前を付けて、rename を選択。

・これで準備完了です。

MNISTとは

手書き数字画像60,000枚と、テスト画像10,000枚を集めた、画像データセットです。
さらに、手書きの数字「0〜9」に正解ラベルが与えられるデータセットでもあり、画像分類問題で人気の高いデータセットです。

3層のニューラルネットワーク解析

先ほど作成したノートブック上でコードを書いていきます。

モジュールのインポートと設定
・keras : オープンソースニューラルネットワークライブラリ
・matplotlib : グラフ描画ライブラリ

MNISTデータのダウンロード

データの確認
・MNISTの画像は28×28の二次元配列になっています。
・各要素は0~255の値を取っていて、色が黒に近いほうが数が大きくなります。

実行結果

・x_train に60000個の画像データがあることを確認します。

実行結果

・試しに画像を10個表示してみます。

実行結果

データの加工
0~255の数を訓練向けに0~1の値に変換するために、各要素を255で割ります。

ニューラルネットワークの層を定義
2次元の入力データを1次元に変換する。
512個のノードに全結合する。活性化関数には relu を使用。
20%の入力をドロップアウト(無視する)。
10個のノードに全結合する。活性化関数には softmax を使用。

ニューラルネットワークの訓練課程の設定
・最適化手法は Adam を使用。
・損失関数は sparse_categorical_crossentropy を使用。
・metrics に accuracy を設定することで、評価を記録するようにします。

モデルの作成
train データを使用して、モデルの作成を行います。
epoch は訓練データを繰り返し学習する回数を指定します。
バッチサイズは未設定で32となります。

実行経過

精度の確認
・test データを使用して、モデルの精度を確認します。

実行結果

・精度は98.1%という、非常に高い数値が得られました。

予測値から結果を確認
・実際の予測値から予測があっているか確認します。

実行結果

実行結果

・x_test[0] の予測値に注目すると、およそ99%の確率で7であると予測されています。
・正解ラベルを確認すると、y_test[0] が7であることから、予測ができていることがわかります。

おわりに

今回は MNIST データを使用して、3層ニューラルネットワークで解析を行いました。
次の その2 では MNISTより解析の難しい fashion MNIST データの解析を3層ニューラルネットワークとCNN(畳み込みニューラルネットワーク)で行います。