HOME > 画像分類(初級)-1(MNIST) > 画像分類(初級)-2(MNIST)

04.02 画像分類(初級)-2(MNIST)

④ 学習条件の設定
CONFIG画面をクリックし開きます。左蘭中の「Global Config」クリックして条件を設定します。
専門的に勉強されっる方は下記の専門書内容を参考に変更しますが、初心者のGGEはこのままでいきます。





⑤学習の実行
では!いよいよPCに”9”の字を学習させてみましょう。
右側「Training」と書かれた下の「▷」をクリックしてみましょう。




すると一瞬で下記のような図が出てきます。
ちょっと覚えたい用語として「エポック(epoch)」があります。このエポック数は学習を実施した回数を示し、横軸エポック数は学習を試みた回数となります。縦軸は難しく言うと学習と評価値の誤差関数値、要するに間違った比率で100%で全て間違っているということになります。






⑥ 評価する
次に「EVALUATION」をクリックし画面を開き、”▷”をクリックし終了するまで待ちます。



最初の画像はDATASET画面、下はEVALUATION画面です。
Pythonだと非常に時間がかかり直接的画像が無い分何をおこなっているか分かりやすいのですが、分かりやすく言うと前者は試験前の演習問題にあたり、エポック数というのは演習問題に向かった回数を指します。従って沢山当たった場合には正解率はよく、少しの場合正解率は悪いということになります。EVALUATIONは期末テストのようにDATASETとは違った試験用のDATASETが用意されていて、これに対し学んだ知識によって分類を行います。その結果を表示しているのです。



もう一つ注目していただきたいのは、「Training左の縦直線を左へ移動」してもらうと、「y’」という項目が登場します。これなんっでしょう?
テレビドラマで沢口靖子が科研で例えば指紋照合の時に数字が出てきて「99.99」とか出ると、”これで決まり! あいつが犯人よ!”ってなことになる時の「99.99」はパーセント表記ですが、下の場合は499番目は”44.396%”で”9”と認定、500番目は”92.63%”で”9”だと認定したということになります。人が見ても同じように499番目は”9”らしいけど、500番目はほぼ確実に”9”だと判断できます。要するに人が判断するのと同じように判断できるようになったといえるのです。



次に「Confusion Matrix」に変更すると、下記のような表が出てきます。これは最終的評価の際にどのように分類したかのデータを表示しています。前にもやったように”y9”というのは入力値で”9”かどうかを指し”1”は”9”の場合、”0”はそれ以外ですから、表の結果は

    y9=0    : 入力が”9”以外
    y9=1    : 入力が”9”の場合
    y’=0    : 入力が”9”以外
    y’=1    : 入力が”9”の場合

”Recall”は結果で、239 ÷ (239 + 11) = 0.956 という計算式で比率が出ています。
”Recall”は”再現率”、”Precision”は”適合率”として表現されています。



余りにもパッとやったので、有難みがありませんが500件のサンプルデータを見せて学習した結果、同じように500件の試験データ中の「9」を見分ける正解率が約95%になったのは、この処理速度にしては驚異的だと思われます。




【参考文献】
リックテレコム 足立悠著
ソニー開発のNeural Network Console入門

オライリー・ジャパン 斎藤 康毅著
ゼロから作るDeep Learning ――Pythonで学ぶディープラーニングの理論と実装

HOME > 画像分類(初級)-1(MNIST) > 画像分類(初級)-2(MNIST)