Neural Network Consoleによる画像教師データの作り方

こんにちは。管理人のピヨ猫でーす。

前回の記事でFXの機械学習の教師データを作成する方法を紹介しました。
今回は作成した教師データを機械学習ツールのSONY Neural Network Consoleに取り込む方法を紹介します。

syuuai.hatenablog.com

 

1.SONY Neural Network Consoleってなーに?

SONY Neural Network Consoleってなーに?

f:id:shibayu2002:20190302113110p:plain

SONY Neural Network ConsoleはSONYが無償で提供する機械学習の統合開発環境(IDE)です。詳しくはこちら。

syuuai.hatenablog.com

機械学習の開発ツールと言えばGoogleのTensorFlowやKerasが有名ですが、簡単に初心者が機械学習をするうえでSONY Neural Network Consoleは視覚的で使い易いので筆者はSONY Neural Network Consoleも好きです。

2.機械学習で使う画像データの注意点

機械学習で使う画像データには何点か注意点があります。

  • 全ての画像データのサイズが同じであること
  • 画像データのサイズが小さいこと(28×28 ~ 128×128程度であること)
  • 画像データがモノクロまたはRGBカラーであること

まず、全ての画像データのサイズが同じであることが原則です。
これはSONY Neural Network Consoleに限らず言えることで、ニューラルネットワークの仕組み上、入力データの次元(サイズ)は同じ必要があります。
サイズに決まりはありませんが、あまり大きすぎる画像だと学習に時間がかかりすぎるので、推奨サイズは28×28 ~ 128×128程度となります。

画像データの色にはモノクロやRGB(3色カラー)、RGBA(3色カラー+透明度)という表し方があり、一般的な画像データはRGBAとなりますが、これだとサイズが大きくなるのでモノクロかRGBを使うのが機械学習ではお勧めです。なお、SONY Neural Network ConsoleではモノクロかRGB(3色カラー)しか扱えません。
 

3.SONY neural network consoleのDataset作成機能

前述の様に機械学習で使う画像は、全画像ファイルを同じサイズにする必要があります。ファイルサイズも28×28 ~ 128×128程度に縮小が必要です。
これを手でやるのは大変ですね。
なので、SONY neural network consoleには全画像ファイルを同じサイズに縮小してくれる便利な機能があります。

筆者は初めそれを知らずに手作業で画像ファイルを整形していました(笑)
すぐにこれ無理だよーとなり、調べていたら便利な機能があることに気づきました。
何だよ。あるじゃん(当たり前か・・・(;^_^A)

【手順】

  1. メニューバーよりDATASET → Open dataset → Create Datasetを選択する

    SONY neural network consoleのDataset作成機能

  2. 画像の変換方法を指定してApplyボタンを押下する

    SONY neural network consoleのDataset作成機能

    タイトル 説明 設定例
    Source Dir 変換元画像ファイルの格納ディレクトリ D:\tmp\ai\dataset_org
    Output Dir 変換後の画像ファイルの格納ディレクトリ D:\tmp\ai\dataset
    Shaping Mode

    アスペクト比を合わせる方法
    Trimming:画像の端を切り取る
    Padding:画像の端に 0を挿入する
    Resize:リサイズする

    Resize
    Output Color Ch 出力画像のカラー
    1(モノクロ)
    3(RGB カラー)
    3(RGB)
    Output Height 出力画像の縦幅 128
    Output Width 出力画像の横幅 128
    Shuffle the order of the data データの順序をシャッフルします(デフォルトでON) ON
    Output File1 - File Name - 作成する教師データセットCSV のファイル名 train.csv
    Output File1 - Ratio (%) - Source Dirで指定した画像ファイルから何%を教師データにするかの比率。 95 (※)
    Output File2 - File Name - 作成するテストデータセットCSV のファイル名 test.csv
    Output File2 - Ratio (%) - Source Dirで指定した画像ファイルから何%をテストデータにするかの比率。 5 (※)

    ※ Output File1とOutput File2のRatioの合計は100になる様に設定する。

これだけです。簡単ですねf:id:shibayu2002:20190310112521j:plain

【作成された画像ファイル】

SONY neural network consoleのDataset作成機能

SONY neural network consoleのDataset作成機能

train.csvは教師データ画像ファイルの一覧、test.csvはテストデータ画像ファイルの一覧です。これについてはおいおい解説します。

4.SONY neural network consoleのDataset作成機能の注意点

筆者がハマったSONY neural network consoleのDataset作成機能の注意点を備忘のため記載します。

  • 入力元画像は分類したい単位に纏めてサブフォルダに格納する
  • ディレクトリに全角文字を含んではいけない

ハマりました。実はマニュアルにしっかり書いてました(-_-;)

SONY neural network consoleのマニュアル

SONY neural network consoleのマニュアル

【参考:SONY neural network consoleのオンラインマニュアル】

support.dl.sony.com

 

 

5.FXの機械学習をやってみた

ついにFXの機械学習が出来ましたーー。長かったー。
これについては次回詳しく記事にします。本日はここまでです。

SONY neural network consoleでFX機械学習

SONY neural network consoleでFX機械学習

◆ 推薦図書

詳解 ディープラーニング TensorFlow・Kerasによる時系列データ処理 [ 巣籠 悠輔 ]

価格:3,672円
(2018/11/25 22:43時点)
感想(0件)

【送料無料】 機械学習 データを読み解くアルゴリズムの技法 / 竹村彰通 【本】

価格:6,696円
(2019/3/23 23:16時点)
感想(0件)

広告




スポンサーリンク
広告




広告




シェアする

  • このエントリーをはてなブックマークに追加

フォローする

スポンサーリンク
広告