AIでFX分析!!教師データの分類方法~正規分布でクラスタリング~

こんにちは。管理人のピヨ猫でーす。

前回記事でFXの機械学習の教師データを作成する方法を紹介しました。
今度は出力データを考えてみたいと思います。

piyonekochannel.com

1.予想結果ってどうやって作れば良いの?

さて予想結果って何を作れば良いのでしょう。
極論言うとここに答えはありません。センスです。

機械学習(AI)で出来ることはデータを分類することです。
逆に言うと、AIにどうデータを分類してもらいたいか?を決めることが人の役割で肝です。

例えばですが人の画像があったとして分類方法は千差万別です。
「性別」で分類するか「年齢」で分類するか?
「年齢」で分類する場合、1日単位とするか?1年単位とするか?10年単位とするか?
生後の赤ちゃんの成長を分類するなら1日単位とかも良いでしょう。
でも成年を1日単位で見分けるのが極めて難しいのは自明です。この場合は年単位とか10年単位で分類した方が良いでしょう。

機械学習では何をしたいか?分類データにどういう特徴があるかを考えて、分類方法を決めることが必要です。

2.分類方法を考える

やりたいことは分かるとして、じゃあ分類方法ってどうやって決めれば良いのよ?
前述の例ですと人の年齢を分類するのに、何日・年単位で分類するのが適正か何ってどうやって分かるのよ?
と悩んだら、統計学を使うのが良いです。

というか統計学はデータを分類する学問で、なが~い知見が貯まっているので、それにあやかるのが良いです。

【統計学の分類方法色々】

メディカルスタッフのためのひと目で選ぶ統計手法 「目的」と「データの種類」で簡単検索!適した手法が76の事例から見つかる、結果がまとめられる [ 山田 実 ]

価格:3,456円
(2019/3/21 13:09時点)
感想(1件)

 

3.正規分布をやってみた

統計方法で最もメジャーで簡単にできるのが正規分布です。
大学入試の時に気にしていた人も多いかと思う、標準偏差ってやつです。

今回私がやりたいのは『過去の為替データを元に将来為替レートが上がるか下がるかを予想したい』というものです。
予想結果に何%上がった下がったという結果を用意しても良いのですが、先の人の年齢と同じで0.1%、0.2%、0.3%・・・上がった下がったという予想結果を用意しても、正しく分類できないことが予想されます。過去の値動きからそこまで細かい予想は出来ないからです。

そのため、どの範囲で分類するのが良いのか、過去の為替の変動率を正規分布にしてみました。

どん!!f:id:shibayu2002:20190310112521j:plain

ドル円の変動率の正規分布

これはある基準日から2日後にドル円の為替レートの変動率を正規分布にしたものです。この表が何を表しているかというと、-0.68%~0.67%の値動きが1σ(標準偏差)の範囲に分布しているということです。
ということは為替レートの変動は-0.68%~0.67%に収まるのが一般的で、それより大きく下がる、上がる値動きは異質な値動きということです。

値動きが一般的な範囲に収まるか異質な値動きをするかの選択であれば、過去データから予想がつきそうです。
なので、予想データは変動率が-0.68%より下か?-0.68%~0.67%の中か、0.67%より上か?を用意することにしました。

3択でなく、欲を書いて1/2σ、σ、2σで分類してみました。
一般的に統計学だとσ、2σで分類するみたいですが、お試しなので1/2σもいれました。

4.為替予想の正解表を作ってみた

↓↓↓ VBAツール

FX教師データ作成ツール
↓↓↓ 実行ボタンを押すと教師データ(入力データと予想結果)が作られます。

為替変動予想データ

この表の意味するところ。

為替変動率のクラスタリング結果
基準日ごとの前々日からの為替の変動率をクラスタリングしたものになります。
例えば2019/03/08の為替は-0.68%~-0.34%のクラスに属します。

 

5.学習データ作成ツールをGITに上げました

次回こそは準備した教師データを使って実際に機械学習をしてみたいと思います。
これ言うとの何回目だろう・・・。中々、機械学習までたどり着かない。
まあ、機械学習はデータを用意する方が肝なので、しっかり準備をしてから試そう。

作成したツールはGITHUBに登録してあるので良ければ参考にしてみて下さい。

◆ GITUB

https://github.com/shibayu2002/fx_ml_basedata.git

github.com

◆ 推薦図書

詳解 ディープラーニング TensorFlow・Kerasによる時系列データ処理 [ 巣籠 悠輔 ]

価格:3,672円
(2018/11/25 22:43時点)
感想(0件)

【送料無料】 機械学習 データを読み解くアルゴリズムの技法 / 竹村彰通 【本】

価格:6,696円
(2019/3/23 23:16時点)
感想(0件)

広告




スポンサーリンク
広告




広告




シェアする

  • このエントリーをはてなブックマークに追加

フォローする

スポンサーリンク
広告