G検定対策~第七章 ディープラーニングの研究分野~

こんにちは。管理人のピヨ猫でーす。

日本ディープラーニング協会(JDLA)が実施している機械学習の認定試験のG検定って何かすごいらしいねー。この前、機械学習のセミナーでG検定に合格したという方が講師していて、みんな「おっ!」てしていたよ。僕も機械学習の仕事に就きたいからG検定取りたいけど、機械学習って分野が広すぎて何をどう勉強して良いかわからないんだー。

疑問がある

日本ディープラーニング協会(JDLA)がG検定の推薦図書を出してくれているから、これに従って勉強すれば良いんだよ。すごく分かり易く書かれているから、今まで理解できないと思っていたこともすんなり理解できるようになるよ。これから詳しく勉強方法を説明するね。

記事の説明です

 

1.日本ディープラーニング協会(JDLA)のG検定とは

日本ディープラーニング協会(JDLA)とは

日本ディープラーニング協会(JDLA)は、ディープラーニングを中心とする技術による日本の産業競争力の向上を目指し、2017年6月1日設立日された一般社団法人です。

詳しくは以下の記事を参照ください。
日本ディプラーニング協会のG検定とは?

G検定とは

G検定は日本ディープラーニング協会(JDLA)が実施している機械学習の検定試験です。
ディープラーニングの基礎知識を有し、適切な活用方針を決定して事業応用する能力を持つ人材であることを測る検定』です。

2.G検定の勉強方法

日本ディープラーニング協会(JDLA)の推薦書籍

G検定の勉強方法は至ってシンプルです。
日本ディープラーニング協会(JDLA)が「G検定の問題はここから出す」と言っている、日本ディープラーニング協会(JDLA)が推薦する書籍があります。

日本ディープラーニング協会(JDLA)のG検定の問題はここからでる!!

深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト (EXAMPRESS) [ 一般社団法人日本ディープラーニング協会 ]

価格:3,024円
(2019/4/3 21:03時点)
感想(1件)

なので、基本的にはこの本を読んで書いてあることが分かればG検定に合格できます。
この本はG検定の合格目的でなくてもとても良い本です。
機械学習を始める上での入門書と言った感じで、とても分かり易く順序立てて機械学習を行う上で必要なことが書かれています。機械学習を始める方は絶対に読んだ方が良いでしょう。

G検定の勉強のコツ

理解度を深めるコツとしては、
本を読む → キーワードを抑える → キーワードを見て意味が分かる程度になるまで、また本を読む
を繰り返すのが良いと思います。人それぞれですので、これが必ずしも良いということはありませんので、自分に合った勉強法があれば、自分に合った方法で勉強するのが良いかと思います。どうすれば良いかわからないという方は、上記の方法を試してみて下さい。

本記事で『深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト』の第七章のキーワードを纏めましたので、良ければ利用して下さい。

第七章~ディープラーニングの研究分野~のキーワード

7-1.画像認識分野~のキーワード

1. アレックスネット(AlexNet)

  • 2012年に画像認識コンテストで優勝
  • ラベル付けが課題。一つの画像に複数の物が描かれている場合、どちらともとれる

2.R-CNN

イメージネットコンテストの課題

何処に何があるか

  • 位置課題(location task)(何処)
  • 検証課題(detection task)(何)

R-CNN(Regional CNN)

  • 関心領域の切り出しにFOG等の非CNNによる従来手法を用いる
  • 領域の切り出しは4つの点を予想する回帰問題
  • バンディングボックス

高速RCNN(fast CNN)

  • CNNで物体の切り出しと認識を同時に行う
  • さらに改良されたfaster RCNN
  • 実時間(秒間16フレーム)で関心領域の切り出しが可能になった

R-CNNの更なる発展系

  • YOLO(You Only Look Once)
  • SSD(Single Shot Detector)

3.セマンティックセグメンテーションとインスタンスセグメンテーション

セマンティックセグメンテーション

  • 四角形ではない詳細な領域分割を行うモデル
  • 物体認識では詳細な領域分割が必要
  • 完全畳み込みネットワーク(FCN)

    全ての層が畳み込み層であるモデル
    入力層の画素数と同じだけ出力層が必要
    縦画素数×横画素数×カテゴリ数のニューロン
  • 畳み込みと反対方向に解像度を上げる工夫が必要
  • アンサンプリング
  • セグネット

    インスタンスセグメンテーション

  • 画像内の個々の物体を認識

7-2.自然言語処理分野~のキーワード

1. 単語の意味を表すベクトル空間モデル

  • 単語の意味を扱う手法(word2vec)
  • ベクトル空間モデル
  • 単語埋め込みモデル
  • 中間層がベクトルを意味する
  • 単語をベクトルで表現
  • 単語の意味はその回りの単語で決まる
  • 王様-男性+女性=女王と推論した

word2vecの手法

スキップグラム
  • ある単語を加えて周辺の単語を予想
CBOW
  • 周辺の単語を与えてある単語を予想

2.単語の意味表現から文章の意味表現へ

  • 単語埋め込みモデルは自然言語処理の基礎
  • 可変長の単語を固定長のベクトルで表すため数学的な扱いが容易
  • マルチタスク言語モデル

fastText

  • トマス・ミコロフ
  • 単語の表現に文字の情報も含める
  • 訓練データに存在しない文字を表現可能
  • 訓練済みデータが公開されている

ELMo

  • 文章表現を得るモデル
  • 2層の双方向リカレントネットワーク言語モデルの内部状態から計算される
  • 各層は単語に関する異なる状態を符号化する
  • 品質や語義など多数の異なる情報を保持

マルチタスク言語モデル

  • 次文あるいは前文予測
  • 機械翻訳
  • 構文解析
  • 自然言語推論
  • 普遍埋込モデル

3.画像脚注付け

ニューラル画像脚注付け(NIC)

  • CNNとリカレントネットを融合
  • 全結合層の直下をリカレントニューラルネットで構成される文章構成ネットの入力にする
  • CNNの全結合層には物体と位置情報が表現されている
  • 1対他の出力が可能
  • 脚注付けで大きな成果
  • 自動翻訳のシーケンス2シーケンスでも利用されている

4.ニューラルチューリングマシーン(NTM)

  • チューリングマシンをニューラルネットで実現する試み
  • コントローラにLSTMを利用
  • 並べ替えアルゴリズムを覚えるなど複雑なことが可能

7-3.音声認識

1.音声認識、音声生成、テキスト読み上げWaveNet

WaveNet(ウエーブネット)

  • 音声合成(speech synthesis)
  • 音声認識(speech recogition)
  • 人間に近い発話

7-4.強化学習(ロボティクス)

1.強化学習

  • Reinforcement Learning:RL
  • DQN(Deep Q Networks)
  • アルファ碁(AlphaGo)
  • モンテカルロ探索

強化学習の改善手法

  • 方策(ポリシー)ベース (value function base)
  • 行動価値関数ベース(Q function base)
  • モデルベース(model base)
  • セルフプレイ(self play)

アルファ碁セロ

  • 0からセルフプレイを学習
  • アルファ碁を凌駕

意思決定行動を改善するためのモデル

  • 方策ベース(UNREALなど)
  • 状態価値関数(Q関数ベースなど)
  • モデルベース(A3Cなど)
  • 全部を入れるとRAINBOWモデルになる

第七章~画像認識分野~のポイントの復習

本章は様々な分野における機械学習の研究の取り組みの解説になります。

機械学習の研究分野にはどういうものがあるか?
どういう研究がなされてきて、今はどのような取り組みをしているか?
が本章のポイントになります。

7-1.アレックスネット

画像認識分野の歴史

ディープラーニングを活用したアレックスネットの登場により画像認識の精度は飛躍的に向上した。

アレックスネットの問題点

アレックスネットは物体の抽出を行うことが出来なかった。

課題の対応状況

R-CNN、fast CNN、faster CNN、YOLO、SSDが開発され、現在は秒間16フレームに対し、関心領域の切り出しが可能となっており、動画解析への道が開けてきた。

また、セマンティックセグメンテーションとインスタンスセグメンテーションにより、複数の物体をカテゴライズして見分けることも、複数の物体を個々に見分けることも出来るようになった。

7-2.自然言語処理分野

AIは自然言語処理分野で大きな成果をあげており、様々な種類のモデルが研究されている。

fastText

訓練データに存在しない文字を表現可能で、訓練済みデータが公開されている

ELMo

文章表現を得るモデル

ニューラル画像脚注付け(NIC)

CNNとリカレントネットを融合したモデルで、画像の脚注付けができる。

ニューラルチューリングマシーン(NTM)

チューリングマシンをニューラルネットで実現する試みで、並べ替えアルゴリズムを覚えるなど複雑なことが可能

のポイントは音声認識分野の機械学習の手法と強化学習(ロボティクス)の手法です。それぞれの手法は把握しておきましょう。

7-3.音声認識

WaveNet(ウエーブネット)で音声合成を人間の言葉に近い形で行うことができる。また、音声認識を行うことが出来る。

7-4.強化学習(ロボティクス)

強化学習の手法は方策(ポリシー)ベース、行動価値関数ベース、モデルベースがある。
また、アルファ碁の話は有名で、アルファ碁はCNNとモンテカルロ探索を活用して作られている。

第七章はこれで終了です。次章も頑張りましょー

がんばろー

(参考)日本ディープラーニング協会(JDLA)のその他の推薦図書

◆◆AI白書 2019 / 情報処理推進機構AI白書編集委員会/編 / 角川アスキー総合研究所

価格:3,888円
(2019/4/3 22:46時点)
感想(0件)

人工知能は人間を超えるか ディープラーニングの先にあるもの (角川EPUB選書) [ 松尾豊 ]

価格:1,512円
(2019/4/3 22:46時点)
感想(2件)


広告




スポンサーリンク
広告




広告




シェアする

  • このエントリーをはてなブックマークに追加

フォローする

スポンサーリンク
広告