G検定対策~第二章 人工知能をめぐる動向~

こんにちは。管理人のピヨ猫でーす。

日本ディープラーニング協会(JDLA)が実施している機械学習の認定試験のG検定って何かすごいらしいねー。この前、機械学習のセミナーでG検定に合格したという方が講師していて、みんな「おっ!」てしていたよ。僕も機械学習の仕事に就きたいからG検定取りたいけど、機械学習って分野が広すぎて何をどう勉強して良いかわからないんだー。

疑問がある

日本ディープラーニング協会(JDLA)がG検定の推薦図書を出してくれているから、これに従って勉強すれば良いんだよ。すごく分かり易く書かれているから、今まで理解できないと思っていたこともすんなり理解できるようになるよ。これから詳しく勉強方法を説明するね。

記事の説明です

 

1.日本ディープラーニング協会(JDLA)のG検定とは

日本ディープラーニング協会(JDLA)とは

日本ディープラーニング協会(JDLA)は、ディープラーニングを中心とする技術による日本の産業競争力の向上を目指し、2017年6月1日設立日された一般社団法人です。

詳しくは以下の記事を参照ください。
日本ディプラーニング協会のG検定とは?

G検定とは

G検定は日本ディープラーニング協会(JDLA)が実施している機械学習の検定試験です。
ディープラーニングの基礎知識を有し、適切な活用方針を決定して事業応用する能力を持つ人材であることを測る検定』です。

2.G検定の勉強方法

日本ディープラーニング協会(JDLA)の推薦書籍

G検定の勉強方法は至ってシンプルです。
日本ディープラーニング協会(JDLA)が「G検定の問題はここから出す」と言っている、日本ディープラーニング協会(JDLA)が推薦する書籍があります。

日本ディープラーニング協会(JDLA)のG検定の問題はここからでる!!

深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト (EXAMPRESS) [ 一般社団法人日本ディープラーニング協会 ]

価格:3,024円
(2019/4/3 21:03時点)
感想(1件)

なので、基本的にはこの本を読んで書いてあることが分かればG検定に合格できます。
この本はG検定の合格目的でなくてもとても良い本です。
機械学習を始める上での入門書と言った感じで、とても分かり易く順序立てて機械学習を行う上で必要なことが書かれています。機械学習を始める方は絶対に読んだ方が良いでしょう。

G検定の勉強のコツ

理解度を深めるコツとしては、
本を読む → キーワードを抑える → キーワードを見て意味が分かる程度になるまで、また本を読む
を繰り返すのが良いと思います。人それぞれですので、これが必ずしも良いということはありませんので、自分に合った勉強法があれば、自分に合った方法で勉強するのが良いかと思います。どうすれば良いかわからないという方は、上記の方法を試してみて下さい。

本記事で『深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト』の第二章のキーワードを纏めましたので、良ければ利用して下さい。

第二章~人工知能をめぐる動向~のキーワード

2-1.探索・推論

1.探索・推論

1.1 迷路(探索木)
  • コンピューターで処理できる形式に変換
    例) 迷路は探索木に置き換えられる
  • ツリー構造
  • 探索木
  • 探索木は場合分け
  • 探索にかかる時間は方法により違う
  • 幅優先検索、深さ優先検索
  • 探索木
◆ 幅優先検索
  • 隣接ノードを全て探索
    最短経路でゴールにたどり着く解が見つかる
  • メモリを多く使う
◆ 深さ優先検索
  • 1つのノードを探索
  • 見つからなければ一つ手前に戻る
  • メモリ消費が少ない
  • ゴールにたどり着く解が最短経路とは限らない
  • 探索にかかる時間は運
1.2 ハノイの塔
  • コンピューターで処理できる形式に変換
  • ポールとボードにラベルを付ける
1.3 ロボットの行動計画
  • プランニング
  • 環境を1つの状態と考える
  • 前提条件、行動、結果を記述
  • STRIPS(Stanford Research Institute Problem Solver)
  • SHRDLU
  • テリー・ウェノグラード
  • Cyc(サイク)プロジェクト
1.4 ボードゲーム(オセロ・チェス・将棋・囲碁)
  • AlphaGo
  • 囲碁の組み合わせは天文学的数値
  • 探索は不可能
  • コスト(スコア)の概念を導入 例)ボードゲームのある状態に自分が有利か否か点数を付ける
  • ヒューリスティックな知識(探索を有効に行うために経験に有効な知識)
◆ MIni-Max法
  • 自分が指す時にスコアが最大になるようにする
  • αβ法 MIni-Max法の探索を減らす方法
  • βカット 現在の最大スコアよりスコアが低いノードは探索対象から外す
  • αカット 最小を探す場合に現在の最小スコアよりスコアが高いノードは探索対象から外す
1.5 モンテカルロ法
  • 従来のコスト評価に問題がある
  • 予め評価を決めない
  • コンピューター2人に対戦させ決着を付ける
  • 対戦を複数回思考しスコアを付ける
  • プレイアウト
  • 数多く打って最良の物を選ぶ
  • ブルートフォース(力任せ)には限界がある
  • ディープラーニング

2-2.知識表現

1.知識表現

1.1 人工無能(知識なしでも知性があるように感じる人間心理の不思議)
  • 人工無能
  • チャットボット、おしゃべりボット
  • イライザ(ILIZA)
  • 世界初の人工無能。1964~1966年
  • イライザ効果
1.2 知識ベースの構築とエキスパートシステム
◆ マイシン(MICIN)
  • 1970年代
  • ジョゼフ・ワイゼンバウム
  • 初期のエキスパートシステム
  • 診断システム
  • 的中率60%強
◆DENDRAL
  • エドワード・ファイゲンバウム
  • 1970年代
  • 知識工学
1.3 知識獲得のボトルネック(エキスパートシステムの限界)
  • 知識の入手元
  • 有識者、ドキュメント、事例
  • 知識の取得手段
  • 自然言語処理、機械学習
  • 有識者からの情報取得が困難
  • 暗黙的
  • インタビューシステム
  • 知識ベースを保守するのが困難
  • 意味ネットワーク
  • オントロジー
1.4 意味ネットワーク
  • 意味ネットワーク(Semantic Network)
  • 認知心理学
  • 長期記憶の構造モデル
  • 概念
  • ラベルのついたノード
  • ラベルのついたリンク
  • is-aの関係(=継承関係)
  • 上位概念
  • 下位概念
  • part-ofの関係(=属性)
1.5 オントロジー(概念体系を記述するための方法論)
◆ Cyc(サイク)プロジェクト
  • 全ての一般常識を取り込む試み
  • 1984年
  • ダグラス・レナート
  • 30年後の現在も続いている
◆ オントロジー
  • 知識を体系化する方法論
  • オントロジー(ontology)
  • 哲学用語
  • 存在論(存在に関する体系的理論)
  • 概念化の明示的な仕様
  • 知識の共有と活用
1.6 概念間の関係(is-aとpart-ofの関係)
◆ 「is-a」の関係
  • 上位概念と下位概念の関係
  • 推移率が成り立つ
  • AとB、BとCの関係が成立すればAとCの関係も成立する
◆ 「part-of」の関係
  • 全体と部分の関係
  • 推移率が成り立つとは限らない
  • 色々な種類の関係がある(最低でもpart-ofには5種類の関係がある)
1.7 オントロジーの構築
  • ヘビーウェイトオントロージー(重量オントロジー)
  • 対象世界の知識をどのように記述すべきかを哲学的にしっかり考えて行う
  • ライトウェイトオントロジー(軽量オントロジー)
  • 効率を重視し、とにかくコンピューターにデータを読み込ませて出来る限り自動的に行う
◆ ヘビーウェイトオントロージー(重量オントロジー)
  • 人間が関わる傾向が強い
  • 時間とコストがかかる
  • Cyc(サイク)プロジェクト
◆ ライトウェイトオントロジー(軽量オントロジー)
  • ウェブマイニング
  • データマイニング
  • セマンティックWebで展開されている
  • LOD(Linked Open Data)で展開されている
1.8 ワトソンと東ロボくん
◆ ワトソン
  • 2011年
  • IBM
  • Question-Answering(質問応答)
  • 質問に含まれるキーワードと関連しそうな答えを高速に検索している
  • コールセンター、人材マッチング、広告などで活用
◆ 東ロボくん
  • 2011年~2016年
  • 日本
  • 東大合格を目指す
  • 偏差値57.8
  • 読解力に問題があった

2-3.機械学習・深層学習

1.機械学習

1.1 データの増加と機械学習
  • 人工知能のプログラム自身が学習する仕組み
  • サンプルデータの数が多ければ多いほど、望ましい学習結果が得られる
  • ビッグデータ(インターネットの成長とともに蓄積された大容量のデータ)
  • レコメンデーションエンジン
  • スパムフィルター
1.2 機械学習と統計的自然言語処理
  • 複数の単語をひとまとまりにした単位(句または文単位)
  • 正解である確率が高いものを選択
  • コーパス

2.深層学習(ディープラーニング)

2.1 ニューラルネットワーク
  • 人間の神経回路を真似
  • 1958年
  • フランク・ローゼンブラット
  • 単純パーセプトロン
2.2 ディープラーニング(深層学習)
  • バックプロパゲーション(誤差逆伝播学習法)
  • 自己符号化器
  • データ量の増加
  • ハードウェアの処理能力向上
2.3 新時代を切り開くディープラーニング
  • ILSVRC(Imagenet Large Scale Visual Recognition Challenge)
  • トロント大学
  • SuperVision
  • 深層学習以前は特徴量(注目すべきデータの特徴)を決めるのは人間だった
  • 新しい機械学習の方法
  • 2015年に人間の画像認識エラー率(4%)を抜く

第二章~人工知能をめぐる動向~のポイントの復習

2-1.探索・推論

探索木の幅優先検索と深さ優先検索のメリットとデメリットは抑えておいた方が良いです。

  • 幅優先検索はメモリを多く使うが最短経路を見つかられる
  • 深さ優先検索は使用メモリが少ないが答えが最短経路とは限らない

【幅優先検索】
幅優先検索
【深優先検索】
深さ優先検索

また、ロボットの行動計画についての前提条件、行動、結果を記述するSTRIPSという方法があることと、「積み木の世界」に存在する様々な物体を動かすことができたSHRDLUシステムがあることは抑えておきましょう。

また、ボードゲームの難易度については割と有名な話なので覚えておいた方が良いです。オセロ < チェス < 将棋 < 囲碁 の順となること及び、ボードゲームはパターンが膨大なため、探索経路を減らすMini-Max法が用いられること、勝率を事前に用意するのではなく大局中にAI同士を勝負させて最適解を見つけるモンテカルロ法があることも抑えておきましょう。

2-2.知識表現

物の関係を表すis-aとpart-ofの関係はしっかり抑えておきましょう。

  • is-a : 人は哺乳類である (上位概念と下位概念の関係で推移率が成り立つ)
  • part-of : 手は体の一部である (全体と部分の関係で推移率が成り立たない場合もある)

また、知識の定義方法を記すオントロジーという用語は抑えておきましょう。

2-3.機械学習・深層学習

機械学習(マシンラーニング)と深層学習(ディープラーニング)の関係は抑えておきましょう。
ディープラーニングはマシンラーニングの実現方法の一つです。
ディープラーニングは2000年代になり発明されマシンラーニングの学習精度の向上に大きな貢献をしました。
マシンラーニングとディープラーニング

また、ディープラーニングの根本となるニューラルネットワークについて抑えておきましょう。
ニューラルネットワークは人間の脳を模した構成で、最もシンプルなニューラルネットワークを単純パーセプトロンと言います。
ディープラーニングはニューラルネットワークの中間層を増やしたもので分析精度が飛躍的に上がりました。
【単純パーセプトロン】
単純パーセプトロン

第二章はこれで終了です。次章も頑張りましょーがんばろー

(参考)日本ディープラーニング協会(JDLA)のその他の推薦図書

◆◆AI白書 2019 / 情報処理推進機構AI白書編集委員会/編 / 角川アスキー総合研究所

価格:3,888円
(2019/4/3 22:46時点)
感想(0件)

人工知能は人間を超えるか ディープラーニングの先にあるもの (角川EPUB選書) [ 松尾豊 ]

価格:1,512円
(2019/4/3 22:46時点)
感想(2件)


広告




スポンサーリンク
広告




広告




シェアする

  • このエントリーをはてなブックマークに追加

フォローする

スポンサーリンク
広告