IoT検定対策7章 データ分析(2/2)

データ分析(2/2)

機械学習(の続き)

  • 強化学習
    • 構成要素は『エージェント』『行動』『環境』『報酬』から成る。
      f:id:camelrush:20200828232216p:plain
    • 機械学習の目標は、エージェントが、状態sで行動aを起こしたときに得られる報酬 Q(s,a) の中で、最も高い値の行動aを最適な行動とし、状態遷移を繰り返すこと。
    • Q学習:エージェントが行動した結果の価値(Q値)を、時間とともに繰り返し更新していく学習。更新では状態s、行動aと、割引率γを用いる。
    • 割引率:時間の経過によって変動する価値を調整するためのウエイト。
  • クラスタリング

    • 階層型クラスタリング
      • 要素同士の距離の関係(例えば最短距離にある要素の)に基づき、要素2つずつを段階的にグルーピング(クラスター化)していく分類する。分類の段取りを階層的なデンドログラフで表現した後、任意の高さで切り、クラスタリング結果を得る。 f:id:camelrush:20200829000237p:plain
    • 非階層型クラスタリング
      • k-means法:要素の集合に対する重心位置を割り出して、クラスターを特定する方法。
        1. 要素の集合にランダムな2つの点をうつ((a)のひし形)
        2. 各要素がいずれの点に近いか、判定する((b)で黒・白に色分け)
        3. 一度ランダム点を消し、2集合それぞれの重心(集合の中心部分)に点を打ちなおす((c)でひし形の位置変更)
        4. 再度、各要素がいずれの点に近いか、判定する((d)で黒・白に色分け)
        5. 3~4を、判定が変わらなくなるまで繰り返す。
        6. できあがった2集合がクラスターである
          f:id:camelrush:20200829000859p:plain
  • 回帰分析

…ここでまた「教師あり学習」に戻るのか…
…この本、微妙に行ったり来たするのでわかりづらいなぁ…
…いったん整理しよう…

機械学習の分類