コンテンツへスキップ
メニュー
  • ホーム
  • 強化学習と呼ばれる領域
  • ディープラーニングの弱点
  • スパースモデリング
  • 自動車の自動運転
  • Contact
  • 検索
  • ホーム
  • 強化学習と呼ばれる領域
  • ディープラーニングの弱点
  • スパースモデリング
  • 自動車の自動運転
  • Contact

土居みさきのAIビジネスって?

AIについてもっと知りたいあなたへ

強化学習と呼ばれる領域

AIの実行領域は、大きく3つに分けられますが、その1つが強化学習です。強化学習と聞いてもイメージできないかもしれませんが、「囲碁や将棋のソフト」と聞けば思い当たる人もいらっしゃるでしょう。まるで人間のように答えを導き出すソフトとして人口に膾炙しています。「人間のように」と言われる理由は単純です。何とこのソフトは棋譜が予めインプットされていなくても、プロの棋士を相手に勝利を収めることが出来るからです。強化学習の仕組みはそれほど難しくありません。正解の棋譜がインプットされていないのですから、試行錯誤を繰り返して答えに辿り着く他ありません。最初はランダムに挑戦しますが、当然評価は高いものが与えられません。減点されればすぐに初めからトライするのです。そして何度も挑戦し、最後に最短距離を見つけ出します。最短距離とは、最も望ましい結果を導けるパラメータを指します。このように説明すると、まるで魔法だと思われるかもしれませんが、実際は魔法でも何でもありません。考えてもみて下さい。強化学習の対象となるのは、他の領域とは異なり、明確な正解が存在しないものです。つまり唯一の答えに辿り着く必要はないのです。なるべく距離が近いパラメータを探すことに徹するだけですから、他の領域の研究と比較しても魔法とは言えません。実際難点も指摘されています。例えば、囲碁のようなゲームは完全情報ゲームですが、ポーカーのようなゲームは運によるところも大きく、不完全情報ゲームと言えるものです。不完全情報ゲームを対象として強化学習するのは困難なのです。

最新情報

  • 何故自動運転が可能なのか 10月 1, 2019

✳︎土居みさき✳︎

✳︎土居みさき✳︎

AIという言葉はもう広く一般的になりましたね。そんなAIのことをもっと知りたくてサイトやってます。

ご連絡は下記までお願いします。
doi@misaki-doi.com

免責事項

当サイトに掲載している情報をもとにして、閲覧者や第三者が行動し、その行動に伴い損害が発生した場合でも、運営者は責任を負いません。またこのサイトに掲載している情報は随時修正・削除を行う可能性や、時代の変化等の要因で情報が正しいものではなくなる可能性があります。あらかじめご理解の上サイトをご覧くださいますようお願いします。

WEBシステム開発ならここがおすすめ

WEBシステム開発
  • ホーム
  • 強化学習と呼ばれる領域
  • ディープラーニングの弱点
  • スパースモデリング
  • 自動車の自動運転
  • Contact

Copyright © 2019 土居みさきのAIビジネスって? All rights Reserved.