強化学習入門《基礎理論からPythonによるアルゴリズムの実装例まで》【提携セミナー】

Python_アルゴリズムの実装例

強化学習入門《基礎理論からPythonによるアルゴリズムの実装例まで》【提携セミナー】

このセミナーは終了しました。次回の開催は未定です。

おすすめのセミナー情報

開催日時 2021/4/15(木)10:30~16:30
担当講師

吉本 潤一郎 氏

開催場所

Zoomによるオンラインセミナー

定員 -
受講費 【オンラインセミナー(見逃し視聴なし)】:47,300円
【オンラインセミナー(見逃し視聴あり)】:52,800円

★Pythonによるアルゴリズム実装デモを交えながら、強化学習がうまく働く仕組みや応用例を解説!
★使用するサンプルプログラムは事前送付しますので、お手元で走らせながら受講する事も可能です。
★基礎から代表的なアルゴリズム、実装時に生じる諸問題と解決策、
ロボット制御や脳の意思決定モデル等への応用まで。

 

強化学習入門
~基礎理論からPythonによるアルゴリズムの実装例まで~

 

【提携セミナー】

主催:株式会社情報機構

 


 

強化学習とは環境とのインタラクションを通して試行錯誤的に最適な戦略や行動選択則を獲得する機械学習法の枠組みです。囲碁や将棋の世界では、人工知能が人間エキスパートを超えるようになり世の中を驚かせましたが、それには強化学習が大きな貢献を果たしました。では、強化学習を使えば何でもできるのでしょうか?それとも、強化学習にも苦手な応用分野はあるのでしょうか?それを知るには強化学習の基本原理を理解する必要があります。

 

本セミナーでは、簡単な例題やプログラム演習を通して、強化学習がうまく働く仕組みや応用例を解説するとともに、脳の情報処理との相同性や相違性をご紹介したいと思います。

 

◆ 受講対象者

・強化学習についてゼロから学びたいと考えている方
・強化学習アルゴリズムのプログラム実装にチャレンジしたいと考えている方
・強化学習モデルを利用して行動データの解析を試してみたいと考えている方
・その他、本テーマに興味のある方なら、どなたでも受講可能です。

 

◆ 必要な予備知識

高校卒業レベルの線形代数と基礎解析の知識があると望ましいですが、この分野に興味のある方なら、特に予備知識は必要ありません。

 

◆ 予習・復習されたい方へお勧め参考書

・R.S. Sutton & A.G. Barto: Reinforcement Learning: An Introduction (Second Edition), MIT Press, Cambridge, MA, 2018. (http://incompleteideas.net/book/the-book-2nd.htmlよりプレプリントの閲覧が可能です)
・牧野貴樹,澁谷長史,白川真一(編): これからの強化学習,森北出版,2016.

 

◆ 本セミナーで習得できること

・強化学習の基礎知識と応用例
・Pythonによる強化学習アルゴリズムの実装方法
・強化学習モデルを利用したヒトや動物の行動解析法
など

 

◆ 当日は講師によるプログラミング演習デモンストレーションを実施します。

1)開催日が近づきましたら受講者の方にも演習用データをメールにて配布致します。当日は講師のデモを追いながらお手元で再現する事も可能ですし、当日は講義を聞く事に集中し後日プログラムを触る事も可能です(講師への質問も可)

2)PCのプラットフォームは,Windows/Linux/MacOS問いません。3)が問題なく行えれば特にスペック指定もございませんが、極端に旧型PCの場合は動作が遅くなる可能性がございます。

3)Anacondaのダウンロード/インストールのお願い
デモを追いたい方は事前に下記から最新のAnacondaのダウンロードおよびインストールをお願い致します。
https://www.anaconda.com/download/

 

担当講師

奈良先端科学技術大学院大学
先端科学技術研究科情報科学領域 准教授
吉本 潤一郎 氏

 

セミナープログラム(予定)

1.はじめに
1)例題から学ぶ機械学習と強化学習の位置づけ
2)強化学習の歴史

 

2.強化学習の基礎理論
1)マルコフ決定過程による問題の定式化とその解法
① マルコフ決定過程
② 価値反復法
③ 方策反復法
2)代表的な強化学習アルゴリズム
① モンテカルロ法
② TD学習法
③ Q学習法
④ SARSA法
⑤ モデル同定型強化学習法
⑥ 方策勾配法
3)アルゴリズム実装時に生じる諸問題とその解決法
① 探索と知識利用のジレンマ
② メタ学習
③ 連続空間・高次元空間への対応とDQN
④ 部分観測問題への対応

 

3.プログラミング演習デモンストレーション:Pythonによる強化学習アルゴリズムの実装法

 

4.強化学習の応用例
1)ロボットの自動制御
2)ゲームエージェントの学習
3)脳の意思決定モデルと行動解析

 

5.質疑応答・個別相談

 

■ご講演中のキーワード:
強化学習、価値関数法、方策探査法、actor-critic法、マルコフ決定過程、探索と知識利用のジレンマ、脳の意思決定モデル

 

公開セミナーの次回開催予定

開催日

2021年4月15日(木) 10:30-16:30 *途中、お昼休みや小休憩を挟みます。

 

開催場所

【Live受講】 Live配信セミナー(リアルタイム配信) ※会社・自宅にいながら学習可能です※

 

オンライン配信のご案内

★ Zoomによるオンライン配信

★ 見逃し視聴

★ ライブ配信(Zoomでの受講が難しい方へ)

 

については、こちらをご参照ください

 

受講料

  • 【オンライン受講:見逃し視聴なし】:1名47,300円(税込(消費税10%)、資料付)

*1社2名以上同時申込の場合、1名につき36,300円

  • 【オンライン受講:見逃し視聴あり】:1名52,800円(税込(消費税10%)、資料付)

*1社2名以上同時申込の場合、1名につき41,800円

 

学校法人割引;学生、教員のご参加は受講料50%割引。

 

配布資料

  • 配布資料はPDF等のデータで送付予定です。受取方法はメールでご案内致します。
    (開催1週前~前日までには送付致します)。
    *準備の都合上、開催1営業日前の12:00までにお申し込みをお願い致します。
    (土、日、祝日は営業日としてカウント致しません。)

 

備考

  • 当日、可能な範囲で質疑応答も対応致します。
    (全ての質問にお答えできない可能性もございますので、予めご容赦ください。)
  • 本講座で使用する資料や配信動画は著作物であり、無断での録音・録画・複写・転載・配布・上映・販売等を禁止致します。

 

お申し込み方法

★下のセミナー参加申込ボタンより、必要事項をご記入の上お申し込みください。

★【オンラインセミナー(見逃し視聴なし)】、【オンラインセミナー(見逃し視聴あり)】のいずれかから、ご希望される受講形態をメッセージ欄に明記してください。

 

おすすめのセミナー情報

製造業eラーニングTech e-L講座リスト

製造業向けeラーニングライブラリ

アイアール技術者教育研究所の講師紹介

製造業の新入社員教育サービス

技術者育成プログラム策定の無料相談受付中

スモールステップ・スパイラル型の技術者教育

技術の超キホン

機械設計マスターへの道

生産技術のツボ

早わかり電気回路・電子回路

品質保証塾

機械製図道場

スぺシャルコンテンツ
Special Contents

導入・活用事例

テキスト/教材の制作・販売