材料・医薬品の効率的な開発のためのケモインフォマティクス・マテリアルズインフォマティクスに基づく実践的な機械学習入門【提携セミナー】
開催日時 | 未定 |
---|---|
担当講師 | 椿 真史 氏 |
開催場所 | 未定 |
定員 | - |
受講費 | 未定 |
材料・医薬品の効率的な開発のための
ケモインフォマティクス・マテリアルズインフォマティクス
に基づく実践的な機械学習入門
~化合物研究者・開発者のための実践的なデータ分析と機械学習~
■ケモインフォマティクスとマテリアルズ・インフォマティクスのためのデータ分析法■
■データ分析に基づく具体的なイシューの立て方とその実践■
■適切な機械学習法の適用とその限界■
【提携セミナー】
主催:サイエンス&テクノロジー株式会社
ケモインフォマティクス・マテリアルズインフォマティクスに基づく実践的な機械学習
適切なイシューの立て方、徹底的なデータ分析、そして機械学習の限界
データの数や多様性が少ない、どのようにデータを集めイシューを洗練させるか、
機械学習の予測精度ではなく結果を解釈するには、、、、実践に特化したアプローチ
–
セミナー趣旨
昨今、物理学・化学・生物学の様々なデータが膨大に蓄積され、そのような自然科学データに対する機械学習技術の応用と成功が注目されています。本セミナーでは、材料・医薬品をより効率的に開発するための、ケモインフォマティクス・マテリアルズインフォマティクスに基づく、実践的な機械学習について紹介します。主に適切なイシューの立て方、徹底的なデータ分析、そして機械学習の限界などについて、個々の詳細ではなく、実践に特化したアプローチを紹介します。特に具体例を交えながら、企業の抱える課題(データの数や多様性が少ない、どのようにデータを集めイシューを洗練させるか、機械学習の予測精度ではなく結果の解釈を考えたい等)について、講演者の研究開発の経験を交えながら講義します。
得られる知識
・ケモインフォマティクスとマテリアルズ・インフォマティクスのための材料や医薬品データに対する基礎的かつ徹底的なデータ分析法
・データ分析に基づく具体的なイシューの立て方とその実践
・適切な機械学習法の適用とその限界
受講対象
・経験・前提知識は不問です
・市販のデータ分析や機械学習の入門書を一読しておくと理解しやすくなります
・業務の中でデータ分析や機械学習を試みている(そしてうまくいかない)方
キーワード
:ケモインフォマティクス、マテリアルズインフォマティクス、イシュー、データ分析、機械学習
担当講師
(国研)産業技術総合研究所 人工知能研究センター 機械学習研究チーム 研究員 博士(工学) 椿 真史 氏
セミナープログラム(予定)
1.機械学習を始める前に(90分)
1.1 イシューからはじめよ
1.1.1 機械学習とデータ分析以前に行うべき、問題・課題・目的の明確化
1.1.2 ケモインフォマティクス・マテリアルズインフォマティクスにおけるイシュー
1.1.3 ビッグデータの落とし穴 ~たくさんデータがあればいいわけではない~
1.1.4 機械学習の落とし穴 ~精度が高ければいいわけではない~
1.1.5 イシューからはじめよ
1.1.6 様々なイシューの具体例
1.2 データ分析の基礎と徹底
1.2.1 化合物の特徴量の例
1.2.2 相関分析・頻度分析 ~シンプルな分析でイシューの大枠を把握する~
1.2.3 交差項・相互作用分析 ~非線形な分析でイシューに深く切り込む~
1.2.4 様々な特徴量を用いた重回帰分析
1.2.5 重回帰分析における多重共線性の罠
1.2.6 重回帰分析における解釈の罠
2.化合物データのための機械学習手法(90分)
2.1 機械学習の基礎
2.1.1 機械学習における訓練データとテストデータの準備
2.1.2 特徴量の事前チェックと外挿
2.1.3 線形回帰の基礎
2.1.4 様々な特徴量を用いた線形回帰
2.1.5 非線形回帰の基礎
2.1.6 回帰モデルの安定性 ~多重共線性と過学習~
2.2 様々な回帰モデル
2.2.1 多重共線性を抑えるためのリッジ回帰
2.2.2 過学習を防ぎ変数選択をするためのラッソ回帰
2.2.3 主成分分析(PCA)による多重共線性の回避と変数独立化
2.2.4 変数増加法
2.2.5 変数増加法と変数減少法の利点と欠点
2.2.6 回帰モデルの使い分け
3.回帰モデルの解釈と機械学習の実践(90分)
3.1 回帰モデルの解釈
3.1.1 回帰係数の意味
3.1.2 変数選択の解釈
3.1.3 タカハシメソッドに基づく回帰モデルの応答分析
3.2 機械学習の実践
3.2.1 医薬品と材料データの特徴量 ~フィンガープリント・物性値・三次元立体構造・量子化学計算~
3.2.2 医薬品と材料データの機械学習・深層学習モデル
3.3.3 例題と演習(具体的なデータとプログラミングによる実演)
4.質疑応答(30分)
公開セミナーの次回開催予定
開催日
未定
開催場所
未定
受講料
未定
配布資料
・会場受講:製本資料を当日会場で配布
・アーカイブ配信受講:PDFデータ(配信開始日より主催者サイトのマイページJよりダウンロード可)
備考
※講義の録音・撮影はご遠慮ください。
※開催日の概ね1週間前を目安に、最少催行人数に達していない場合、セミナーを中止することがございます。
お申し込み方法
★下のセミナー参加申込ボタンより、必要事項をご記入の上お申し込みください。