機械学習のためのデータ前処理の基本と実践法[Google Colabを用いたPC演習付]【提携セミナー】
おすすめのセミナー情報
開催日時 | 2023/3/17(金) 10:30~16:30 |
---|---|
担当講師 | 松本 和幸 氏 |
開催場所 | Live配信セミナー(会社・自宅にいながら受講可能) |
定員 | - |
受講費 | 通常申込:49,500円 E-Mail案内登録価格: 46,970円 |
機械学習のためのデータ前処理の基本と実践法
[Google Colabを用いたPC演習付]
《数値・テキスト・画像・音声データの前処理法、最新技術の調べ方など》
《演習を通して扱いにくい実データを上手く処理する術を学ぶ》
【提携セミナー】
主催:サイエンス&テクノロジー株式会社
受講可能な形式:【Live配信(アーカイブ配信付)】のみ
実践的な前処理技術の習得を目的としたセミナーです!
データ前処理の基礎、高度な前処理、自然言語・画像・音声におけるすぐに使える前処理技術、うまく対処できない時のための最新技術の調べ方のコツなどについて、演習とともに解説します。
■演習に関して■
本セミナーでは「Google Colab」を使用した演習を実施します。準備は講義中に説明しながら行います。
PCへの特別な設定は不要ですが、Googleアカウントの登録が必要となります。また、ご使用いただくPCはGoogle ChromeとGmailなどのChrome上のアプリが快適に動作する環境であれば問題ございません。Webブラウザからアクセスして使用しますので、通信状況が良好な環境でのご受講をお願いいたします。またPCは1台でご受講いただけます。
セミナー趣旨
本セミナーでは,人工知能やデータサイエンスにおけるデータ分析において欠かせない機械学習のためのデータの前処理技術についてレクチャー,実演する。また,自らGoogle Colab環境上でサンプルコードの実行を通して実践に応用可能な前処理技術の習得を目的としている。Google Colab上では一般的な数値計算および機械学習ライブラリに加え,GPUにより高速化できる深層学習フレームワークがあらかじめ導入されている。Google Drive上に学習データやモデルを保存でき,無料ではじめることができるため,機械学習用に計算機を準備するのが難しい初学者にはうってつけのツールである。
前半では数値データの前処理について扱うが,そのほとんどは,Kaggleで公開されているデータセットを使用する。これらのデータは,その多くが教科書向けのきれいな(機械学習で扱いやすい)データではないため,多くの場合,前処理技術を駆使しなければ思うような結果を導き出すことができない。このセミナーを通して機械学習に適した前処理技術を身につけることができれば,実際に収集した扱いにくいデータに対しても適切に対応できるようになるはずである。実用の際には,セミナーで紹介した前処理技法だけではうまく対処できないデータにも出くわすであろう。その際は,複数の前処理技術を組み合わせたり,最新の前処理技法を導入する必要も出てくるが,そんなときに役立つ各種技術の調査方法のコツなども一部紹介する。さらに,自然言語処理,画像処理,音声処理における基本的な前処理についても,すぐに使える技術を中心に解説する。
得られる知識
- GoogleColabを用いたデータ分析の知識
- Pythonを用いたデータの前処理の知識
- 数値,テキスト,画像,音声データの前処理の知識
受講対象
- Pythonを学び始めた方(基本的なプログラミングは既に習得していることが望ましい)でデータ分析をしてみたい方
- 手元に大量のデータがあり,機械学習を使って分析してみたい方
- Pythonによるプログラミング経験があり,人工知能やデータサイエンスに興味があるが,何から始めたらよいのかわからない方
- テキストマイニングやデータマイニングの手法を仕事に生かしたい方
- Pythonを使った機械学習関連の学術書やハウツー本を手にしてみたが,理解できずに挫折してしまったが,再度チャレンジしてみたい方
担当講師
徳島大学 大学院社会産業理工学研究部 准教授 博士(工学) 松本 和幸 氏
セミナープログラム(予定)
0.はじめに「AI・機械学習における前処理」
1.準備
1.1 Google Colabによる実行環境
1.2 NumPy,pandas
1.3 scikit-learn
1.4 matplotlib
1.5 Tensorflow,Keras
2.基本的な前処理
2.1 標準化と正規化
2.2 ビニング
2.3 外れ値・欠損値の扱い
3.特徴選択・次元削減と可視化
3.1 フィルタ法,ラッパ法,正則化
3.2 線形次元削減,非線形次元削減
4.高度な前処理
4.1 カテゴリカルデータから数値データへの変換
4.2 不均衡データの扱い
4.3 時系列データの扱い
5.テキストデータの前処理
5.1 分かち書きと形態素解析
5.2 ニューラルネットワークによる文書分類
6.画像データ,音声・音楽データにおける前処理
6.1 畳み込みニューラルネットワーク
6.2 データ拡張
6.3 ファインチューニング
6.4 音声・音楽データの前処理
□ 質疑応答□
公開セミナーの次回開催予定
開催日
2023年3月17日(金) 10:30~16:30
開催場所
Live配信セミナー(会社・自宅にいながら受講可能)
受講料
一般受講:本体45,000円+税4,500円
E-Mail案内登録価格:本体42,700円+税4,270円
E-Mail案内登録なら、2名同時申込みで1名分無料
2名で49,500円 (2名ともE-Mail案内登録必須/1名あたり定価半額24,750円)
※テレワーク応援キャンペーン(1名受講)【Live配信/WEBセミナー受講限定】
1名申込みの場合:受講料( 定価:39,600円/E-Mail案内登録価格 37,620円 )
定価:本体36,000円+税3,600円
E-Mail案内登録価格:本体34,200円+税3,420円
※1名様でLive配信/WEBセミナーを受講する場合、上記特別価格になります。
※お申込みフォームで【テレワーク応援キャンペーン】を選択のうえお申込みください。
※他の割引は併用できません。
★【S&T会員登録】と【E-Mail案内登録】の詳細についてはこちらをご参照ください。
※E-Mail案内登録をご希望の方は、申込みフォームのメッセージ本文欄に「E-Mail案内登録希望」と記載してください。ご登録いただくと、今回のお申込みからE-mail案内登録価格が適用されます。
配布資料
電子媒体(PDFデータ/印刷可)
- 弊社HPのマイページよりダウンロードいただきます。
- 開催2日前を目安に、ダウンロード可となります。
- ダウンロードには会員登録(無料)が必要となります。
備考
※講義中の録音・撮影はご遠慮ください。
※開催日の概ね1週間前を目安に、最少催行人数に達していない場合、セミナーを中止することがございます。
お申し込み方法
★下のセミナー参加申込ボタンより、必要事項をご記入の上お申し込みください。