自然言語処理の導入と研究開発への活用【提携セミナー】

自然言語処理の導入と研究開発への活用【提携セミナー】

このセミナーは終了しました。次回の開催は未定です。

おすすめのセミナー情報

開催日時 2023年7月31日(月)10:30~16:30
担当講師

向田 志保 氏
安藤 俊幸 氏
吉武 道子 氏

開催場所

Zoomによるオンライン受講

定員 30名
受講費 60,500円(税込)

★ マテリアルズインフォマティクス実現へ向けて!

★ 自然言語処理の選び方、使い方とその活用、課題を基礎から徹底解説!

 

自然言語処理の導入と研究開発への活用

 

【提携セミナー】

主催:株式会社技術情報協会

 


 

講座内容

ChatGPTの登場により、世の中の根底を変える勢いで急速にAI環境が変化している。今後業務利用が拡大し、R&D分野でも情報抽出などでの活用が進んでいくことが想定される。本講座では、自然言語処理の基礎知識から始まり、オープンソースのノーコードツールによる解析事例、並びにBERTやGPTといった大規模言語モデルの活用展開について述べる。

 

最初に特許調査とテキストマイニングの基礎について概観します。各種ツールのテキストマイニング関連機能の活用事例を紹介します。テキストマイニングの特許調査への応用事例を単語・文書のベクトル化、文書分類、文書ベクトルの次元圧縮による特許公報の俯瞰可視化と技術動向調査への応用を紹介します。調査目的に応じたツール・アルゴリズム・特徴量の選択が重要であり、ツールの特徴を把握して使いこなすことが大事です。最近の大規模言語モデルを使ったAI(GPT、BERT等)とテキストマイニングを連携させることの利点と課題についても紹介します。

 

材料科学分野で自然言語処理技術を利用してどのようなことができるのか、やりたいことを実現するのにどの種類の技術を用いればよいのか、市販ツールがどのような技術を用いているのか、市販ツールを自社カスタマイズする発注の際に言語モデル的に注意すべき点、今後どのようなことができるようになると期待されるか。

 

習得できる知識

  • 自然言語処理の基礎知識
  • ノーコードツールなどを用いた基礎的なテキスト分析
  • 生成系AI(ChatGPT等)の活用の仕方
  • テキストマイニングの基礎知識と特許調査への応用ポイント
  • テキストマイニングによる特許情報の解析と利用
  • 先行技術調査の重要性とテキストマイニングがその中で果たす役割
  • テキストマイニング・AI特許調査ツールの活用事例
  • 大規模言語モデルAIとテキストマイニングを連携させることの利点と課題
  • 自然言語処理技術の種類による活用法の違い
  • 材料関連分野の文書の種類による言語処理技術活用の違い
  • 統計処理(深層学習を含む)言語処理の特徴と活用における注意点
  • 文法をベースにした言語処理の特徴と活用

 

担当講師

【第1部】三井化学(株) DX推進本部 DX企画管理部 博士(工学)向田 志保 氏

 

【第2部】アジア特許情報研究会 知財情報解析チーム/ 花王(株) 研究開発部門 研究戦略・企画部 研究員 安藤 俊幸 氏

 

【第3部】(国研)物質・材料研究機構 NIMS特別研究員・NIMS名誉研究員 博士(工学)吉武 道子 氏

 

セミナープログラム(予定)

(10:30-12:10)
「自然言語処理の導入とR&D活動の効率化」
三井化学(株) DX推進本部 DX企画管理部 博士(工学)向田 志保 氏

 

1.自然言語処理の基礎知識

 

2.文書の分類/判定の進め方
2.1 古典的手法
2.2 BERT

 

3.文章生成の汎用的な大規模言語モデル
3.1 大規模言語モデル
3.2 GPT-3の登場
3.3 ChatGPT
3.4 プロンプトエンジニアリング
3.5 生成AIのガイドライン
3.6 文章生成の汎用的な大規模言語モデルの活用

 

4.自然言語処理のR&D活動への活用事例
4.1 R&Dにおける自然言語処理の活用事例、よくあるケース
4.2 特許調査・分類
4.3 AIを用いた新規用途・材料探索
4.4 生物・化学分野における大規模言語モデルの活用

 

5.自然言語処理ツールの活用
5.1 オープンソース(KHCoderなど)
5.2 クラウドサービス

 

6.自然言語処理のさらなる応用、今後の展望

————————————————————————-

 

(13:00-14:40)
「テキストマイニングによる特許情報解析、先行技術調査への活用」
アジア特許情報研究会 知財情報解析チーム/ 花王(株) 研究開発部門 研究戦略・企画部 研究員 安藤 俊幸 氏

 

1.はじめに 講師自己紹介 アジア特許情報研究会紹介

 

2.特許調査とテキストマイニングの基礎
2.1 調査対象と調査範囲の特定・明確化
2.2 マッチングと適合
2.3 特許調査における再現率(網羅性)と適合率(効率)
2.4 「完全一致」⇔「最良一致」検索モデルの比較
2.5 検索・分類とテキストマイニングの違い
2.6 テキストマイニングの基本的な仕組み

 

3.テキストマイニングの概要と特許調査への応用
3.1 商用特許調査ツールのテキストマイニング応用機能
3.2 商用・フリーのテキストマイニングツール

 

4.テキストマイニング・AI特許調査ツールの活用事例
4.1 特許調査ツールへの要求性能
4.2 現時点でできること/できないこと、性能レベルなど
4.3 商用AI特許調査ツールの活用事例
4.4 特許のトレンド分析、競合分析、技術の発展パターン分析

 

5.テキストマイニングと大規模言語モデルAI(GPT、BERT等)との連携
5.1 自然言語理解能力の向上
5.2 大量データの効率的な分析
5.3 自動化された情報抽出
5. 4 洞察の視覚化
5. 5大規模言語モデルとの連携時の課題

 

6.参考文献

————————————————————————-

 

(14:40-16:30)
「材料科学分野における言語処理技術の応用展望」
(国研)物質・材料研究機構 NIMS特別研究員・NIMS名誉研究員 博士(工学)吉武 道子 氏

 

1.概観
1.1 マテリアルズインフォマティクス
物性値、分子構造、結晶構造、化学構造式、物性名、数式、自然言語
1.2 対象とする文書の種類と特徴
論文、特許、書籍、安全・規制に関わる法的文書、社内文書
1.3 求められる処理の種類と特徴
文書分類、検索(目的文書の抽出)、情報の抽出(文中の特定情報の抽出)

 

2.言語処理の種類と活用
2.1 統計処理ベース(深層学習を含む)
・TF-IDE、N-gramなど
・単語ベクトル:Word2Vec、Doc2Vec
・BERT:pre-trainingとfine-tuning
・ChatGPT
2.2 文法ベース
・品詞解析
・構文解析/照応解析
2.3 材料関連分野に特化したモデル
a)様々なモデル
Word2Vec系:Mat2Vec
BERT系:SciBERT、BioBERT、BatteryBERT、MatSciBERT、MatBERT、MaterialBERT
b)モデル利用時の注意点
学習データ、単語辞書、モデル計算(初めからor代入?)、学習条件、検証のデータ

 

3.NIMSでの活用事例
3.1 超電導データベース
3.2 PoLyInfoデータベース
3.3 マテリアルキュレーション支援システム

 

4.テキストと数値データの関連付け

 

公開セミナーの次回開催予定

開催日

2023年7月31日(月)10:30~16:30

 

開催場所

Zoomによるオンライン受講

 

受講料

1名につき60,500円(消費税込・資料付)
〔1社2名以上同時申込の場合1名につき55,000円(税込)〕

 

技術情報協会主催セミナー 受講にあたってのご案内

 

備考

資料は事前に紙で郵送いたします。

 

お申し込み方法

★下のセミナー参加申込ボタンより、必要事項をご記入の上お申し込みください。

 

お申込後はキャンセルできませんのでご注意ください。

※申し込み人数が開催人数に満たない場合など、状況により中止させていただくことがございます。

 

おすすめのセミナー情報

製造業eラーニングTech e-L講座リスト

製造業向けeラーニングライブラリ

アイアール技術者教育研究所の講師紹介

製造業の新入社員教育サービス

技術者育成プログラム策定の無料相談受付中

スモールステップ・スパイラル型の技術者教育

技術の超キホン

機械設計マスターへの道

生産技術のツボ

早わかり電気回路・電子回路

早わかり電気回路・電子回路

品質保証塾

機械製図道場

スぺシャルコンテンツ
Special Contents

導入・活用事例

テキスト/教材の制作・販売