現場で使える自然言語処理基礎

現場で使える自然言語処理基礎

深層学習による自然言語処理に至るまでの歴史を概観し、最重要技術をPythonによる実装を通じて理解する。

スマートスピーカーの普及や音声認識の精度向上など、ディープラーニングに基づく自然言語処理(NLP)による様々なタスクでの実用レベルの達成を受けて、自然言語処理のビジネス活用の機運が高まっています。

しかし、これらの実用レベルの達成がGAFAをはじめとしたビックテックによって行われてきた一方、大量のテキスト情報を有する個社レベルにおいては、自然言語処理の技術が十分に理解・活用されているとは言えない状況です。

そこで本講座では、伝統的な手法から最先端手法(word2vec,RNN,Transfomer,BERT)までを幅広く取り上げ、それらに共通する昨今の自然言語処理の核となる考え方を解説、様々な立場で仕事で役立つ自然言語処理の考え方を身に付けることを目的としています。

講座は2パートで構成されています。
基礎編では、様々な手法に共通する「離散的である単語列をベクトル空間に埋め込み、自然言語の意味計算を行う」と言った、昨今の自然言語処理の核となる考え方を解説し、ハンズオンでそれぞれの概念の理解を試みます。

実践編では、より理解を深めるため、理論と合わせてPython、Pytorchによる主要技術の実装も合わせて詳説していきます。さらに、ビジネスへの応用を想定した実践的な課題を用い、これらの理論と実装に関するスキルを実務へ応用できる力も身に付けていただけます。
※実践編は2020年5月頃に開講予定。

講座の特長

  • 時代やタスクに依らない普遍的な自然言語処理の考え方を習得
  • 教科書にはない最新フレームワークを活用した実装スキルをハンズオンでマスター
  • NLP開発経験豊富な現場のスペシャリストが講師

前提知識の目安

【必須】

【推奨】

受講対象者

  • 自然言語処理(NLP)の根本理念を理解したい方
  • シンプルな自然言語処理タスクの現代的な解法とその特徴を俯瞰したい方
  • 自然言語処理系エンジニアとの会話を必要とする方

講座ゴール

  • 自然言語処理の根本の考え方を理解し、新しい技術を自らキャッチアップできるようになる
  • 仕事で必要とされる基本的な自然言語処理タスクの実装スキルを身に付ける

講座概要

講座名 現場で使える自然言語処理基礎
講座時間 6時間
料金 ¥30,000/1名(税別)
定員(対面) 25名(最少催行人数10名)
コンテンツ

■対面講座:
①対面講義 ②教材

■オンライン講座:
①学習用動画 ②教材

カリキュラム

NLPとは

  • NLPのタスク
  • NLPの困難と現代的手法
  • ビジネスへの応用例
  • この講座でやること/やらないこと

デモ用データセット: livedoorニュースコーパス

  • 概要説明
  • [Notebook] データのダウンロードと下準備
  • [Notebook] EDA

形態素解析

  • 概要/理論
  • 実装上のツール

Bag of Words

  • 概要説明
  • [Notebook] BagOfWordsを利用したモデルの実装

PyTorch

  • [Notebook] PyTorchチュートリアル
  • [Notebook] torchtextチュートリアル
  • [Notebook] PyTorchを用いてBagOfWordsモデル実装

Word2Vec

  • 概要説明
  • [Notebook] Word2Vecを触ってみる
  • [Notebook] Word2Vecを利用したモデルの実装

BERT

  • 概要
   - Tokenizer
   - Model Architecture
   - BERT BASEとBERT LARGE
   - Pre-training
  • 背景
  • 応用
  • [Notebook] 訓練済みBERTモデルを触ってみる
  • [Notebook] 訓練済みBERTモデルを用いたモデル実装

GCP AutoML

  • 現在できること
  • 応用

 

※カリキュラムは変更となる場合がございます。

開催日程

基礎編 東京 第2期 につきましては、対面講座の開催を中止し
ライブ配信or撮影動画で対応させていただくことになりました。
詳しくはこちらを参照ください。
【重要なお知らせ】新型コロナウィルスの感染拡大に伴う対応

東京オンライン

基礎編 東京 第1期 ※募集終了

2/23(日)10:00 〜 17:00
講師:松田 亮

基礎編 東京 第2期 ※募集終了

3/14(土)10:00 〜 17:00
講師:松田 亮

場所:スキルアップAI 水道橋オフィス
東京都千代田区神田三崎町3-3-20 VORT水道橋Ⅱ 5階

オンライン講座

随時お申し込み受付中です。お支払い確認後、3営業日以内に講義動画の視聴方法をご案内いたします。
※動画視聴期限は、動画共有日から3ヶ月間となります。

講師紹介

    • 松田 亮

      松田 亮

      東京大学理学部物理学科卒。東京大学大学院理学系研究科物理学専攻博士課程修了。Kaggleマスター。現在は多サービスを提供する企業にて主に機械学習システムの開発を行う。画像・自然言語処理を用いたデータ分析・生成系プロジェクトに取り組んでいる。

ご案内

PCの動作環境

MacOSX 10.9 以上
Windows 7 以上(64bit必須)
メモリ4GB以上
※4GB未満でも受講して頂くことは可能ですが、大きなデータを扱う演習の際に不具合が発生する可能性があります。
メモリ不足が原因の不具合についてはサポートすることができませんので、あらかじめご了承ください。

事前準備

Docker、docker-composeをインストールし、
“docker version” と “docker-compose version” が動くことを確認しておいてください。

※基本的なdockerの使い方の知識が推奨ですが、必須ではありません。

当日の持ち物

ご自身のノートPC
※Wi-Fi環境はございますが、繋がりにくい場合はご自身のテザリングをご利用ください。

会場への入場

講座開始の10分前

よくあるご質問

申込締切はいつですか?

開催日の3日前までです。3日前までに、お支払い済みである事が確認できている必要があります。

領収書・請求書などの発行は可能ですか?

はい、可能ですので、お申し込み時の備考にその旨と宛名をご記入ください。但し、クレジットカード(Paypal)でお支払いの場合、PayPal発行の受領書が領収書となりますので、領収書の発行はできません。

関連する講座

Page Top
お申し込みはこちら