現場で使える自然言語処理 実践講座

現場で使える自然言語処理 実践講座

ディープラーニング活用に至るまでのNLPの歴史を概観し、重要技術をPythonによる実装を通して理解する

実践講座では、理論の説明と合わせて、Python/Pytorchによる主要技術の実装も行います。さらに、ビジネスへの応用を想定した実践的な課題を通し、理論を実務へ応用できるスキルも身に付けます。

講座で得られるスキル

  • 様々なNLPタスクに対応可能な知識が身に付く

    形態素解析や Word2Vec などの汎用性の高い前処理を理論から理解し、正しく利用することができるようになる

  • ディープラーニングを用いた最先端のNLPの手法が分かる

    Attention や BERT といった最新のモデルを理解し、実務で扱う種々のタスクに活用することができる

  • PyTorch を用いたハンズオンで、実務で役立つ実装スキルが身に付く

    利便性と広範性を両立したニューラルネットワークのライブラリである PyTorch の利用法をハンズオンによって体得し、様々なモデルの実装ができるようになる

受講に必要なスキル

必須スキル

 

推奨スキル

 

講座の特長

  • ハンズオンの通し課題を通じて、理論から実装までのNLP実装スキルを体得
  • 数式の丁寧な解説によって自然言語処理の各手法を徹底解剖
  • NLP開発経験豊富な現場のスペシャリストが講師

講座概要

講座名 現場で使える自然言語処理実践講座
講座時間 16時間(4日×4時間)
料金

■対面講座:¥248,000/1名(税別)
■オンライン講座:¥218,000/1名(税別)

※基礎講座を申込済みの方には、ディスカウントを適用させていただきます。

料金に標準で含まれるもの

■対面講座:
①対面講義 ②講義資料 ③通し課題の最終発表に対するコメント

■オンライン講座:
①対面講義の撮影動画 ②講義資料
③通し課題の最終発表に対するコメント(講師と個別ビデオチャットで実施)

定員 25名(最少催行人数10名)

 

カリキュラム

DAY1DAY2DAY3DAY4

DAY1

 ●通し課題に関する説明

・日本語のニュースカテゴリ分類のデータセットである Livedoor ニュースコーパスに対して、できるだけ高性能な文書分類のモデルを講座期間中を通して実装する

 ●自然言語処理とは

・自然言語処理に分類される様々なタスクやその技術的な難しさを身近な例を用いてわかりやすく学ぶ
・自然言語処理におけるデータセットの構造の例をハンズオンによって俯瞰する

 ●形態素解析

・日本語を含む言語において必須の前処理である形態素解析を理論と例の両面から学ぶ
・日本語文形態素解析のスタンダードの一つである MeCab の利用法をハンズオンによって学ぶ

 ●Bag of Words(BoW)

・自然言語の文や文章から最も基本的な特徴量である BoW を作成する方法を学ぶ
・BoW と簡単な機械学習モデルを利用した文書分類をハンズオンによって実践する

DAY2

 ●PyTorch

・ニューラルネットワークのライブラリである PyTorch の利用法をハンズオンによって学ぶ
・PyTorch を利用し、BoW と簡単なニューラルネットワークを用いた文書分類をハンズオンによって実践する

 ●Word2Vec

・BoW よりも高度な特徴量として一般的である Word2Vec の構築法について、その概要を学ぶ
・Word2Vec を利用した文書分類をハンズオンによって実践する

 ●Google Cloud Platform を用いた GPU 環境の構築

・現代的なモデルの学習に必須である GPU 環境をGoogle Cloud Platform 上で構築するハンズオンを行う

DAY3

 ●自然言語処理における Recurrent Neural Network(RNN)

・単語の順序を考慮したモデリングのために RNN を導入し、その概要と派生モデルについて学ぶ
・PyTorch を利用して、RNN による文書分類をハンズオンによって実践する

 ●Sequence to sequence(seq2seq)と attention

・機械翻訳や質問応答のタスクにてしばしば用いられる attention を導入した seq2seq についてその概要を学ぶ

DAY4

 ●言語モデル

・種々の自然言語処理のモデルの一般化として言語モデルを学び、Transformer を理解するための準備を行う
・いくつかの言語モデルの例を俯瞰し、言語モデル、ひいては翻訳モデルとは何かを直感的に理解する

 ●Transformer

・自然言語処理における最新のモデリングのベースとなる Transformer の構造を理解する

 ●BERT

・Transformer を利用した高性能な汎用言語モデルである BERT についてその構造と利用法を学ぶ
・訓練済み BERT を利用した文書分類をハンズオンによって実践し、その性能を体感する

 ●AutoML

・データの典型的な前処理や機械学習モデルの構築の自動化を行う AutoML についてその概略を学ぶ

 ●課題発表

・通し課題の取り組み内容について共有し実務に役立つ知見を体得する

※カリキュラムは変更となる場合がございます。

開催日程

対面・オンライン

東京 第1期 

8月~9月週末で日程調整中

講師紹介

  • 松田 亮

    松田 亮

    東京大学理学部物理学科卒。東京大学大学院理学系研究科物理学専攻博士課程修了。Kaggleマスター。現在は多サービスを提供する企業にて主に機械学習システムの開発を行う。画像・自然言語処理を用いたデータ分析・生成系プロジェクトに取り組んでいる。

ご案内

PCの動作環境

・Docker Desktop(https://www.docker.com/products/docker-desktop)が動作可能なもの
・MacOSX 10.13 (High Sierra) 以上
・Windows 10 Professional あるいは Enterprise (64bit必須)
・メモリ8GB以上必須
※8GB未満でも受講して頂くことは可能ですが、大きなデータを扱う演習の際に不具合が発生する可能性があります。 メモリ不足が原因の不具合についてはサポートすることができませんので、あらかじめご了承ください。
※容量の大きなデータを課題で扱いますので、より高スペックが望ましいです。

 

事前準備

Docker Desktopをインストールし、dockerに関する各種コマンド類を実行できる状態まで準備をお願いいたします。 *Docker Desktopのインストールは下記ご参照ください
【Mac】
公式リファレンス[英語]:こちら
有志によるまとめ記事[日本語]:こちら
【Windows】
公式リファレンス[英語]:こちら
有志によるまとめ記事[日本語]:こちら 
【Mac / Windows 共通】
インストール後にはWindows Powershellかターミナルにて、2つのコマンド `docker run hello-world` `docker run -it ubuntu ls` を実行し、ubuntuのlsコマンド(ファイル一覧表示)が実行できることを確認するようにお願いいたします。
※各自で必ず当日までに環境構築をお願いいたします。環境構築等でご不明な点等あれば、事前にご連絡いただければご案内します。
※その他に必要なご準備に関しては、お申し込み後にご案内いたします。

 

当日の持ち物

ご自身のノートPC
※Wi-Fi環境はございますが、 繋がりにくい場合はご自身のテザリングをご利用ください。

会場への入場

講座開始の10分前

関連する講座

Page Top
お申し込みはこちら