機械学習モデルの作成において、データ収集は量を重視し、性能改善はモデルの選択・ハイパーパラメータ調整で行うことが一般的です。しかし、2021 年に世界的な AI 研究者である Andrew Ng 氏は、外観検査プロジェクトにおける実例を踏まえながら、モデルの改善よりも、誤ったアノテーションの修正をはじめとしたデータの改善に注力すべきというスピーチを行いました。
以降、データの品質を改善を中心に行う AI 開発手法は「データセントリックAI」と呼ばれるようになり、これまでにデータ改善コンペディションの実施やトップカンファレンス NeurIPS におけるワークショップの開催など、データセントリックAIへの注目度は年々高まりつつあります。
今回のスキルアップAIキャンプでは、データセントリックAIの考え方とアノテーションの誤りを見つける有望な方法である Confident Learning の概要および実装方法をご紹介します。
プログラム概要
- データセントリック AI とは?
- データセントリック AI の活用事例
- Confident Learning|アノテーションの誤りを見つける
- Confident Learning を実装するための Python ライブラリ
- ハンズオン|Cleanlab による Confident learning の実装
※一部変更となる場合がございます。
スピーカー
-
スキルアップAI株式会社/斉藤 翔汰
スキルアップAI講師。横浜国立大学大学院 環境情報学府 情報メディア環境学専攻(現:情報環境専攻)修了。修士(情報学)。高専時代に画像認識に対して興味を持ったことがきっかけで、現在はDeep Learningや機械学習、進化計算などの人工知能分野におけるアルゴリズムの研究開発やコンサルティングに従事。日本ディープラーニング協会の2018年度・2019年度E資格合格者、2018年度G検定合格者。著書「徹底攻略ディープラーニングE資格エンジニア問題集」(インプレス)。
開催概要
日時
2023年6月7日(水)19:30~21:00
開催方法
Zoom
参加費
無料
※競合他社様のご参加は、ご遠慮いただいておりますので、ご了承ください。