【コンピュータビジョン編】2022年に読むべき「機械学習/ディープラーニングの最新論文」30選

【コンピュータビジョン編】2022年に読むべき「機械学習/ディープラーニングの最新論文」30選

スキルアップAI講師陣注目の最新論文を厳選してご紹介

 

はじめに

今回はコンピュータビジョン編として、生成モデル、画像認識や物体検出を中心に著名な国際会議に採択された最新論文を合計9本ご紹介いたします。著者実装が公開されているものは、その情報も併せてまとめました。論文は自動機械学習(AutoML)を専門としICMLなどのトップカンファレンスへの論文採択経験もある斉藤と、需要予測・異常検知など様々な分野で機械学習/ディープラーニングの産業応用に取り組んできた小縣が中心となってスキルアップAI講師陣にて厳選しました。ぜひ、今後の学びにご活用ください!

◆2022年に読むべき「機械学習/ディープラーニングの最新論文」30選の一覧はこちら
◆2021年に読むべき機械学習/ディープラーニングの最新論文「コンピュータビジョン編」に関する論文の解説はこちら

 

  • OpenGAN: Open-Set Recognition via Open Data Generation
    • 実装のURL:https://github.com/aimerykong/OpenGAN
    • ICCV2021ベストペーパー
    • 学習データに含まれるクラス以外の新たなクラスに対しても適切に予測と学習を行うタスクであるオープンセット認識の精度を向上させたOpen-GANを提案
    • open-vs-closed (未知クラス vs. 既知クラス)の分類をピクセルではなく、OTS (off-the-shelf) 特徴量(既存の多クラス分類器による特徴量)を用いている
    • 未知のクラスが含まれるオープンのデータセットの訓練を強化するために、敵対的に偽のオープンデータを合成


  • NeRF in the Wild: Neural Radiance Fields for Unconstrained Photo Collections
    • 実装のURL:なし
    • 異なる環境(天気、時間帯など)で撮影された入力画像であっても高い精度でニューラルネットワークベースのレンダリングを可能とする NeRF-W を提案
    • 画像内の要素を対象物体とそれ以外に映り込んだ物体(人など)に分解することで、写り込みの多い画像からでもレンダリング可能としている



  • Pay Attention to MLPs
    • 実装のURL:なし
    • MLPをベースにし、Attentionの代わりにゲート機構を採用したネットワーク構造「gMLP」を提案
    • gMLPが同等の性能を発揮したことから、Self-AttentionがVision Transformerにおいて性能向上にクリティカルな要素ではないことを示している

  • Exploring simple siamese representation learning
    • 実装のURL:https://github.com/facebookresearch/simsiam
    • 画像における教師なし表現学習手法であるSiamese Networkの改良手法「Simple Siamese Network」を提案
    • Siamese Networkが自明解を出力してしまう”collapsing”を、反復最適化中のパラメータの更新を停止するstop-gradientを用いて解決
    • 一方で、stop-gradientがSiamese Networkに効果的である理由は不明で、本稿ではEMアルゴリズムを用いた仮説を立てている


  • Transformation Driven Visual Reasoning
    • 実装のURL:https://hongxin2019.github.io/TVR/
    • Visual Reasoningにおける新たなデータセットTRANCEを提案
    • 既存のデータセットであるCLEVRでは、初期状態から推論を行うState Drivenで行われていたが、本論文では、初期状態と最終状態から、その過程を推論するTransformation Drivenで行うことを提案
    • 現在のVisual Reasoningの手法では、初期状態と最終状態を結ぶシングルステップの過程の推論は高い精度で達成しているが、マルチステップの推論では人間の知能には遠く及ばないことが実験で示されている

 

次回予告

次回は「自然言語処理編」に関する最新論文を紹介します!ご期待ください!

スキルアップAIでは、画像認識や物体認識、それらを理解するために必要な深層学習の基礎を学ぶ「現場で使えるディープラーニング基礎講座」を開講しています。また、様々なGANを学ぶ「GAN(敵対的生成ネットワーク)講座」も開講中です。ぜひご検討ください。

また、スキルアップAI技術ブログでは
2020年時点で最も注目される生成モデル
人の認知が組み込まれたGAN -HumanGAN-
などGANに関連する最新論文の解説も行っております。

また、弊社がリリースする論文検索アプリ「ScholarPlanets」もぜひご活用ください。実際にアプリを用いてGANの研究を調査したブログも公開しています。
研究論文の引用関係を可視化するツールを用いて、GANの研究を調査してみた
こちらも併せてご覧ください。

◆2022年に読むべき「機械学習/ディープラーニングの最新論文」30選の一覧はこちら
◆第2回:「自然言語処理編」に関する論文の解説はこちら
◆第3回:「強化学習編」に関する論文の解説はこちら
◆第4回:「実務応用編」に関する論文の解説はこちら
◆2021年に読むべき機械学習/ディープラーニングの最新論文「コンピュータビジョン編」に関する論文の解説はこちら

スキルアップAIのメールマガジンでは会社のお知らせや講座に関するお得な情報を配信しています。
配信を希望される方はこちら

また、SNSでも様々なコンテンツをお届けしています。興味を持った方は是非チェックしてください♪
  • Twitter
  • Facebook
  • LinkedIn
更新日:2022.04.26

関連する講座

Page Top