パラメータチューニングについての良い日本語サーベイ論文

仕事上、機械学習に関して技術的な助言をする機会が多いが、パラメータチューニングの類型や使い所、その効果について聞かれることは多い。英語文献であればいくらでも選択肢はあるが、SE出身で機械学習に慣れていないような人であれば、英語は読めても文献を探す事に慣れていない。日本語の良いサーベイ論文は少ないが、以下は非常に内容が良く、今後しばらくは以下の論文を勧めようと思っている。

尾崎嘉彦, 野村将寛, and 大西正輝. “機械学習におけるハイパパラメータ最適化手法: 概要と特徴.” 電子情報通信学会論文誌 D 103.9 (2020): 615-631.

論文では、パラメータチューニング(論文の表記ではハイパパラメータ最適化手法)に望まれる性質を、

  1. 目的関数評価から得られる情報を活用する.
  2. 並列化に適する.
  3. 複雑な探索空間を扱える.
  4. LED(Low Effective Dimensionality)に強い.
  5. 目的関数評価の不確実性を扱える.

と整理した上で、最適化手法のうち、ブラックボックス最適化については、

  • グリッドサーチ
  • ランダムサーチ
  • ベイズ最適化(GP-EI: Gaussian Process Expected Improvementなど)
  • 進化計算(GA: Genetic Algorithmなど)
  • Nelder-Mead法

の節に分けて全部で8種類の手法について、前記の性質がどの程度満たされているかが比較されている。

また最近のトレンドのグレーボックス最適化については、

  • データセットのサブサンプリング
  • 学習の早期打ち切り
  • ウォームスタート

について比較されている。

更に、最適化手法の選択について、

  • 逐次評価回数の上限値
  • 並列計算リソース
  • ハイパパラメータの種類

の条件ごとに、一般的によく使われる最適化手法も整理されている。

つまり、代表的な最適化手法とその特徴が最近のトレンドまで含めて整理されている上、実務上問題となりやすい選択方法についての指針も整理されており、サーベイ論文としては申し分ない内容となっている。

About HAL

金融・マーケティング分野の機械学習システム開発や導入支援が専門。SlofiAでは主に海外情勢に関する記事、金融工学や機械学習に関する記事を担当。

View all posts by HAL →