論文モチベーション
- CTR予測モデルの学習を考察対象にしつつ、段階的な分布シフトを伴う時系列データへの対処の問題として枠組みを定式化。具体的には、概念ドリフトへのエンドツーエンドの適応のための新しいトレーニングフレームワーク、スロー&ファストトラジェクトリラーニング(SFTL)を提案しています。
この方法は、時間を一定期間で区分している単位でドメインに対して、次の時間ドメインでの将来のパフォーマンスを最大化することを通して、メインの学習モデルのネットワークのロバストな特徴学習をまず行い、そこで得た学習パラメータから、ヒストリカルなパラメータ値の平滑化を行って、時系列的なものを考慮しているトラジェクトリネットワークの効率的な学習を実現しようとしています。
- 実験では、データセット全体をランダムにシャッフルする代わりに、逐次トレーニングを使用して時間的ドリフトに適応的に学習することを提案しています。さらに、提案手法の一般化ギャップの理論的理解を提供しまていますが、ここはあまり理解できていません。実世界のCTRデータセットを用いた実験から、SFTLフレームワークの有効性が示唆されています。
数式
通常のERM(Empirical risk minimization)の枠組み
過去の全てのデータを利用して学習し、Dt+1を予測しにいく
状態空間モデルでt-1時刻までのパラメータからt時刻のパラメータが生成されているとして
逐次的にもとめていくあり方
スロートラジェクトリーラーナーのパラメータは購買降下法で学習するワーキングラーナーのパラメータ重みの直接的な重み割りあてで更新しているが、アルゴリズムからわかるように結果として時間ドメインごとにスローラーナーは一時刻前におけるワーキングラーナーの重みパラメータを保持している
ファストラーナーの更新はαをハイパーパラメータとして調整しながら更新している
ワーキングラーナーの方が性能がよくなるようにロジスティック損失をとっている。