説明ベース最適化の論文をarXivで公開しました

Yuya Yoshikawa, Tomoharu Iwata, “Explanation-Based Training with Differentiable Insertion/Deletion Metric-Aware Regularizers.” arXiv [cs.LG], Oct. 2023, https://arxiv.org/abs/2310.12553. arXiv.

予測に対する説明の品質は、説明の忠実性、すなわち、説明が予測モデルの振る舞いをどれだけ正しく反映しているかで評価されることが多いです。説明の忠実性を定量評価するために、画像に対しては挿入(Insertion)・削除(Deletion)メトリクスがよく用いられます。この研究では、微分可能な挿入・削除メトリクスを導入し、これを正則化に利用することで、説明器が忠実な説明を出力できるように予測モデルを最適化する方法を提案しました。

本研究は、NTTコミュニケーション科学基礎研究所の岩田具治さんとの共同研究です。