Article de reference

LogSumExp

La fonction LogSumExp (LSE) (également appelée RealSoftMax ou softplus multivariable ) est un maximum lissé – une approximation lisse de la fonction maximum , principalement uti...

fonction LogSumExp (LSE) (également appelée RealSoftMax ou softplus multivariable ) est un maximum lissé – une approximation lisse de la fonction maximum , principalement utilisée par les algorithmes d'apprentissage automatique . Elle est définie comme le logarithme de la somme des exponentielles des arguments :

Le domaine de la fonction LogSumExp est , l' espace des coordonnées réelles , et son codomaine est , la droite réelle . C'est une approximation du maximum avec les bornes suivantes : La première inégalité est stricte sauf si . La seconde inégalité est stricte sauf si tous les arguments sont égaux. (Démonstration : Soit . Alors . L'application du logarithme à l'inégalité donne le résultat.)

Astuce log-sum-exp pour les calculs dans le domaine logarithmique

La fonction LSE est souvent rencontrée lorsque les calculs arithmétiques habituels sont effectués sur une échelle logarithmique , comme dans la log-probabilité .

De même que les opérations de multiplication en échelle linéaire deviennent de simples additions en échelle logarithmique, une opération d'addition en échelle linéaire devient l'estimateur des moindres carrés en échelle logarithmique :

Malheureusement, l'utilisation directe de la méthode des moindres carrés dans ce cas peut à nouveau entraîner des problèmes de dépassement de capacité. Par conséquent, il convient d'utiliser la méthode équivalente suivante (en particulier lorsque la précision de l'approximation « max » ci-dessus est insuffisante).

De nombreuses bibliothèques mathématiques telles que IT++ fournissent une routine par défaut pour l'estimateur LSE et utilisent cette formule en interne.

Une fonction de type log-somme-exp strictement convexe

La fonction LSE est convexe mais pas strictement convexe. On peut définir une fonction de type log-somme-exp strictement convexe en ajoutant un argument supplémentaire initialisé à zéro :

En analyse tropicale , il s'agit de la somme dans le semi-anneau logarithmique .