Norme matricielle

En mathématiques, une norme matricielle est un cas particulier de norme vectorielle, sur un espace de matrices.

Dans ce qui suit, K désigne le corps des réels ou des complexes.

Définition

Certains auteurs[1] définissent une norme matricielle comme étant simplement une norme sur un espace vectoriel Mm,n(K) de matrices à m lignes et n colonnes à coefficients dans K.

Pour d'autres[2], une norme matricielle est seulement définie sur une algèbre Mn(K) de matrices carrées et est une norme d'algèbre, c'est-à-dire qu'elle est de plus sous-multiplicative.

Exemples de normes matricielles

Norme de Frobenius

La norme de Frobenius sur M m , n ( K ) {\displaystyle \mathrm {M} _{m,n}(K)} [3] est celle qui dérive du produit scalaire ou hermitien standard sur cet espace, à savoir

( A , B ) M m , n ( K ) 2 A , B = tr ( A B ) = tr ( B A ) {\displaystyle (A,B)\in \mathrm {M} _{m,n}(K)^{2}\mapsto \langle A,B\rangle =\operatorname {tr} (A^{*}B)=\operatorname {tr} (BA^{*})} ,

A {\displaystyle A^{*}} désigne la matrice adjointe de A {\displaystyle A} et tr {\displaystyle \operatorname {tr} } la trace. La norme de Frobenius est souvent notée

A F := ( tr A A ) 1 / 2 = ( tr A A ) 1 / 2 = 1 i m 1 j n | A i j | 2 {\displaystyle \|A\|_{F}:=(\operatorname {tr} A^{*}A)^{1/2}=(\operatorname {tr} AA^{*})^{1/2}={\sqrt {\sum _{1\leq i\leq m \atop 1\leq j\leq n}\left|A_{ij}\right|^{2}}}} .

C'est la norme euclidienne ou hermitienne standard de la matrice considérée comme une collection de m × n {\displaystyle m\times n} scalaires.

Si K = R {\displaystyle K=\mathbb {R} } , le point de vue précédent permet d'en déduire le sous-différentiel de la norme de Frobenius, qui s'écrit en A M m , n ( R ) {\displaystyle A\in \mathrm {M} _{m,n}(\mathbb {R} )}  :

( F ) ( A ) = { B M m , n ( K ) B F 1 ,   B , A = A F } {\displaystyle \partial (\|\cdot \|_{F})(A)=\{B\in M_{m,n}(K)\mid \|B\|_{F}\leq 1,~\langle B,A\rangle =\|A\|_{F}\}} .

En réalité, F {\displaystyle \|\cdot \|_{F}} est différentiable sauf en zéro où ( F ) ( 0 ) {\displaystyle \partial (\|\cdot \|_{F})(0)} est la boule unité pour la norme de Frobenius.

La norme de Frobenius n'est pas une norme subordonnée, parce que I n F = n {\displaystyle \|I_{n}\|_{F}={\sqrt {n}}} (on a noté I n {\displaystyle I_{n}} l'opérateur identité sur R n {\displaystyle \mathbb {R} ^{n}} ), mais c'est une norme sous-multiplicative : A B F A F B F {\displaystyle \|AB\|_{F}\leqslant \|A\|_{F}\,\|B\|_{F}} .

La norme de Frobenius peut s'étendre à un espace hilbertien (de dimension infinie) ; on parle alors de norme de Hilbert-Schmidt ou encore norme 2 de Schatten.

Normes d'opérateur

On peut aussi voir une matrice A ∈ Mm,n(K) comme un opérateur linéaire de Kn dans Km et lui associer différents types de normes d'opérateur, à partir des normes utilisées sur Kn et Km. Par exemple, si l'on munit Km de la norme p et Kn de la norme q (avec p, q[1, ∞]), on obtient la norme d'opérateur

A p , q := sup x q 1 A x p {\displaystyle \|A\|_{p,q}:=\sup _{\|x\|_{q}\leqslant 1}\;\|Ax\|_{p}} .

En particulier, on note parfois

A := A 2 , 2 {\displaystyle \|A\|:=\|A\|_{2,2}} ,

que l'on appelle parfois la norme spectrale ou encore norme de Schatten.

Norme nucléaire

La norme duale de la norme spectrale {\displaystyle \|\cdot \|} pour le produit scalaire ou hermitien standard de Mm,n(K), notée et définie par

A := sup B 1 | A , B | {\displaystyle \|A\|_{*}:=\sup _{\|B\|\leqslant 1}\;\left|\langle A,B\rangle \right|} ,

porte différents noms : norme nucléaire ou norme de Ky Fan ou encore norme 1 de Schatten.

Normes de Schatten

La norme p de Schatten (de), due à Robert Schatten, est définie en A ∈ Mm,n(K) par

A σ p := σ ( A ) p {\displaystyle \|A\|_{\sigma _{p}}:=\|\sigma (A)\|_{p}} ,

σ ( A ) {\displaystyle \sigma (A)} est le vecteur des valeurs singulières de A {\displaystyle A} . Ces normes ont un lien avec les normes précédentes, puisque, quel que soit A ∈ Mm,n(K), on a[4],[5]

A F = A σ 2 , A = A σ , A = A σ 1 . {\displaystyle \|A\|_{F}=\|A\|_{\sigma _{2}},\qquad \|A\|=\|A\|_{\sigma _{\infty }},\qquad \|A\|_{*}=\|A\|_{\sigma _{1}}.}

On déduit du lien entre les normes matricielles et les normes vectorielles de σ ( A ) {\displaystyle \sigma (A)} , et les inégalités sur ces normes, que pour tout A ∈ Mm,n(K) :

A A F A rg ( A ) 1 / 2 A F rg ( A ) A , {\displaystyle \|A\|\leqslant \|A\|_{F}\leqslant \|A\|_{*}\leq \operatorname {rg} (A)^{1/2}\|A\|_{F}\leqslant \operatorname {rg} (A)\|A\|,}

rg ( A ) {\displaystyle \operatorname {rg} (A)} désigne le rang de A {\displaystyle A} .

Ces inégalités montrent que le rang est minoré par la norme nucléaire sur la boule unité B := { A M m , n ( K ) A 1 } {\displaystyle {\mathcal {B}}:=\{A\in \mathrm {M} _{m,n}(K)\mid \|A\|\leqslant 1\}} . Plus précisément, on peut montrer que la plus grande fonction convexe fermée qui minore le rang sur B {\displaystyle {\mathcal {B}}} est la restriction à cette boule de la norme nucléaire.

Lorsque K est le corps des réels, cela revient, en notant I B {\displaystyle {\mathcal {I}}_{\mathcal {B}}} l'indicatrice de B {\displaystyle {\mathcal {B}}} , à dire que la biconjuguée de la fonction rg + I B : M m , n ( R ) R ¯ {\displaystyle \operatorname {rg} +{\mathcal {I}}_{\mathcal {B}}:\mathrm {M} _{m,n}(\mathbb {R} )\to {\overline {\mathbb {R} }}} est la fonction + I B {\displaystyle \|\cdot \|_{*}+{\mathcal {I}}_{\mathcal {B}}} [6],[7]. Sans restriction du rang à un ensemble, on obtient rg = 0 {\displaystyle \operatorname {rg} ^{**}=0} , une identité de peu d'utilité.

Propriétés

  • L'espace Mn(K), muni d'une norme sous-multiplicative (comme une norme d'opérateur ║∙║p,p), est un exemple d'algèbre de Banach.
  • Pour toute norme N sur Mn(K), l'application bilinéaire (A, B) ↦ AB étant continue (on est en dimension finie), on est assuré de l'existence d'une constante k > 0 telle que A , B M n ( K ) N ( A B ) k N ( A ) N ( B ) {\displaystyle \forall A,B\in \mathrm {M} _{n}(K)\quad N(AB)\leq kN(A)N(B)} .Par suite, la norme kN est sous-multiplicative. Toute norme sur Mn(K) est donc proportionnelle à une norme d'algèbre.

Notes et références

  1. A. Quarteroni, R. Sacco et F. Saleri, Méthodes Numériques : Algorithmes, analyse et applications, Springer, , 538 p. (ISBN 978-88-470-0495-5, lire en ligne), p. 22.
  2. M. Ghil et J. Roux, Mathématiques Appliquées aux sciences de la Vie et de la Planète : Cours et exercices corrigés, Dunod, , 400 p. (ISBN 978-2-10-056033-2, lire en ligne), p. 50.
  3. (en) Are Hjørungnes, Complex-Valued Matrix Derivatives : With Applications in Signal Processing and Communications, CUP, (lire en ligne), p. 121.
  4. (en) Terence Tao, Topics in Random Matrix Theory, coll. « GSM » (no 132), (lire en ligne), p. 47.
  5. (en) B. Recht, M. Fazel et P. Parrilo, « Guaranteed minimum-rank solutions of linear matrix equations via nuclear norm minimization », SIAM Review, vol. 53,‎ , p. 471-501 (DOI 10.1137/070697835).
  6. (en) M. Fazel, Matrix rank minimization with applications : PhD thesis, Stanford (Californie), Department of Electrical Engineering, université Stanford, .
  7. Cette propriété intervient dans les problèmes où l'on cherche à obtenir des objets parcimonieux par minimisation du rang (en compression d'images par exemple). Le rang étant une fonction à valeurs entières, donc difficile à minimiser, on préfère parfois considérer l'approximation convexe du problème qui consiste à y minimiser la norme nucléaire.
  • icône décorative Portail des mathématiques