Les notions hors programme sont à travailler en priorité par les candidats visant les trois Parisiennes. Cet article te propose de découvrir l’espace vectoriel des variables aléatoires admettant un moment d’ordre 2, pour mieux t’aider à le comprendre si tu te trouves face à ce thème un jour de concours. Il te permettra aussi d’étendre les inégalités que tu connais déjà chez les espaces euclidiens aux variables admettant un moment d’ordre 2.
L’espace vectoriel L²
On se fixe un espace probabilisé \((\Omega,\mathcal A,P)\).
On note \(\mathcal L^2\) l’ensemble des variables aléatoires admettant un moment d’ordre 2.
Nous allons montrer que \(\mathcal L^2\) est un \(\mathbb R\)-espace vectoriel.
Démonstration
Tout d’abord, remarquons que l’ensemble des variables aléatoires quelconques est un espace vectoriel. En effet, c’est un sous-ensemble de \(\mathbb R^{\Omega}\) qui contient \(0_{\mathbb R^{\Omega}}\) et qui est stable par combinaison linéaire (car la somme de deux variables aléatoires est une variable aléatoire, et le produit d’un réel et d’une variable aléatoire est une variable aléatoire).
Il nous suffit donc de montrer que \(\mathcal L^2\) est un sous-espace vectoriel de l’ensemble des variables aléatoires.
Premièrement, \(\mathcal L^2\) est un sous-ensemble de l’ensemble des variables aléatoires.
Deuxièmement, la variable aléatoire nulle \(X:\omega\in\Omega\mapsto 0\) est un élément de \(\mathcal L^2\) : en effet, \(X^2\) est encore la variable aléatoire nulle et elle est d’espérance finie (égale à 0).
Enfin, soient \(\lambda\in\mathbb R\) et \(X,Y\in\mathcal L^2\).
On a \((\lambda X+Y)^2=\lambda^2X^2+Y^2+2\lambda XY\).
Les variables \(\lambda^2X^2\) et \(Y^2\) admettent une espérance.
De plus \((|X|+|Y|)^2\geq 0\), c’est-à-dire \(X^2+2|X||Y|+Y^2\geq 0\) et donc \(|XY|\leq\frac12(X^2+Y^2)\).
Rappel propriété de domination : si \(|X_1|\leq X_2\) presque sûrement et si \(X_2\) admet une espérance finie, alors \(X_1\) admet une espérance finie et \(E(X_1)\leq E(X_2)\).
Par la propriété de domination, \(XY\) admet une espérance, et donc \(2\lambda XY\) également.
Donc, par somme, \((\lambda X+Y)^2\) admet une espérance, c’est-à-dire \(\lambda X+Y\in\mathcal L^2\).
Donc : \(\mathcal L^2\) est un \(\mathbb R\)-espace vectoriel.
Question qu’on peut se poser : s’agit-il d’un espace vectoriel de dimension finie ? infinie ?
La réponse est : cela dépend.
Exemple 1
On lance un dé équilibré à six faces deux fois.
On modélise la situation par un univers \(\Omega\), qui est l’ensemble des couples de résultats pour les deux lancers, avec \(\mathcal A=\mathcal P(\Omega)\).
On a donc : \(\Omega=\{1,2,3,4,5,6\}^2\). Ainsi, n’importe quelle variable aléatoire (somme des résultats, produit, ou même une variable quasi certaine…) est une application de \(\{1,2,3,4,5,6\}^2\) dans \(\mathbb R\).
On peut se convaincre assez rapidement que \(\mathbb R^{\{1,2,3,4,5,6\}^2}\) est un espace vectoriel de dimension 36 (en montrant qu’il existe une bijection entre cet ensemble et \(\mathcal M_6(\mathbb R)\))
De plus, \(\mathcal L^2=\mathbb R^{\{1,2,3,4,5,6\}^2}\), car toute variable aléatoire discrète finie admet un moment d’ordre 2 et car lorsque \(\mathcal A=\mathcal P(\Omega)\), toute application de \(\Omega\) dans \(\mathbb R\) est une variable aléatoire.
Donc : \(\dim(\mathcal L^2)=36\).
Exemple 2
On joue à pile ou face un nombre infini de fois.
On modélise la situation par \(\Omega\), qui est l’ensemble des suites à valeurs dans \(\{0,1\}\), où 1 représente pile et 0 représente face.
Cette fois-ci, \(\Omega=\{0,1\}^{\mathbb N}\) est de dimension infinie, et donc on peut montrer par l’absurde que \(\mathcal L^2\) est de dimension infinie.
Construction d’un produit scalaire
On pose, pour toutes variables aléatoires \(X\) et \(Y\) appartenant à \(\mathcal L^2\) :
\[\langle X,Y\rangle = E(XY)\]
Nous allons montrer que l’application \(\langle \cdot , \cdot \rangle\) définit un produit scalaire sur \(\mathcal L^2\).
Tout d’abord, l’application \(\langle \cdot , \cdot \rangle\) est bien définie sur \(\mathcal L^2\times\mathcal L^2\). En effet, si \((X,Y)\in\mathcal L^2\times\mathcal L^2\), alors \(X^2\) et \(Y^2\) admettent une espérance, donc comme montré précédemment, on a \(|XY|\leq\frac12(X^2+Y^2)\), ce qui entraîne par la propriété de domination que \(XY\) admet bien une espérance.
Linéarité à gauche
Pour tout \(\lambda\in\mathbb R\) et pour tout \(X,Y,Z\in\mathcal L^2\), par linéarité de l’espérance :
\[\langle \lambda X+Y,Z\rangle=\lambda\langle X,Z\rangle+\langle Y,Z\rangle\]
Symétrie
On a de manière évidente pour tout \(X,Y\in\mathcal L^2\), \(\langle X,Y\rangle=\langle Y,X\rangle\).
Ainsi \(\langle \cdot , \cdot \rangle\) est une forme bilinéaire symétrique.
Positivité
Pour tout \(X\in\mathcal L^2\), \(\langle X,X\rangle=E(X^2)\geq 0\) car \(X^2\) est une variable positive.
Caractère défini
Ici, il y a une subtilité.
Soit \(X\in\mathcal L^2\). Supposons que \(\langle X,X\rangle=0\).
Alors \(X^2\) est une variable positive d’espérance nulle, donc c’est la variable quasi certaine égale à 0.
Donc, c’est aussi le cas de \(X\).
Attention : ici, nous n’avons pas vraiment prouvé le caractère défini. En effet, nous avons seulement montré que \(X\) était nulle presque sûrement, ce qui est différent de l’application qui à \(\omega\in\Omega\) associe 0. On peut toutefois se contenter de cela à condition « d’assimiler » deux variables dès lors qu’elles sont égales presque sûrement. (Pour être 100 % rigoureux, il faudrait définir le « quotient de \(\mathcal L^2\) pour la relation d’équivalence \(X_1\sim X_2\iff P(X_1=X_2)=1\) » mais ceci nous amène dans une grosse digression…).
Ainsi, \(\langle \cdot , \cdot \rangle\) est un produit scalaire sur \(\mathcal L^2\).
Plusieurs inégalités grâce à ce produit scalaire
On note \(\|\cdot \|_{\mathcal L^2}\) la norme issue de ce produit scalaire.
On a donc pour tout \(X\in\mathcal L^2\), \(\|X\|_{\mathcal L^2}=\sqrt{E(X^2)}=\sqrt{V(X)+(E(X))^2}\).
En particulier si \(X\) est d’espérance nulle, on retrouve l’écart-type : \(\|X\|_{\mathcal L^2}=\sigma(X)\).
On a un certain nombre d’inégalités qui peuvent s’appliquer à cette norme.
Inégalité triangulaire
Comme toutes les normes, \(\|\cdot\|_{\mathcal L^2}\) a la propriété suivante :
\[\forall X,Y\in\mathcal L^2,\quad \|X+Y\|_{\mathcal L^2}\leq \|X\|_{\mathcal L^2}+\|Y\|_{\mathcal L^2}\]
Ce qui se traduit en termes d’espérance par :
\[\forall X,Y\in\mathcal L^2,\quad \sqrt{E((X+Y)^2)}\leq \sqrt{E(X^2)}+\sqrt{E(Y^2)}\]
Inégalité de Cauchy-Schwarz
Pour tout \(X\in\mathcal L^2\), \((E(XY))^2\leq E(X^2)E(Y^2)\).
On a égalité si et seulement si les variables \(X\) et \(Y\) sont colinéaires presque sûrement. C’est-à-dire qu’il existe \(\lambda\in\mathbb R\) tel que \(X=\lambda Y\) presque sûrement.
Un exercice d’oral HEC en lien
❓ Énoncé
Soit \(X\) une variable aléatoire à valeurs dans \(\mathbb N^*\) admettant une espérance.
Montrer que \(\frac1X\) admet une espérance, puis montrer que \(E(X)E\left(\frac1X\right)\geq 1\). Étudier le cas d’égalité.
✏️ Corrigé
Puisque \(X\) admet une espérance, \(\sqrt{X}\) admet un moment d’ordre 2.
De plus, pour tout \(n\in\mathbb N^*\), \(0\leq \frac1nP(X=n)\leq nP(X=n)\) et la série \(\sum nP(X=n)\) est convergente puisque \(X\) admet une espérance, donc par comparaison, \(\sum \frac1n P(X=n)\) converge absolument et par théorème de transfert, \(\frac1X\) admet une espérance.
Donc : \(\frac1{\sqrt{X}}\) admet un moment d’ordre 2.
D’après l’inégalité de Cauchy-Schwarz :
\[E(X)E\left(\frac1X\right)\geq \left(E\left(X\frac1X\right)\right)=1\]
Et on a égalité dans l’application de Cauchy-Schwarz si et seulement s’il existe \(\lambda\in\mathbb R\) tel que \(\sqrt{X}=\lambda\frac1{\sqrt{X}}\) presque sûrement, c’est-à-dire \(X=\lambda\), autrement dit \(X\) est quasi certaine.
Remarque : un jour de concours à l’oral de HEC, il n’est pas question de parler de produit scalaire ou de norme chez les variables aléatoires. C’est totalement hors programme ! Le jury attend donc que le candidat redémontre « simplement » l’inégalité de Cauchy-Schwarz, c’est-à-dire :
- qu’il connaisse la démonstration de l’inégalité de Cauchy-Schwarz pour les espaces euclidiens (qui nécessite de développer \(\langle\lambda x+y,\lambda x+y\rangle\) et qu’il raisonne sur le discriminant de cette quantité vue comme polynôme de degré 2 en \(\lambda\)… bref, quelque chose qu’on ne peut pas deviner !) ;
- qu’il sache l’adapter aux variables aléatoires (utiliser les arguments de linéarité et la positivité de l’espérance, etc.).
Conclusion
J’espère que cet article aura attiré ta curiosité sur l’espace \(\mathcal L^2\). Comme pour la plupart des résultats hors programme, pour ta préparation, il n’est pas nécessaire d’apprendre par cœur les démonstrations présentées dans cet article. Il vaut mieux essayer de comprendre comment elles s’articulent, et surtout comment les chapitres du programme d’ECG sont liés. Tout ceci te permettra d’être au clair si, le jour J, ton sujet de concours mélange les variables aléatoires et les produits scalaires, par exemple.