Au concours, les statistiques d’ordre sont un thème extrêmement classique, en maths appliquées comme en maths approfondies. L’étude de certaines variables aléatoires comme \(min\), \(max\), ou encore la généralisation de ces variables tombent régulièrement à l’EDHEC, l’emlyon ou à HEC/ESSEC.
Dans cet article, on t’apprend à calculer leur fonction de répartition, ce qui permet ensuite de les étudier avec les théorèmes du cours.
Introduction
Commençons par poser le contexte. Il est plus rare de voir des variables \(min\) ou \(max\) pour des variables discrètes, et alors, on est dans le cadre de l’étude de deux variables aléatoires. Dans ce cas, il faut y aller à tâtons, il n’y a pas de méthode générale.
Dans la majorité des cas, on étudie des variables aléatoires à densité. On fixe donc \(n\) dans \(\mathbb{N}^{*}\), et on pose \(X_{1},…,X_{n}\) \(n\) variables aléatoires à densité, indépendantes, de même loi qu’une variable aléatoire \(X\), définies sur le même espace probabilisé \((\Omega, \mathcal{A}, \mathbb{P})\). On note leur fonction de répartition respective \(F_{1},…,F_{n}\) et \(F\). Enfin, on se place dans le cas où \(X(\Omega)=\mathbb{R}\)
Étude de max
Pour tout \( \omega \) dans \( \Omega\), on note \(Y(\omega)\) le plus grand des nombres \(X_{1}(\omega),…,X_{n}(\omega)\), c’est-à-dire \(Y(\omega)=max(X_{1}(\omega),…,X_{n}(\omega))\).
L’objectif est de déterminer la fonction de répartition de \(Y\), notée \(F {Y}\). L’étude de son espérance, de sa variance et d’autres propriétés découle ensuite d’une densité, trouvée par dérivation de la fonction de répartition.
Tout d’abord, on remarque que \(Y(\Omega)=X(\Omega)\).
Ensuite, fixons \(x\) dans \(\mathbb{R}\).
\(
\begin{align}
F_{Y}(x) &=\mathbb{P}([Y \leq x]) \\
&=\mathbb{P}([max(X_{1},…,X_{n}) \leq x]) \\
&=\mathbb{P}\Bigg(\displaystyle
\bigcap_{k=1}^{n} [X_{k} \leq x] \Bigg) \\
&=\displaystyle \prod_{k=1}^{n} F_{k}(x) \quad \text{par indépendance des variables} \: X_{k} \\
&= (F(x))^{n} \quad \text{car les} \: X_{k} \: \text{sont toutes de même loi que X}
\end{align}
\)
Finalement, on a \[ \fbox{\( \displaystyle F_{Y}(x)=\big[F(x)\big]^{n} \)}\].
Étude de min
Pour tout \( \omega \) dans \( \Omega\), on note \(Z(\omega)\) le plus petit des nombres \(X_{1}(\omega),…,X_{n}(\omega)\), c’est-à-dire \(Z(\omega)=min(X_{1}(\omega),…,X_{n}(\omega))\).
Le calcul de la fonction de répartition de \(Z\), notée \(F_{Z}\) ressemble beaucoup à celui de \(Y\).
Tout d’abord, on remarque que \(Z(\Omega)=X(\Omega)\).
Ensuite, fixons \(x\) dans \(\mathbb{R}\).
\(
\begin{align}
F_{Z}(x) &=\mathbb{P}([Z \leq x]) \\
&=1-\mathbb{P}([Z > x]) \\
&=1-\mathbb{P}([min(X_{1},…,X_{n}) > x]) \\
&=1- \mathbb{P}\Bigg(\displaystyle
\bigcap_{k=1}^{n} [X_{k} > x] \Bigg) \\
&=1 \:-\: \displaystyle \prod_{k=1}^{n} \mathbb{P}([ X_{k} > x]\quad \text{par indépendance des variables} \: X_{k} \\
&= 1\: -\: \big[\mathbb{P}([ X_{k} > x])\big]^{n} \quad \text{car les} \: X_{k} \: \text{sont toutes de même loi que X}
\end{align}
\)
Finalement, on a \[ \fbox{\( \displaystyle F_{Z}(x)=1 \:- \:\big[\mathbb{P}([ X_{k} > x])\big]^{n} \)}\].
Généralisation : étude de la \(k^{ème}\) variable
Soit \(k \in [\![1,n]\!]\), pour tout \( \omega \) dans \( \Omega\), on note \(U_{k}(\omega)\) le \(k^{ème}\) des nombres \(X_{1}(\omega),…,X_{n}(\omega)\), quand ces derniers sont rangés dans l’ordre croissant.
On remarque que les variables \(U_{k}\) généralisent le cas des variables \(min\) et \(max\).
L’objectif est de déterminer la fonction de répartition de \(U_{k}\), notée \(G_{k}\). Pour cela, deux méthodes sont possibles : introduire une variable qui compte le nombre de variables aléatoires\(X_{i}\) réalisant l’événement \([X_{i} \leq x]\). Alors, cette variable suit une loi binomiale.
Sinon, on peut passer par les événements. On choisit ici de développer la méthode la plus simple et la plus utilisée : l’introduction d’une variable aléatoire binomiale.
Comme vu précédemment, \(U_{k}(\Omega)=X(\Omega)\).
Ensuite, fixons \(x\) dans \(\mathbb{R}\).
Soit \(W\) la variable aléatoire qui compte le nombre de réalisations de \([X_{k} \leq x]\). Comme les variables \(X_{1},…,X_{n}\) sont indépendantes et de même loi, on déduit que \(W\) suit une loi binomiale de paramètres \((n, \mathbb{P}([X \leq x])\).
L’événement \([U_{k}\leq x]\) est égal à l’événement \([W\geq k]\).
En effet, pour que la \(k^{ème}\) plus grande variable aléatoire soit inférieure ou égale à \(x\), il est nécessaire et suffisant qu’on ait au moins \(k\) variables aléatoires parmi \((X_{1},…,X_{n})\) qui soient inférieures ou égales à \(x\). Ainsi, on a \([U_{k}\leq x] = [W\geq k]\).
En passant aux probabilités, connaissant la loi de \(W\), on trouve le résultat demandé :
\(
\begin{align}
G_{k}(x) &= \mathbb{P}([U_{k}\leq x] \\
&=\mathbb{P}([W\geq k]) \\
&= \sum_{i=k}^{n} \mathbb{P}([W= i])\\
&=\sum_{i=k}^{n} \binom{n}{i} (\mathbb{P}([X \leq x]))^{i}(1-\mathbb{P}([X \leq x]))^{n-i} \: \text{car W suit une loi binomiale} \\
&=\sum_{i=k}^{n} \binom{n}{i} (F(x))^{i}(1-F(x))^{n-i}
\end{align}
\)
Finalement
\[ \fbox{\( \displaystyle G_{k}(x)=\sum_{i=k}^{n} \binom{n}{i} (F(x))^{i}(1-F(x))^{n-i}\)}\].
N’hésite pas à consulter toutes nos ressources en maths !