← Retour au sommaire

Chapitre 14 – Sommes de variables aléatoires

Terminale générale · Mathématiques · Probabilités

Objectifs du chapitre

I. Linéarité de l'espérance

Propriété — Linéarité de l'espérance

Pour toutes variables aléatoires \(X\) et \(Y\) (indépendantes ou non) et tout réel \(a\) :

Plus généralement : \(E(a_1X_1+a_2X_2+\cdots+a_nX_n) = a_1E(X_1)+a_2E(X_2)+\cdots+a_nE(X_n)\).

Exemple

On lance deux dés. Soit \(S = X_1+X_2\) la somme. \(E(X_1)=E(X_2)=3{,}5\), donc \(E(S)=7\).

Exercice 1

Un jeu coûte 2 € et rapporte \(X\) euros, avec \(P(X=0)=0{,}5\), \(P(X=3)=0{,}3\), \(P(X=10)=0{,}2\). On joue 100 fois. Quel est le gain moyen total ?

\(E(X) = 0\times 0{,}5+3\times 0{,}3+10\times 0{,}2 = 2{,}9\). Le gain net par partie : \(E(X)-2=0{,}9\) €.

Sur 100 parties : gain moyen = \(100\times 0{,}9 = 90\) € (jeu favorable).

II. Variance d'une somme de variables indépendantes

Propriété — Additivité de la variance

Si \(X\) et \(Y\) sont indépendantes :

\[V(X+Y) = V(X) + V(Y)\]

Plus généralement, si \(X_1, \ldots, X_n\) sont mutuellement indépendantes :

\[V(X_1+\cdots+X_n) = V(X_1)+\cdots+V(X_n)\]
Propriété — Effet d'un facteur \[V(aX) = a^2 V(X) \qquad \text{et} \qquad \sigma(aX) = |a|\sigma(X)\]
Attention

L'additivité de la variance n'est vraie que pour des variables indépendantes. La linéarité de l'espérance, elle, est toujours vraie.

III. Application à la loi binomiale

Propriété

Si \(X \sim \mathcal{B}(n,p)\), alors \(X = X_1+X_2+\cdots+X_n\) où les \(X_i\) sont des variables de Bernoulli indépendantes de paramètre \(p\). Donc :

Exercice 2

Démontrer que \(E(X)=np\) et \(V(X)=np(1-p)\) pour \(X\sim\mathcal{B}(n,p)\) en utilisant la décomposition en somme de Bernoulli.

\(X=X_1+\cdots+X_n\) avec \(X_i\sim\mathcal{B}(p)\) indépendantes.

\(E(X_i)=p\), donc \(E(X)=\sum E(X_i)=np\).

\(V(X_i)=p(1-p)\). Les \(X_i\) étant indépendantes : \(V(X)=\sum V(X_i)=np(1-p)\). □

III.bis. Exemples d'application de la linéarité

Méthode — Variables indicatrices

Pour calculer l'espérance d'une quantité compliquée, on la décompose en somme de variables indicatrices (variables de Bernoulli valant 0 ou 1), puis on applique la linéarité de l'espérance.

Exemple 1 — Points fixes d'une permutation aléatoire

On mélange au hasard les entiers \(1, 2, \ldots, n\) (permutation aléatoire uniforme). Un point fixe est un entier \(i\) qui reste à sa place après le mélange.

Question : quel est le nombre moyen de points fixes ?

Résolution. Pour chaque \(i \in \{1, \ldots, n\}\), on pose la variable indicatrice :

\[X_i = \begin{cases} 1 & \text{si } i \text{ est un point fixe} \\ 0 & \text{sinon}\end{cases}\]

Le nombre total de points fixes est \(F = X_1 + X_2 + \cdots + X_n\).

Par symétrie, chaque élément a une probabilité \(\frac{1}{n}\) de rester à sa place, donc \(E(X_i) = \frac{1}{n}\).

Par linéarité de l'espérance (même si les \(X_i\) ne sont pas indépendantes) :

\[E(F) = \sum_{i=1}^{n} E(X_i) = n \times \frac{1}{n} = 1\]

Résultat remarquable : en moyenne, il y a exactement 1 point fixe, quelle que soit la taille \(n\) de la permutation.

Exemple 2 — Paires dans une main de cartes

On tire 5 cartes au hasard dans un jeu de 52 cartes (13 valeurs, 4 couleurs). Une paire est un couple de deux cartes de même valeur dans la main.

Question : quel est le nombre moyen de paires dans la main ?

Résolution. Pour chaque couple possible \(\{i,j\}\) de cartes dans la main (avec \(1 \leqslant i < j \leqslant 5\)), on pose :

\[Y_{\{i,j\}} = \begin{cases} 1 & \text{si les cartes en positions } i \text{ et } j \text{ ont la même valeur} \\ 0 & \text{sinon}\end{cases}\]

Le nombre total de paires est \(P = \displaystyle\sum_{1 \leqslant i < j \leqslant 5} Y_{\{i,j\}}\). Il y a \(\binom{5}{2} = 10\) tels couples.

Calculons \(E(Y_{\{i,j\}})\). La carte \(j\) a la même valeur que la carte \(i\) si elle fait partie des 3 cartes restantes de même valeur parmi les 51 cartes restantes :

\[E(Y_{\{i,j\}}) = P(\text{même valeur}) = \frac{3}{51} = \frac{1}{17}\]

Par linéarité :

\[E(P) = 10 \times \frac{1}{17} = \frac{10}{17} \approx 0{,}588\]

En moyenne, une main de 5 cartes contient environ \(0{,}59\) paire.

IV. Échantillon et moyenne

Définition — Échantillon

Un échantillon de taille \(n\) d'une loi de probabilité est une liste \((X_1, X_2, \ldots, X_n)\) de variables aléatoires indépendantes suivant toutes la même loi.

Somme et moyenne de l'échantillon

On définit :

Propriété — Espérance et variance de la moyenne

Si les \(X_i\) sont i.i.d. d'espérance \(\mu\) et de variance \(V\) :

μ σ σ/√n X (observation) Mₙ (moyenne)

Effet de concentration : la distribution de la moyenne Mₙ est plus resserrée autour de μ que celle d'une observation individuelle X.

Interprétation

La moyenne \(M_n\) a la même espérance que chaque \(X_i\), mais sa variance est \(n\) fois plus petite. Plus l'échantillon est grand, plus la moyenne est concentrée autour de \(\mu\). C'est la base de la loi des grands nombres (chapitre suivant).

Exercice 3

On mesure la taille de 100 élèves. Chaque mesure \(X_i\) a pour espérance \(\mu=170\) cm et écart type \(\sigma=8\) cm.

  1. Calculer \(E(M_{100})\) et \(\sigma(M_{100})\).
  2. Comparer \(\sigma(M_{100})\) à \(\sigma\). Interpréter.
  1. \(E(M_{100})=170\) cm. \(\sigma(M_{100})=\frac{8}{\sqrt{100}}=0{,}8\) cm.
  2. \(\sigma(M_{100})=0{,}8\) contre \(\sigma=8\). La moyenne sur 100 mesures est 10 fois plus précise qu'une mesure individuelle.
Exercice 4

Contrôle qualité en usine

Une usine fabrique des pièces cylindriques. La masse \(X_i\) de chaque pièce (en grammes) est une variable aléatoire d'espérance \(\mu = 250\) g et d'écart type \(\sigma = 6\) g. Un contrôleur prélève un échantillon de \(n\) pièces et calcule la masse moyenne \(M_n\).

  1. Exprimer \(E(M_n)\) et \(\sigma(M_n)\) en fonction de \(n\).
  2. Calculer \(\sigma(M_n)\) pour \(n = 9\), \(n = 36\) et \(n = 144\). Commenter.
  3. Le cahier des charges impose que l'écart type de la moyenne soit inférieur à \(0{,}5\) g. Quel est le nombre minimal de pièces à prélever ?
  4. Avec cet échantillon minimal, donner un intervalle centré sur \(\mu\) de demi-largeur \(2\sigma(M_n)\) dans lequel \(M_n\) a de grandes chances de se trouver.
  1. \(E(M_n) = \mu = 250\) g et \(\sigma(M_n) = \frac{\sigma}{\sqrt{n}} = \frac{6}{\sqrt{n}}\) g.
  2. \(\sigma(M_9) = \frac{6}{3} = 2\) g, \(\sigma(M_{36}) = \frac{6}{6} = 1\) g, \(\sigma(M_{144}) = \frac{6}{12} = 0{,}5\) g. En multipliant la taille de l'échantillon par 4, on divise l'écart type de la moyenne par 2.
  3. \(\frac{6}{\sqrt{n}} \leqslant 0{,}5\), soit \(\sqrt{n} \geqslant 12\), donc \(n \geqslant 144\). Il faut prélever au minimum 144 pièces.
  4. Avec \(n = 144\) : \(2\sigma(M_{144}) = 1\) g. L'intervalle est \([249 ; 251]\). La moyenne de l'échantillon a de grandes chances d'être comprise entre 249 g et 251 g.
Exercice 5

Problème de synthèse

Un dé équilibré est lancé \(n\) fois. Soit \(S_n\) la somme des résultats et \(M_n=\frac{S_n}{n}\) la moyenne.

  1. Calculer \(E(X_i)\) et \(V(X_i)\) pour un lancer.
  2. En déduire \(E(S_n)\), \(V(S_n)\), \(E(M_n)\), \(V(M_n)\).
  3. Pour \(n=360\), calculer \(E(M_{360})\) et \(\sigma(M_{360})\).
  1. \(E(X_i)=\frac{1+2+3+4+5+6}{6}=3{,}5\). \(V(X_i)=E(X_i^2)-[E(X_i)]^2=\frac{91}{6}-12{,}25=\frac{35}{12}\approx 2{,}917\).
  2. \(E(S_n)=3{,}5n\), \(V(S_n)=\frac{35n}{12}\). \(E(M_n)=3{,}5\), \(V(M_n)=\frac{35}{12n}\).
  3. \(E(M_{360})=3{,}5\). \(\sigma(M_{360})=\sqrt{\frac{35}{12\times 360}}=\sqrt{\frac{35}{4320}}\approx 0{,}090\).
Exercice 6

Problème de synthèse — Assurance

Un assureur couvre \(N = 1\,000\) clients contre un risque. Chaque client \(i\) a une probabilité \(p = 0{,}04\) de déclarer un sinistre au cours de l'année. En cas de sinistre, l'assureur verse un montant fixe \(C = 5\,000\) €. On suppose les sinistres indépendants d'un client à l'autre.

  1. Pour chaque client \(i\), on pose \(X_i = C\) si le client déclare un sinistre, \(X_i = 0\) sinon. Quelle est la loi de \(X_i\) ? Calculer \(E(X_i)\) et \(V(X_i)\).
  2. On note \(T = X_1 + X_2 + \cdots + X_N\) le montant total des indemnités versées. Exprimer \(E(T)\) et \(V(T)\).
  3. Calculer \(E(T)\) et \(\sigma(T)\) numériquement.
  4. L'assureur fixe la prime annuelle par client à \(k = 250\) €. Calculer la recette totale et le bénéfice moyen. L'activité est-elle rentable en moyenne ?
  5. Donner l'intervalle \([E(T) - 2\sigma(T) \;;\; E(T) + 2\sigma(T)]\). Commenter le risque pour l'assureur.
  1. \(X_i\) prend les valeurs \(0\) et \(5\,000\) avec \(P(X_i = 5\,000) = 0{,}04\) et \(P(X_i = 0) = 0{,}96\).
    \(E(X_i) = 5\,000 \times 0{,}04 = 200\) €.
    \(V(X_i) = 5\,000^2 \times 0{,}04 \times 0{,}96 = 25\,000\,000 \times 0{,}0384 = 960\,000\).
  2. Par linéarité : \(E(T) = N \cdot E(X_i) = 1\,000 \times 200 = 200\,000\) €.
    Par indépendance : \(V(T) = N \cdot V(X_i) = 1\,000 \times 960\,000 = 960\,000\,000\).
  3. \(E(T) = 200\,000\) €. \(\sigma(T) = \sqrt{960\,000\,000} \approx 30\,984\) €.
  4. Recette totale : \(R = 1\,000 \times 250 = 250\,000\) €. Bénéfice moyen : \(R - E(T) = 250\,000 - 200\,000 = 50\,000\) €. L'activité est rentable en moyenne.
  5. \([200\,000 - 61\,968 \;;\; 200\,000 + 61\,968] = [138\,032 \;;\; 261\,968]\). L'intervalle dépasse la recette de 250 000 €, ce qui signifie qu'il existe un risque non négligeable de perte certaines années. L'assureur doit constituer des réserves.