← Retour au sommaire

Chapitre 15 – Concentration et loi des grands nombres

Exercices par capacités · Terminale générale

Capacités travaillées

C1 — Appliquer l'inégalité de Bienaymé-Tchebychev

Exercice 1

Soit \(X\) avec \(E(X)=20\) et \(\sigma(X)=3\). Majorer :

  1. \(P(|X-20|\geqslant 6)\)
  2. \(P(|X-20|\geqslant 9)\)
  3. \(P(14\leqslant X\leqslant 26)\) (minorer)
  1. \(P(|X-20|\geqslant 6)\leqslant\frac{9}{36}=\frac{1}{4}\).
  2. \(P(|X-20|\geqslant 9)\leqslant\frac{9}{81}=\frac{1}{9}\).
  3. \(P(14\leqslant X\leqslant 26)=P(|X-20|\leqslant 6)=1-P(|X-20|>6)\geqslant 1-\frac{1}{4}=\frac{3}{4}\).
Exercice 2

Soit \(X\sim\mathcal{B}(n,0{,}3)\). Déterminer \(n\) pour que \(P\left(\left|\frac{X}{n}-0{,}3\right|\geqslant 0{,}05\right)\leqslant 0{,}02\).

\(F_n=\frac{X}{n}\), \(V(F_n)=\frac{0{,}3\times 0{,}7}{n}=\frac{0{,}21}{n}\).

\(\frac{0{,}21}{n\times 0{,}0025}\leqslant 0{,}02\), \(\frac{84}{n}\leqslant 0{,}02\), \(n\geqslant 4200\).

Exercice 3

On sonde \(n\) personnes sur leur intention de vote. On veut que la fréquence observée soit à moins de 3 % de la proportion réelle avec un risque d'erreur inférieur à 5 %. Quelle est la taille minimale du sondage ?

\(n\geqslant\frac{1}{4\times 0{,}05\times 0{,}03^2}=\frac{1}{4\times 0{,}05\times 0{,}0009}=\frac{1}{0{,}00018}\approx 5556\).

Il faut au moins 5 556 personnes.

Exercice 4

Soit \(S_n\) le nombre de 6 en \(n\) lancers d'un dé équilibré. En utilisant l'inégalité de Bienaymé-Tchebychev, majorer \(P(|S_n - \frac{n}{6}| \geqslant \sqrt{n})\).

\(S_n\sim\mathcal{B}(n,\frac{1}{6})\). \(\mu=\frac{n}{6}\), \(V=\frac{5n}{36}\).

\(P\left(|S_n-\frac{n}{6}|\geqslant\sqrt{n}\right)\leqslant\frac{5n/36}{n}=\frac{5}{36}\approx 0{,}139\).

C2 — Utiliser l'inégalité de concentration pour un échantillon

Exercice 5

On contrôle des pièces produites par une machine. La proportion de pièces défectueuses est \(p\) (inconnue). On prélève \(n\) pièces. Soit \(F_n\) la fréquence de pièces défectueuses.

  1. Montrer que \(P(|F_n-p|\geqslant 0{,}02)\leqslant\frac{1}{4n\times 0{,}0004}\).
  2. Déterminer \(n\) pour que cette probabilité soit \(\leqslant 0{,}01\).
  3. Si \(n=10\,000\) et \(F_n=0{,}034\), que peut-on dire de \(p\) ?
  1. \(V(F_n)=\frac{p(1-p)}{n}\leqslant\frac{1}{4n}\). Par BT : \(P(|F_n-p|\geqslant 0{,}02)\leqslant\frac{1}{4n\times 0{,}0004}=\frac{625}{n}\).
  2. \(\frac{625}{n}\leqslant 0{,}01\), \(n\geqslant 62\,500\).
  3. Avec \(n=10\,000\) : \(\frac{625}{10\,000}=0{,}0625\). On peut affirmer avec un risque de 6,25 % que \(|p-0{,}034|<0{,}02\), soit \(p\in[0{,}014;\ 0{,}054]\).
Exercice 6

Contrôle qualité — Taux de défauts

Une usine fabrique des composants électroniques. Le taux de défaut \(p\) est inconnu. On prélève un échantillon de \(n\) composants et on note \(F_n\) la fréquence de composants défectueux.

  1. On souhaite estimer \(p\) avec une précision \(\delta = 0{,}03\) et un risque \(\alpha = 0{,}02\). Montrer que la taille d'échantillon nécessaire est \(n\geqslant\frac{1}{4\alpha\delta^2}\) et calculer \(n\).
  2. On effectue le contrôle avec \(n = 15\,000\) composants et on observe \(F_n = 0{,}047\). Donner un intervalle de confiance pour \(p\) au risque 2 %.
  3. Le cahier des charges impose \(p < 0{,}06\). Le lot est-il conforme au risque 2 % ?
  1. \(P(|F_n-p|\geqslant 0{,}03)\leqslant\frac{1}{4n\times 0{,}0009}\leqslant\alpha = 0{,}02\).
    Soit \(n\geqslant\frac{1}{4\times 0{,}02\times 0{,}0009}=\frac{1}{0{,}000072}\approx 13\,889\).
    Il faut au moins 13 889 composants.
  2. Avec \(n=15\,000\) : \(\frac{1}{4\times 15\,000\times 0{,}0009}=\frac{1}{54}\approx 0{,}0185 < 0{,}02\). Le risque est satisfait.
    Intervalle de confiance : \([0{,}047-0{,}03\,;\ 0{,}047+0{,}03] = [0{,}017\,;\ 0{,}077]\).
  3. La borne supérieure de l'intervalle est 0,077 > 0,06. Au risque 2 %, on ne peut pas garantir que \(p < 0{,}06\). Le lot ne peut pas être déclaré conforme avec cette précision.
Exercice 7

Essai clinique — Taille d'échantillon

Un laboratoire teste un nouveau traitement. Le taux de réponse positive \(p\) est inconnu. On souhaite estimer \(p\) par la fréquence observée \(F_n\) sur un échantillon de \(n\) patients, avec un intervalle de confiance de largeur totale au plus \(0{,}04\) (soit une précision \(\delta = 0{,}02\)).

  1. Écrire l'inégalité de concentration avec \(\delta = 0{,}02\) et majorer \(V(F_n)\).
  2. Déterminer \(n\) pour un risque \(\alpha = 0{,}05\).
  3. Déterminer \(n\) pour un risque \(\alpha = 0{,}01\). Commenter l'effet de la réduction du risque sur la taille de l'échantillon.
  4. On réalise l'essai avec \(n = 50\,000\) patients et on observe \(F_n = 0{,}68\). Donner un intervalle de confiance au risque 1 % pour \(p\).
  1. \(P(|F_n-p|\geqslant 0{,}02)\leqslant\frac{p(1-p)}{n\times 0{,}0004}\leqslant\frac{1}{4n\times 0{,}0004}=\frac{625}{n}\).
  2. \(\frac{625}{n}\leqslant 0{,}05\), soit \(n\geqslant\frac{625}{0{,}05}=12\,500\).
  3. \(\frac{625}{n}\leqslant 0{,}01\), soit \(n\geqslant\frac{625}{0{,}01}=62\,500\).
    Diviser le risque par 5 (de 5 % à 1 %) multiplie la taille de l'échantillon par 5. Plus on veut être certain du résultat, plus l'échantillon doit être grand.
  4. Avec \(n=50\,000\) : \(\frac{625}{50\,000}=0{,}0125\). Le risque est 1,25 %, légèrement supérieur à 1 %. Pour un risque de 1 % strict, on utilise \(\delta\) tel que \(\frac{1}{4\times 50\,000\times\delta^2}\leqslant 0{,}01\), soit \(\delta^2\geqslant\frac{1}{2000}=0{,}0005\), \(\delta\geqslant 0{,}0224\).
    Intervalle de confiance au risque 1 % : \([0{,}68-0{,}023\,;\ 0{,}68+0{,}023] \approx [0{,}657\,;\ 0{,}703]\).

C3 — Appliquer la loi des grands nombres

Exercice 8

Simulation — Loi des grands nombres

Écrire un programme Python qui lance un dé \(n\) fois et trace la courbe de la fréquence de 6 en fonction de \(n\).

import random
import matplotlib.pyplot as plt

n = 10000
compteur = 0
frequences = []

for i in range(1, n + 1):
    if random.randint(1, 6) == 6:
        compteur += 1
    frequences.append(compteur / i)

plt.plot(range(1, n + 1), frequences)
plt.axhline(y=1/6, color='r', linestyle='--', label='p = 1/6')
plt.xlabel('Nombre de lancers')
plt.ylabel('Fréquence de 6')
plt.title('Loi des grands nombres')
plt.legend()
plt.show()

La courbe oscille d'abord largement puis se stabilise autour de \(\frac{1}{6}\approx 0{,}167\) : illustration de la loi des grands nombres.

Exercice 9

Convergence de la moyenne d'un dé

On lance \(n\) fois un dé équilibré à 6 faces. On note \(X_i\) le résultat du \(i\)-ème lancer et \(M_n = \frac{X_1+X_2+\cdots+X_n}{n}\) la moyenne des résultats.

  1. Calculer \(E(X_i)\) et \(V(X_i)\) pour un lancer de dé.
  2. En déduire \(E(M_n)\) et \(V(M_n)\).
  3. En utilisant l'inégalité de Bienaymé-Tchebychev, montrer que pour tout \(\varepsilon > 0\) : \[P(|M_n - 3{,}5|\geqslant\varepsilon)\leqslant\frac{35}{12n\varepsilon^2}\]
  4. En déduire que \(M_n\) converge en probabilité vers \(3{,}5\). Quel théorème vient-on d'illustrer ?
  5. Combien de lancers faut-il pour que \(P(|M_n-3{,}5|\geqslant 0{,}1)\leqslant 0{,}01\) ?
  1. \(E(X_i)=\frac{1+2+3+4+5+6}{6}=\frac{21}{6}=3{,}5\).
    \(E(X_i^2)=\frac{1+4+9+16+25+36}{6}=\frac{91}{6}\).
    \(V(X_i)=\frac{91}{6}-3{,}5^2=\frac{91}{6}-\frac{49}{4}=\frac{182-147}{12}=\frac{35}{12}\approx 2{,}917\).
  2. \(E(M_n)=E(X_i)=3{,}5\). \(V(M_n)=\frac{V(X_i)}{n}=\frac{35}{12n}\).
  3. Par Bienaymé-Tchebychev : \(P(|M_n-3{,}5|\geqslant\varepsilon)\leqslant\frac{V(M_n)}{\varepsilon^2}=\frac{35}{12n\varepsilon^2}\). ∎
  4. Pour tout \(\varepsilon > 0\), \(\frac{35}{12n\varepsilon^2}\to 0\) quand \(n\to+\infty\), donc \(P(|M_n-3{,}5|\geqslant\varepsilon)\to 0\). C'est la loi (faible) des grands nombres.
  5. \(\frac{35}{12n\times 0{,}01}\leqslant 0{,}01\), soit \(\frac{35}{0{,}12n}\leqslant 0{,}01\), \(n\geqslant\frac{35}{0{,}0012}\approx 29\,167\).
    Il faut au moins 29 167 lancers.
Exercice 10

Application — Assurance et loi des grands nombres

Une compagnie d'assurance possède \(n = 10\,000\) contrats. Pour chaque contrat \(i\), le montant des sinistres annuels est une variable aléatoire \(X_i\) d'espérance \(\mu = 800\) € et d'écart-type \(\sigma = 2000\) €. On suppose les sinistres indépendants. Soit \(M_n=\frac{X_1+\cdots+X_n}{n}\) le coût moyen par contrat.

  1. Calculer \(E(M_n)\) et \(V(M_n)\).
  2. En utilisant l'inégalité de concentration, majorer \(P(|M_n - 800|\geqslant 50)\).
  3. Majorer \(P(|M_n - 800|\geqslant 100)\). La compagnie peut-elle fixer sa prime à 900 € avec une bonne confiance ?
  4. Si la compagnie souhaite que \(P(|M_n - 800|\geqslant 50)\leqslant 0{,}01\), combien de contrats lui faut-il au minimum ?
  5. Expliquer en quoi ce résultat illustre la loi des grands nombres et le principe de la mutualisation des risques.
  1. \(E(M_n) = 800\) €. \(V(M_n)=\frac{\sigma^2}{n}=\frac{4\,000\,000}{10\,000}=400\).
  2. \(P(|M_n-800|\geqslant 50)\leqslant\frac{400}{2500}=0{,}16\). Au plus 16 % de risque que le coût moyen s'écarte de plus de 50 € de l'espérance.
  3. \(P(|M_n-800|\geqslant 100)\leqslant\frac{400}{10\,000}=0{,}04\). Il y a au plus 4 % de risque que \(M_n > 900\). Avec une prime de 900 €, la compagnie couvre ses frais avec une probabilité d'au moins 96 %.
  4. \(\frac{\sigma^2}{n\times 2500}\leqslant 0{,}01\), soit \(\frac{4\,000\,000}{2500n}\leqslant 0{,}01\), \(\frac{1600}{n}\leqslant 0{,}01\), \(n\geqslant 160\,000\) contrats.
  5. Par la loi des grands nombres, \(M_n\to\mu = 800\) quand \(n\to+\infty\). Plus le portefeuille de contrats est grand, plus le coût moyen se stabilise autour de l'espérance. C'est le principe de mutualisation des risques : individuellement, un sinistre est imprévisible, mais sur un grand nombre de contrats, le coût moyen devient prévisible. C'est ce qui permet aux assureurs de fixer des primes et de garantir leur solvabilité.