Statistiques à deux variables | Terminale Bac Pro | Mathématiques
Un nuage de points représente \(n\) couples \((x_i ; y_i)\) dans un repère. La variable \(x\) (explicative) est placée en abscisse, la variable \(y\) (réponse) en ordonnée. L'aspect du nuage renseigne sur la nature de la liaison : si les points s'alignent, la liaison est linéaire ; on distingue liaison croissante ou décroissante selon la pente.
Un menuisier relève la surface traitée (en m²) et le temps passé (en heures) sur 6 chantiers :
| Surface \(x\) (m²) | 10 | 15 | 20 | 25 | 30 | 35 |
|---|---|---|---|---|---|---|
| Temps \(y\) (h) | 3 | 4 | 6 | 7 | 9 | 10 |
Un technicien chauffagiste note la consommation de gaz (en kWh) selon la température extérieure (en °C) pour 5 relevés :
| Température \(x\) (°C) | −5 | 0 | 5 | 10 | 15 |
|---|---|---|---|---|---|
| Consommation \(y\) (kWh) | 120 | 95 | 70 | 50 | 30 |
Un atelier d'agencement relève le chiffre d'affaires mensuel (en k€) sur 6 mois :
| Mois \(x\) | 1 | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|---|
| CA \(y\) (k€) | 42 | 45 | 48 | 51 | 53 | 57 |
Représenter le nuage de points et décrire la tendance générale.
Le point moyen \(G\) a pour coordonnées \(\bar{x} = \dfrac{\sum x_i}{n}\) et \(\bar{y} = \dfrac{\sum y_i}{n}\). Il est toujours situé sur la droite d'ajustement. Calculer \(G\) est la première étape avant de déterminer la droite de régression.
En reprenant les données de l'exercice 1 (surface / temps), calculer les coordonnées du point moyen \(G\).
Un fabricant de cuisines relève le nombre de meubles posés (\(x\)) et le temps de pose (\(y\) en h) sur 5 chantiers :
| \(x\) (meubles) | 8 | 12 | 10 | 15 | 5 |
|---|---|---|---|---|---|
| \(y\) (h) | 6 | 9 | 7 | 11 | 4 |
Calculer le point moyen \(G\).
On a \(\bar{x} = 18\) et la somme \(\sum y_i = 216\) pour \(n = 8\) données. Calculer \(\bar{y}\) et les coordonnées de \(G\).
La droite d'ajustement (droite de régression) a pour équation \(y = ax + b\). Elle passe toujours par le point moyen \(G(\bar{x}; \bar{y})\). Le coefficient \(a\) est la pente (variation de \(y\) pour +1 unité de \(x\)) ; \(b\) est l'ordonnée à l'origine. On calcule \(b\) en écrivant que G est sur la droite : \(b = \bar{y} - a\bar{x}\).
Pour les données de l'exercice 1 (surface / temps), la droite d'ajustement par la méthode des moindres carrés est \(y = 0{,}28x - 0{,}79\).
La droite d'ajustement du chiffre d'affaires (exercice 3) est \(y = 2{,}97x + 39{,}57\).
Pour une série, on a calculé \(G(12 ; 8{,}4)\) et le coefficient directeur de la droite de régression est \(a = 0{,}6\). Déterminer l'équation complète de la droite d'ajustement.
Le coefficient de corrélation \(r\) mesure la force et le sens de la liaison linéaire entre \(x\) et \(y\). Il est toujours compris entre \(-1\) et \(1\). Si \(r > 0\) : liaison croissante ; si \(r < 0\) : liaison décroissante. Plus \(|r|\) est proche de 1, plus la liaison est forte. En pratique, on considère le modèle affine pertinent si \(|r| \geq 0{,}9\).
Pour chaque valeur de \(r\), décrire la nature de la liaison et son intensité :
Un installateur thermique obtient \(r = 0{,}92\) pour la liaison entre la puissance installée (kW) et la surface chauffée (m²) sur 10 logements. Peut-il utiliser la droite d'ajustement pour faire des estimations ? Justifier.
Deux séries donnent \(r_A = 0{,}78\) et \(r_B = -0{,}95\). Pour laquelle la droite d'ajustement est-elle la plus fiable ? Expliquer.
Pour estimer \(y\) à partir d'une valeur de \(x\) : remplacer \(x\) dans l'équation \(y = ax + b\). Pour estimer \(x\) à partir d'une valeur de \(y\) : résoudre \(ax + b = y_0\). Attention : les prévisions ne sont fiables que dans l'intervalle des valeurs observées (interpolation). En dehors de cet intervalle (extrapolation), les résultats sont peu fiables.
La droite d'ajustement entre la surface (m²) et le temps de pose (h) est \(y = 0{,}28x - 0{,}79\). Estimer :
La droite de régression du CA est \(y = 2{,}97x + 39{,}57\). Estimer le CA pour les mois 8, 10 et 12. Le résultat au mois 20 vous semble-t-il fiable ?
Un technicien chauffagiste dispose de la droite \(y = -6x + 90\) liant température extérieure (\(x\) en °C) et consommation (\(y\) en kWh). Estimer la consommation pour \(-10\)°C, 0°C et 20°C. Interpréter le résultat pour 20°C.
Nuage courbe → changement de variable pour le rendre linéaire : \(z=\log(y)\) (exponentielle), \(z=1/x\) (hyperbole), etc. On ajuste le nouveau nuage, puis on revient à la variable initiale.
Consommation \(E\) (kWh) selon le nombre de machines \(x\) :
| \(x\) | 1 | 2 | 3 | 4 | 5 |
|---|---|---|---|---|---|
| \(E\) | 10 | 42 | 95 | 175 | 310 |
a) Nuage aligné ? b) Poser \(z=\log(E)\), calculer. c) Droite : \(z\approx 0{,}37x+0{,}58\). d) En déduire \(E(x)\).
Temps de séchage \(t\) (h) selon épaisseur \(e\) (mm) :
| \(e\) | 0,5 | 1 | 1,5 | 2 | 3 |
|---|---|---|---|---|---|
| \(t\) | 12 | 6 | 4,2 | 3 | 2,1 |
a) Poser \(z=1/e\). b) On obtient \(t\approx 6z\). En déduire \(t(e)\). c) Estimer \(t(4)\).