Statistique à deux variables | 1ère Bac Pro
Un menuisier relève ses ventes mensuelles (en m³) et son chiffre d'affaires (en €) :
| \(x\) (m³) | 5 | 8 | 12 | 15 | 20 |
|---|---|---|---|---|---|
| \(y\) (€) | 1 200 | 1 900 | 2 850 | 3 600 | 4 800 |
a. Calculer les coordonnées du point moyen \(G(\bar{x}\,;\,\bar{y})\).
b. Placer les points et \(G\) dans un repère.
a.
\[\bar{x} = \frac{5+8+12+15+20}{5} = \frac{60}{5} = 12\] \[\bar{y} = \frac{1200+1900+2850+3600+4800}{5} = \frac{14350}{5} = 2870\]Le point moyen est \(G(12\,;\,2870)\).
b. Le nuage et le point moyen sont à tracer dans un repère avec \(x\) de 0 à 22 et \(y\) de 0 à 5000.
Le nuage de points ci-dessous représente la consommation électrique (en kWh) d'un atelier de menuiserie en fonction de la température extérieure (en °C).
a. Les points semblent-ils alignés ? Justifier.
b. La corrélation est-elle positive ou négative ? Expliquer.
c. Calculer le point moyen \(G\).
a. Oui, les points semblent globalement alignés. Un ajustement affine paraît pertinent.
b. La corrélation est négative : quand la température augmente, la consommation diminue (le chauffage est moins sollicité).
c.
\[\bar{x} = \frac{0+5+10+15+20+25+30}{7} = \frac{105}{7} = 15\] \[\bar{y} = \frac{480+410+340+290+250+220+200}{7} = \frac{2190}{7} \approx 312{,}9\]\(G(15\,;\,312{,}9)\)
On donne la droite de régression \(y = 3{,}2x + 14\) pour une série dont le point moyen est \(G(10\,;\,46)\).
a. Vérifier que la droite passe par le point moyen.
b. Calculer \(y\) pour \(x = 7\). S'agit-il d'une interpolation ou d'une extrapolation si les données vont de \(x = 4\) à \(x = 18\) ?
a. On calcule : \(3{,}2 \times 10 + 14 = 32 + 14 = 46 = \bar{y}\). La droite passe bien par \(G\).
b. \(y = 3{,}2 \times 7 + 14 = 22{,}4 + 14 = 36{,}4\).
Comme \(7\) est compris entre 4 et 18 (plage des données), il s'agit d'une interpolation.
Un entraîneur relève la distance parcourue (en km) et la fréquence cardiaque moyenne (en bpm) lors de courses de durées différentes :
| Distance \(x\) (km) | 3 | 5 | 8 | 10 | 12 | 15 |
|---|---|---|---|---|---|---|
| FC moyenne \(y\) (bpm) | 125 | 138 | 150 | 158 | 165 | 175 |
a. Calculer le point moyen \(G(\bar{x}\,;\,\bar{y})\).
Étape 1 : Additionner toutes les valeurs de \(x\) : \(3 + 5 + 8 + 10 + 12 + 15 = \ldots\) puis diviser par 6.
Étape 2 : Faire de même pour les valeurs de \(y\).
b. La calculatrice donne : \(y = 4{,}12x + 112{,}7\) et \(r = 0{,}998\). Calculer \(R^2\) et commenter la qualité de l'ajustement.
Aide : \(R^2 = r^2 = (0{,}998)^2 = \ldots\) Si \(R^2\) est proche de 1, l'ajustement est bon.
c. Estimer la fréquence cardiaque pour une course de 7 km. Est-ce une interpolation ?
Étape 1 : Remplacer \(x\) par 7 dans l'équation : \(y = 4{,}12 \times 7 + 112{,}7 = \ldots\)
Étape 2 : Vérifier si 7 est dans la plage des données \([3\,;\,15]\).
d. Estimer la fréquence cardiaque pour une course de 25 km. Commenter.
Aide : 25 est-il dans la plage \([3\,;\,15]\) ? Si non, c'est une extrapolation. Le résultat est-il réaliste ?
a.
\[\bar{x} = \frac{3+5+8+10+12+15}{6} = \frac{53}{6} \approx 8{,}83\] \[\bar{y} = \frac{125+138+150+158+165+175}{6} = \frac{911}{6} \approx 151{,}8\]\(G(8{,}83\,;\,151{,}8)\)
b. \(R^2 = (0{,}998)^2 \approx 0{,}996\). L'ajustement est excellent car \(R^2 > 0{,}99\).
c. \(y = 4{,}12 \times 7 + 112{,}7 = 28{,}84 + 112{,}7 = 141{,}5\) bpm.
Comme \(7 \in [3\,;\,15]\), c'est une interpolation fiable.
d. \(y = 4{,}12 \times 25 + 112{,}7 = 103 + 112{,}7 = 215{,}7\) bpm.
C'est une extrapolation. Le résultat (216 bpm) est proche de la fréquence cardiaque maximale. Le modèle linéaire n'est plus réaliste pour de telles distances car la FC plafonne.
Un installateur thermique étudie le lien entre l'épaisseur d'isolant (en cm) et la déperdition thermique (en W/m²) d'un mur :
| Épaisseur \(x\) (cm) | 2 | 4 | 6 | 8 | 10 | 12 | 14 |
|---|---|---|---|---|---|---|---|
| Déperdition \(y\) (W/m²) | 42 | 35 | 28 | 23 | 19 | 16 | 14 |
a. Représenter le nuage de points.
Aide : Placer chaque couple \((x\,;\,y)\) dans un repère. L'axe horizontal représente l'épaisseur, l'axe vertical la déperdition.
b. Le nuage semble-t-il linéaire ?
Aide : Les points sont-ils à peu près alignés ? Si oui, un ajustement affine est envisageable.
c. La calculatrice donne \(y = -2{,}29x + 44{,}5\) et \(R^2 = 0{,}98\). L'ajustement est-il pertinent ?
Aide : Comparer \(R^2\) à 0,90. Si \(R^2 \geq 0{,}90\), l'ajustement est pertinent.
d. Quelle épaisseur d'isolant faudrait-il pour une déperdition de 10 W/m² ? S'agit-il d'une interpolation ou d'une extrapolation ?
Étape 1 : Remplacer \(y\) par 10 dans l'équation : \(10 = -2{,}29x + 44{,}5\).
Étape 2 : Isoler \(x\) : \(2{,}29x = 44{,}5 - 10 = \ldots\) puis \(x = \ldots\)
Étape 3 : La valeur trouvée est-elle dans la plage \([2\,;\,14]\) ?
a. On place les 7 points dans un repère.
b. Les points semblent globalement alignés avec une légère courbure. L'ajustement affine reste une bonne approximation.
c. \(R^2 = 0{,}98 > 0{,}90\), l'ajustement est pertinent.
d. On résout \(10 = -2{,}29x + 44{,}5\) :
\[2{,}29x = 44{,}5 - 10 = 34{,}5\] \[x = \frac{34{,}5}{2{,}29} \approx 15{,}1 \text{ cm}\]Comme les données vont de 2 à 14 cm, \(x = 15{,}1\) est légèrement hors plage : c'est une extrapolation, mais assez proche de la plage donc raisonnablement fiable.
Pour chaque situation, indiquer s'il y a corrélation et si on peut conclure à une relation de causalité. Justifier.
Rappel : Corrélation = deux grandeurs évoluent ensemble. Causalité = l'une est la cause directe de l'autre. Attention : corrélation ≠ causalité !
a. On observe que dans les pays où l'on mange le plus de fromage, il y a plus de lauréats du prix Nobel.
Aide : Y a-t-il un lien direct entre manger du fromage et gagner un Nobel ? Ou bien un facteur caché (richesse du pays) pourrait-il expliquer les deux ?
b. Un médecin du sport observe que plus un athlète s'entraîne (en heures/semaine), plus son temps au 100 m diminue.
Aide : L'entraînement peut-il directement améliorer la performance ? Existe-t-il un mécanisme causal ?
c. On constate qu'en hiver, les ventes de manteaux et les accidents de la route augmentent simultanément.
Aide : Acheter un manteau provoque-t-il un accident ? Chercher le facteur commun qui influence les deux.
a. Il y a corrélation mais pas de causalité. Le facteur caché est le niveau de développement économique : les pays riches consomment plus de fromage ET investissent plus dans la recherche.
b. Il y a corrélation et causalité probable. L'entraînement améliore directement la performance physique (mécanisme causal connu).
c. Il y a corrélation mais pas de causalité. Le facteur caché est le froid / l'hiver qui explique les deux phénomènes (vêtements chauds et routes verglacées).
Un technicien chauffagiste analyse l'évolution du prix du gaz naturel (en €/MWh) sur 7 ans :
| Année | 2018 | 2019 | 2020 | 2021 | 2022 | 2023 | 2024 |
|---|---|---|---|---|---|---|---|
| Rang \(x\) | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| Prix \(y\) (€/MWh) | 22 | 24 | 19 | 35 | 85 | 45 | 38 |
a. Tracer le nuage de points.
b. Calculer le point moyen.
c. La calculatrice donne \(y = 6{,}11x + 14{,}1\) et \(R^2 = 0{,}36\). L'ajustement affine est-il pertinent ? Justifier.
d. Expliquer pourquoi un ajustement affine ne convient pas ici.
a. Le nuage montre des points très dispersés avec un pic en 2022.
b.
\[\bar{x} = \frac{1+2+3+4+5+6+7}{7} = 4\] \[\bar{y} = \frac{22+24+19+35+85+45+38}{7} = \frac{268}{7} \approx 38{,}3\]\(G(4\,;\,38{,}3)\)
c. \(R^2 = 0{,}36 < 0{,}70\) : l'ajustement affine est mauvais. Le modèle linéaire n'explique que 36 % de la variation du prix.
d. Le prix du gaz a subi un choc conjoncturel en 2022 (crise énergétique). L'évolution n'est pas régulière : un modèle linéaire ne peut pas capter ce type de variation brutale. Les données ne suivent pas une tendance affine.
Un ébéniste relève le nombre d'heures travaillées et le nombre de pièces produites chaque semaine :
| Heures \(x\) | 20 | 25 | 30 | 35 | 40 | 45 |
|---|---|---|---|---|---|---|
| Pièces \(y\) | 12 | 16 | 19 | 22 | 26 | 29 |
a. Calculer le point moyen.
b. La régression linéaire donne \(y = 0{,}672x - 1{,}33\) avec \(R^2 = 0{,}998\). Interpréter le coefficient \(a = 0{,}672\).
c. Combien de pièces peut-on espérer produire en 38 heures ?
d. Combien d'heures faut-il pour produire 25 pièces ?
e. Est-il raisonnable d'utiliser ce modèle pour prévoir la production en 80 heures ? Justifier.
a.
\[\bar{x} = \frac{20+25+30+35+40+45}{6} = \frac{195}{6} = 32{,}5\] \[\bar{y} = \frac{12+16+19+22+26+29}{6} = \frac{124}{6} \approx 20{,}7\]\(G(32{,}5\,;\,20{,}7)\)
b. Le coefficient \(a = 0{,}672\) signifie qu'en moyenne, chaque heure de travail supplémentaire permet de produire environ \(0{,}67\) pièce de plus, soit environ 2 pièces pour 3 heures supplémentaires.
c. \(y = 0{,}672 \times 38 - 1{,}33 = 25{,}54 - 1{,}33 \approx 24{,}2\). On peut espérer produire environ 24 pièces. C'est une interpolation fiable (\(R^2 = 0{,}998\)).
d. On résout \(25 = 0{,}672x - 1{,}33\) :
\[0{,}672x = 26{,}33 \implies x = \frac{26{,}33}{0{,}672} \approx 39{,}2 \text{ heures}\]e. 80 heures est bien au-delà de la plage [20 ; 45]. C'est une extrapolation risquée. En réalité, au-delà d'un certain nombre d'heures, la fatigue diminue la productivité et le rythme de production n'est plus constant.
Un installateur thermique compare deux types de radiateurs. Pour chacun, il mesure la puissance électrique consommée \(x\) (en W) et la température obtenue \(y\) (en °C) dans une pièce de 15 m².
Radiateur A : \(y = 0{,}012x + 14\) avec \(R^2 = 0{,}97\)
Radiateur B : \(y = 0{,}015x + 12\) avec \(R^2 = 0{,}85\)
a. Quel radiateur a le meilleur ajustement affine ? Justifier.
b. Pour quel radiateur la température augmente-t-elle le plus vite avec la puissance ?
c. Quelle puissance faut-il au radiateur A pour atteindre 22°C ?
a. Le radiateur A a le meilleur ajustement car \(R^2_A = 0{,}97 > R^2_B = 0{,}85\). Le modèle linéaire décrit mieux le comportement du radiateur A.
b. Le radiateur B a un coefficient directeur plus élevé (\(0{,}015 > 0{,}012\)), donc sa température augmente plus vite avec la puissance.
c. On résout \(22 = 0{,}012x + 14\) :
\[0{,}012x = 8 \implies x = \frac{8}{0{,}012} \approx 667 \text{ W}\]Une collectivité locale relève la température moyenne annuelle et la consommation de chauffage de 8 bâtiments publics :
| Bâtiment | A | B | C | D | E | F | G | H |
|---|---|---|---|---|---|---|---|---|
| Surface (m²) | 200 | 350 | 500 | 180 | 420 | 600 | 280 | 450 |
| Conso. (MWh) | 32 | 55 | 82 | 30 | 68 | 95 | 44 | 73 |
a. Calculer le point moyen.
b. Tracer le nuage de points. L'ajustement affine semble-t-il pertinent ?
c. La régression donne \(y = 0{,}16x + 0{,}25\) et \(R^2 = 0{,}998\). Interpréter.
d. Estimer la consommation d'un bâtiment de 1 000 m². Discuter la fiabilité.
e. Le bâtiment D (180 m², 30 MWh) consomme-t-il plus ou moins que prévu par le modèle ?
a.
\[\bar{x} = \frac{200+350+500+180+420+600+280+450}{8} = \frac{2980}{8} = 372{,}5\] \[\bar{y} = \frac{32+55+82+30+68+95+44+73}{8} = \frac{479}{8} = 59{,}875\]\(G(372{,}5\,;\,59{,}9)\)
b. Les points sont bien alignés. L'ajustement affine paraît très pertinent.
c. \(R^2 = 0{,}998\) : ajustement excellent. La surface explique 99,8 % de la variation de consommation. Le coefficient 0,16 signifie que chaque m² supplémentaire coûte environ 0,16 MWh de chauffage par an.
d. \(y = 0{,}16 \times 1000 + 0{,}25 = 160{,}25\) MWh. C'est une extrapolation (1 000 > 600 = max des données). Le résultat est à prendre avec précaution : un très grand bâtiment peut avoir une meilleure isolation ou un comportement thermique différent.
e. Valeur prédite : \(y = 0{,}16 \times 180 + 0{,}25 = 29{,}05\) MWh. Le bâtiment D consomme 30 MWh, soit légèrement plus que prévu (+1 MWh environ). Son isolation pourrait être légèrement déficiente.
Un agenceur d'intérieur utilise un tableur pour analyser le lien entre le budget d'un client (en k€) et la surface aménagée (en m²). Voici un extrait :
| Client | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
|---|---|---|---|---|---|---|---|---|
| Budget \(x\) (k€) | 5 | 8 | 12 | 15 | 20 | 25 | 30 | 35 |
| Surface \(y\) (m²) | 8 | 14 | 20 | 24 | 32 | 38 | 46 | 54 |
a. Calculer le point moyen.
b. La régression donne \(y = 1{,}52x + 0{,}5\) et \(R^2 = 0{,}998\). Interpréter le coefficient 1,52.
c. Un client dispose de 18 k€. Quelle surface peut-il espérer faire aménager ?
d. Un client souhaite aménager 40 m². Quel budget doit-il prévoir ?
a.
\[\bar{x} = \frac{5+8+12+15+20+25+30+35}{8} = \frac{150}{8} = 18{,}75\] \[\bar{y} = \frac{8+14+20+24+32+38+46+54}{8} = \frac{236}{8} = 29{,}5\]\(G(18{,}75\,;\,29{,}5)\)
b. Le coefficient 1,52 signifie que pour chaque millier d'euros supplémentaire de budget, la surface aménagée augmente d'environ 1,52 m².
c. \(y = 1{,}52 \times 18 + 0{,}5 = 27{,}36 + 0{,}5 = 27{,}9\) m². Interpolation fiable.
d. On résout \(40 = 1{,}52x + 0{,}5\) :
\[1{,}52x = 39{,}5 \implies x = \frac{39{,}5}{1{,}52} \approx 26{,}0 \text{ k€}\]Le client doit prévoir un budget d'environ 26 000 €.
On dispose de trois séries statistiques à deux variables. Pour chacune, la calculatrice donne :
| Série | Équation de régression | \(R^2\) |
|---|---|---|
| Série 1 | \(y = 2{,}5x + 10\) | 0,97 |
| Série 2 | \(y = -0{,}8x + 50\) | 0,62 |
| Série 3 | \(y = 1{,}1x - 3\) | 0,91 |
a. Pour quelle(s) série(s) l'ajustement affine est-il pertinent ?
b. Pour la série 2, que peut-on dire ? Proposer une explication.
c. Pour la série 1, le coefficient directeur est positif. Que cela signifie-t-il ?
a. Les séries 1 et 3 ont un ajustement pertinent (\(R^2 > 0{,}90\)).
b. Pour la série 2, \(R^2 = 0{,}62 < 0{,}70\) : l'ajustement affine est mauvais. Les données ne suivent probablement pas une tendance linéaire. Il faudrait envisager un autre type de modèle ou vérifier s'il y a des valeurs aberrantes.
c. Le coefficient directeur positif (\(a = 2{,}5\)) signifie que \(y\) augmente quand \(x\) augmente : la corrélation est positive. Plus précisément, quand \(x\) augmente de 1 unité, \(y\) augmente de 2,5 unités en moyenne.