← Retour au sommaire

Chapitre 1 – Exercices

Statistique à deux variables | 1ère Bac Pro

🎯 Objectifs du chapitre cliquer pour développer

Rappels essentiels

Exercices guidés pas à pas

Exercice 1 Point moyen — Ventes de bois Socle

Un menuisier relève ses ventes mensuelles (en m³) et son chiffre d'affaires (en €) :

\(x\) (m³)58121520
\(y\) (€)1 2001 9002 8503 6004 800

a. Calculer les coordonnées du point moyen \(G(\bar{x}\,;\,\bar{y})\).

b. Placer les points et \(G\) dans un repère.

a.

\[\bar{x} = \frac{5+8+12+15+20}{5} = \frac{60}{5} = 12\] \[\bar{y} = \frac{1200+1900+2850+3600+4800}{5} = \frac{14350}{5} = 2870\]

Le point moyen est \(G(12\,;\,2870)\).

b. Le nuage et le point moyen sont à tracer dans un repère avec \(x\) de 0 à 22 et \(y\) de 0 à 5000.

Exercice 2 Lecture d'un nuage — Température et consommation Socle

Le nuage de points ci-dessous représente la consommation électrique (en kWh) d'un atelier de menuiserie en fonction de la température extérieure (en °C).

a. Les points semblent-ils alignés ? Justifier.

b. La corrélation est-elle positive ou négative ? Expliquer.

c. Calculer le point moyen \(G\).

a. Oui, les points semblent globalement alignés. Un ajustement affine paraît pertinent.

b. La corrélation est négative : quand la température augmente, la consommation diminue (le chauffage est moins sollicité).

c.

\[\bar{x} = \frac{0+5+10+15+20+25+30}{7} = \frac{105}{7} = 15\] \[\bar{y} = \frac{480+410+340+290+250+220+200}{7} = \frac{2190}{7} \approx 312{,}9\]

\(G(15\,;\,312{,}9)\)

Exercice 3 Vérification de la droite — Passage par le point moyen Socle

On donne la droite de régression \(y = 3{,}2x + 14\) pour une série dont le point moyen est \(G(10\,;\,46)\).

a. Vérifier que la droite passe par le point moyen.

b. Calculer \(y\) pour \(x = 7\). S'agit-il d'une interpolation ou d'une extrapolation si les données vont de \(x = 4\) à \(x = 18\) ?

a. On calcule : \(3{,}2 \times 10 + 14 = 32 + 14 = 46 = \bar{y}\). La droite passe bien par \(G\).

b. \(y = 3{,}2 \times 7 + 14 = 22{,}4 + 14 = 36{,}4\).

Comme \(7\) est compris entre 4 et 18 (plage des données), il s'agit d'une interpolation.


Exercice 4 Régression complète — Entraînement sportif Socle

Un entraîneur relève la distance parcourue (en km) et la fréquence cardiaque moyenne (en bpm) lors de courses de durées différentes :

Distance \(x\) (km)358101215
FC moyenne \(y\) (bpm)125138150158165175

a. Calculer le point moyen \(G(\bar{x}\,;\,\bar{y})\).

Étape 1 : Additionner toutes les valeurs de \(x\) : \(3 + 5 + 8 + 10 + 12 + 15 = \ldots\) puis diviser par 6.

Étape 2 : Faire de même pour les valeurs de \(y\).

b. La calculatrice donne : \(y = 4{,}12x + 112{,}7\) et \(r = 0{,}998\). Calculer \(R^2\) et commenter la qualité de l'ajustement.

Aide : \(R^2 = r^2 = (0{,}998)^2 = \ldots\) Si \(R^2\) est proche de 1, l'ajustement est bon.

c. Estimer la fréquence cardiaque pour une course de 7 km. Est-ce une interpolation ?

Étape 1 : Remplacer \(x\) par 7 dans l'équation : \(y = 4{,}12 \times 7 + 112{,}7 = \ldots\)

Étape 2 : Vérifier si 7 est dans la plage des données \([3\,;\,15]\).

d. Estimer la fréquence cardiaque pour une course de 25 km. Commenter.

Aide : 25 est-il dans la plage \([3\,;\,15]\) ? Si non, c'est une extrapolation. Le résultat est-il réaliste ?

a.

\[\bar{x} = \frac{3+5+8+10+12+15}{6} = \frac{53}{6} \approx 8{,}83\] \[\bar{y} = \frac{125+138+150+158+165+175}{6} = \frac{911}{6} \approx 151{,}8\]

\(G(8{,}83\,;\,151{,}8)\)

b. \(R^2 = (0{,}998)^2 \approx 0{,}996\). L'ajustement est excellent car \(R^2 > 0{,}99\).

c. \(y = 4{,}12 \times 7 + 112{,}7 = 28{,}84 + 112{,}7 = 141{,}5\) bpm.

Comme \(7 \in [3\,;\,15]\), c'est une interpolation fiable.

d. \(y = 4{,}12 \times 25 + 112{,}7 = 103 + 112{,}7 = 215{,}7\) bpm.

C'est une extrapolation. Le résultat (216 bpm) est proche de la fréquence cardiaque maximale. Le modèle linéaire n'est plus réaliste pour de telles distances car la FC plafonne.

Exercice 5 Ajustement et R² — Isolation thermique Socle

Un installateur thermique étudie le lien entre l'épaisseur d'isolant (en cm) et la déperdition thermique (en W/m²) d'un mur :

Épaisseur \(x\) (cm)2468101214
Déperdition \(y\) (W/m²)42352823191614

a. Représenter le nuage de points.

Aide : Placer chaque couple \((x\,;\,y)\) dans un repère. L'axe horizontal représente l'épaisseur, l'axe vertical la déperdition.

b. Le nuage semble-t-il linéaire ?

Aide : Les points sont-ils à peu près alignés ? Si oui, un ajustement affine est envisageable.

c. La calculatrice donne \(y = -2{,}29x + 44{,}5\) et \(R^2 = 0{,}98\). L'ajustement est-il pertinent ?

Aide : Comparer \(R^2\) à 0,90. Si \(R^2 \geq 0{,}90\), l'ajustement est pertinent.

d. Quelle épaisseur d'isolant faudrait-il pour une déperdition de 10 W/m² ? S'agit-il d'une interpolation ou d'une extrapolation ?

Étape 1 : Remplacer \(y\) par 10 dans l'équation : \(10 = -2{,}29x + 44{,}5\).

Étape 2 : Isoler \(x\) : \(2{,}29x = 44{,}5 - 10 = \ldots\) puis \(x = \ldots\)

Étape 3 : La valeur trouvée est-elle dans la plage \([2\,;\,14]\) ?

a. On place les 7 points dans un repère.

b. Les points semblent globalement alignés avec une légère courbure. L'ajustement affine reste une bonne approximation.

c. \(R^2 = 0{,}98 > 0{,}90\), l'ajustement est pertinent.

d. On résout \(10 = -2{,}29x + 44{,}5\) :

\[2{,}29x = 44{,}5 - 10 = 34{,}5\] \[x = \frac{34{,}5}{2{,}29} \approx 15{,}1 \text{ cm}\]

Comme les données vont de 2 à 14 cm, \(x = 15{,}1\) est légèrement hors plage : c'est une extrapolation, mais assez proche de la plage donc raisonnablement fiable.

Exercice 6 Corrélation et causalité Socle

Pour chaque situation, indiquer s'il y a corrélation et si on peut conclure à une relation de causalité. Justifier.

Rappel : Corrélation = deux grandeurs évoluent ensemble. Causalité = l'une est la cause directe de l'autre. Attention : corrélation ≠ causalité !

a. On observe que dans les pays où l'on mange le plus de fromage, il y a plus de lauréats du prix Nobel.

Aide : Y a-t-il un lien direct entre manger du fromage et gagner un Nobel ? Ou bien un facteur caché (richesse du pays) pourrait-il expliquer les deux ?

b. Un médecin du sport observe que plus un athlète s'entraîne (en heures/semaine), plus son temps au 100 m diminue.

Aide : L'entraînement peut-il directement améliorer la performance ? Existe-t-il un mécanisme causal ?

c. On constate qu'en hiver, les ventes de manteaux et les accidents de la route augmentent simultanément.

Aide : Acheter un manteau provoque-t-il un accident ? Chercher le facteur commun qui influence les deux.

a. Il y a corrélation mais pas de causalité. Le facteur caché est le niveau de développement économique : les pays riches consomment plus de fromage ET investissent plus dans la recherche.

b. Il y a corrélation et causalité probable. L'entraînement améliore directement la performance physique (mécanisme causal connu).

c. Il y a corrélation mais pas de causalité. Le facteur caché est le froid / l'hiver qui explique les deux phénomènes (vêtements chauds et routes verglacées).

Exercices d'application

Exercice 7 Étude complète — Évolution du prix de l'énergie Standard

Un technicien chauffagiste analyse l'évolution du prix du gaz naturel (en €/MWh) sur 7 ans :

Année2018201920202021202220232024
Rang \(x\)1234567
Prix \(y\) (€/MWh)22241935854538

a. Tracer le nuage de points.

b. Calculer le point moyen.

c. La calculatrice donne \(y = 6{,}11x + 14{,}1\) et \(R^2 = 0{,}36\). L'ajustement affine est-il pertinent ? Justifier.

d. Expliquer pourquoi un ajustement affine ne convient pas ici.

a. Le nuage montre des points très dispersés avec un pic en 2022.

b.

\[\bar{x} = \frac{1+2+3+4+5+6+7}{7} = 4\] \[\bar{y} = \frac{22+24+19+35+85+45+38}{7} = \frac{268}{7} \approx 38{,}3\]

\(G(4\,;\,38{,}3)\)

c. \(R^2 = 0{,}36 < 0{,}70\) : l'ajustement affine est mauvais. Le modèle linéaire n'explique que 36 % de la variation du prix.

d. Le prix du gaz a subi un choc conjoncturel en 2022 (crise énergétique). L'évolution n'est pas régulière : un modèle linéaire ne peut pas capter ce type de variation brutale. Les données ne suivent pas une tendance affine.

Exercice 8 Problème complet — Production d'un atelier Standard

Un ébéniste relève le nombre d'heures travaillées et le nombre de pièces produites chaque semaine :

Heures \(x\)202530354045
Pièces \(y\)121619222629

a. Calculer le point moyen.

b. La régression linéaire donne \(y = 0{,}672x - 1{,}33\) avec \(R^2 = 0{,}998\). Interpréter le coefficient \(a = 0{,}672\).

c. Combien de pièces peut-on espérer produire en 38 heures ?

d. Combien d'heures faut-il pour produire 25 pièces ?

e. Est-il raisonnable d'utiliser ce modèle pour prévoir la production en 80 heures ? Justifier.

a.

\[\bar{x} = \frac{20+25+30+35+40+45}{6} = \frac{195}{6} = 32{,}5\] \[\bar{y} = \frac{12+16+19+22+26+29}{6} = \frac{124}{6} \approx 20{,}7\]

\(G(32{,}5\,;\,20{,}7)\)

b. Le coefficient \(a = 0{,}672\) signifie qu'en moyenne, chaque heure de travail supplémentaire permet de produire environ \(0{,}67\) pièce de plus, soit environ 2 pièces pour 3 heures supplémentaires.

c. \(y = 0{,}672 \times 38 - 1{,}33 = 25{,}54 - 1{,}33 \approx 24{,}2\). On peut espérer produire environ 24 pièces. C'est une interpolation fiable (\(R^2 = 0{,}998\)).

d. On résout \(25 = 0{,}672x - 1{,}33\) :

\[0{,}672x = 26{,}33 \implies x = \frac{26{,}33}{0{,}672} \approx 39{,}2 \text{ heures}\]

e. 80 heures est bien au-delà de la plage [20 ; 45]. C'est une extrapolation risquée. En réalité, au-delà d'un certain nombre d'heures, la fatigue diminue la productivité et le rythme de production n'est plus constant.

Exercice 9 Comparaison de deux ajustements Standard

Un installateur thermique compare deux types de radiateurs. Pour chacun, il mesure la puissance électrique consommée \(x\) (en W) et la température obtenue \(y\) (en °C) dans une pièce de 15 m².

Radiateur A : \(y = 0{,}012x + 14\) avec \(R^2 = 0{,}97\)

Radiateur B : \(y = 0{,}015x + 12\) avec \(R^2 = 0{,}85\)

a. Quel radiateur a le meilleur ajustement affine ? Justifier.

b. Pour quel radiateur la température augmente-t-elle le plus vite avec la puissance ?

c. Quelle puissance faut-il au radiateur A pour atteindre 22°C ?

a. Le radiateur A a le meilleur ajustement car \(R^2_A = 0{,}97 > R^2_B = 0{,}85\). Le modèle linéaire décrit mieux le comportement du radiateur A.

b. Le radiateur B a un coefficient directeur plus élevé (\(0{,}015 > 0{,}012\)), donc sa température augmente plus vite avec la puissance.

c. On résout \(22 = 0{,}012x + 14\) :

\[0{,}012x = 8 \implies x = \frac{8}{0{,}012} \approx 667 \text{ W}\]

Exercices d'approfondissement

Exercice 10 Problème ouvert — Consommation et climat Approfondissement

Une collectivité locale relève la température moyenne annuelle et la consommation de chauffage de 8 bâtiments publics :

BâtimentABCDEFGH
Surface (m²)200350500180420600280450
Conso. (MWh)3255823068954473

a. Calculer le point moyen.

b. Tracer le nuage de points. L'ajustement affine semble-t-il pertinent ?

c. La régression donne \(y = 0{,}16x + 0{,}25\) et \(R^2 = 0{,}998\). Interpréter.

d. Estimer la consommation d'un bâtiment de 1 000 m². Discuter la fiabilité.

e. Le bâtiment D (180 m², 30 MWh) consomme-t-il plus ou moins que prévu par le modèle ?

a.

\[\bar{x} = \frac{200+350+500+180+420+600+280+450}{8} = \frac{2980}{8} = 372{,}5\] \[\bar{y} = \frac{32+55+82+30+68+95+44+73}{8} = \frac{479}{8} = 59{,}875\]

\(G(372{,}5\,;\,59{,}9)\)

b. Les points sont bien alignés. L'ajustement affine paraît très pertinent.

c. \(R^2 = 0{,}998\) : ajustement excellent. La surface explique 99,8 % de la variation de consommation. Le coefficient 0,16 signifie que chaque m² supplémentaire coûte environ 0,16 MWh de chauffage par an.

d. \(y = 0{,}16 \times 1000 + 0{,}25 = 160{,}25\) MWh. C'est une extrapolation (1 000 > 600 = max des données). Le résultat est à prendre avec précaution : un très grand bâtiment peut avoir une meilleure isolation ou un comportement thermique différent.

e. Valeur prédite : \(y = 0{,}16 \times 180 + 0{,}25 = 29{,}05\) MWh. Le bâtiment D consomme 30 MWh, soit légèrement plus que prévu (+1 MWh environ). Son isolation pourrait être légèrement déficiente.

Exercice 11 Tableur et régression — Projet professionnel Approfondissement

Un agenceur d'intérieur utilise un tableur pour analyser le lien entre le budget d'un client (en k€) et la surface aménagée (en m²). Voici un extrait :

Client12345678
Budget \(x\) (k€)58121520253035
Surface \(y\) (m²)814202432384654

a. Calculer le point moyen.

b. La régression donne \(y = 1{,}52x + 0{,}5\) et \(R^2 = 0{,}998\). Interpréter le coefficient 1,52.

c. Un client dispose de 18 k€. Quelle surface peut-il espérer faire aménager ?

d. Un client souhaite aménager 40 m². Quel budget doit-il prévoir ?

a.

\[\bar{x} = \frac{5+8+12+15+20+25+30+35}{8} = \frac{150}{8} = 18{,}75\] \[\bar{y} = \frac{8+14+20+24+32+38+46+54}{8} = \frac{236}{8} = 29{,}5\]

\(G(18{,}75\,;\,29{,}5)\)

b. Le coefficient 1,52 signifie que pour chaque millier d'euros supplémentaire de budget, la surface aménagée augmente d'environ 1,52 m².

c. \(y = 1{,}52 \times 18 + 0{,}5 = 27{,}36 + 0{,}5 = 27{,}9\) m². Interpolation fiable.

d. On résout \(40 = 1{,}52x + 0{,}5\) :

\[1{,}52x = 39{,}5 \implies x = \frac{39{,}5}{1{,}52} \approx 26{,}0 \text{ k€}\]

Le client doit prévoir un budget d'environ 26 000 €.

Exercice 12 Synthèse — Choisir le bon modèle Approfondissement

On dispose de trois séries statistiques à deux variables. Pour chacune, la calculatrice donne :

SérieÉquation de régression\(R^2\)
Série 1\(y = 2{,}5x + 10\)0,97
Série 2\(y = -0{,}8x + 50\)0,62
Série 3\(y = 1{,}1x - 3\)0,91

a. Pour quelle(s) série(s) l'ajustement affine est-il pertinent ?

b. Pour la série 2, que peut-on dire ? Proposer une explication.

c. Pour la série 1, le coefficient directeur est positif. Que cela signifie-t-il ?

a. Les séries 1 et 3 ont un ajustement pertinent (\(R^2 > 0{,}90\)).

b. Pour la série 2, \(R^2 = 0{,}62 < 0{,}70\) : l'ajustement affine est mauvais. Les données ne suivent probablement pas une tendance linéaire. Il faudrait envisager un autre type de modèle ou vérifier s'il y a des valeurs aberrantes.

c. Le coefficient directeur positif (\(a = 2{,}5\)) signifie que \(y\) augmente quand \(x\) augmente : la corrélation est positive. Plus précisément, quand \(x\) augmente de 1 unité, \(y\) augmente de 2,5 unités en moyenne.