← RETOUR SOMMAIRE

Chapitre 1 – Interrogation écrite

Statistique à deux variables — 1ère Bac Pro

🎯 Objectifs du chapitre cliquer pour développer

Durée : 10-15 min | Calculatrice autorisée

Socle

Sujet A

Barème : 20 points

Question 1 (4 points)

Rappel : Le point moyen \(G\) a pour coordonnées \(G(\bar{x}\,;\,\bar{y})\) avec \(\bar{x} = \dfrac{\text{somme des } x_i}{n}\) et \(\bar{y} = \dfrac{\text{somme des } y_i}{n}\).

Un technicien chauffagiste relève la température extérieure \(x\) (en °C) et la consommation de chauffage \(y\) (en MWh) sur 4 mois :

Température \(x\) (°C)46810
Consommation \(y\) (MWh)30242014

a) Calculer \(\bar{x} = \dfrac{4 + 6 + 8 + 10}{4} = \dfrac{...}{4} = ...\)

b) Calculer \(\bar{y} = \dfrac{30 + 24 + 20 + 14}{4} = \dfrac{...}{4} = ...\)

c) En déduire les coordonnées du point moyen \(G(...\,;\,...)\).

Réponse :

a) \(\bar{x} = \dfrac{4+6+8+10}{4} = \dfrac{28}{4} = \mathbf{7}\)

b) \(\bar{y} = \dfrac{30+24+20+14}{4} = \dfrac{88}{4} = \mathbf{22}\)

c) Le point moyen est \(G(\mathbf{7}\,;\,\mathbf{22})\).

Question 2 (4 points)

Rappel : Pour utiliser la droite de régression \(y = ax + b\), on remplace \(x\) par la valeur donnée et on calcule \(y\).

La droite de régression obtenue à la calculatrice est : \(y = -2x + 36\).

a) Vérifier que la droite passe par le point moyen \(G(7\,;\,22)\) : calculer \(-2 \times 7 + 36 = ...\)

b) Estimer la consommation pour une température de 5 °C : \(y = -2 \times 5 + 36 = ...\)

c) Cette estimation est-elle une interpolation ou une extrapolation ? Justifier.

Réponse :

a) \(-2 \times 7 + 36 = -14 + 36 = \mathbf{22}\). On retrouve bien \(\bar{y} = 22\), la droite passe par \(G\).

b) \(y = -2 \times 5 + 36 = -10 + 36 = \mathbf{26}\) MWh.

c) C'est une interpolation car 5 °C est à l'intérieur de la plage de données [4 ; 10].

Question 3 (4 points)

Rappel : \(R^2\) proche de 1 = bon ajustement ; \(R^2\) proche de 0 = mauvais ajustement.

La calculatrice affiche \(R^2 = 0{,}98\).

a) L'ajustement affine est-il de bonne qualité ? Justifier.

Réponse :

b) Que signifie \(R^2 = 0{,}98\) en termes de pourcentage ?

Réponse :

a) Oui, l'ajustement est de bonne qualité car \(R^2 = 0{,}98\) est très proche de 1 (\(R^2 \geqslant 0{,}90\)).

b) Cela signifie que 98 % de la variation de \(y\) est expliquée par la relation linéaire avec \(x\).

Question 4 (4 points)

Rappel : L'extrapolation est risquée car le modèle peut ne plus être valable en dehors des données.

Toujours avec la droite \(y = -2x + 36\) :

a) Estimer la consommation pour \(x = 20\) °C : \(y = -2 \times 20 + 36 = ...\)

b) Ce résultat est-il réaliste ? Pourquoi ?

Réponse :

c) S'agit-il d'une interpolation ou d'une extrapolation ?

Réponse :

a) \(y = -2 \times 20 + 36 = -40 + 36 = \mathbf{-4}\) MWh.

b) Ce résultat n'est pas réaliste : une consommation négative n'a pas de sens. En été, le chauffage est simplement éteint.

c) C'est une extrapolation car 20 °C est en dehors de la plage [4 ; 10].

Question 5 (4 points)

Indiquer si les affirmations suivantes sont vraies ou fausses. Justifier chaque réponse.

a) « Si deux variables sont corrélées, alors l'une est la cause de l'autre. »

Réponse :

b) « La droite de régression passe toujours par le point moyen \(G\). »

Réponse :

a) FAUX. Corrélation ne signifie pas causalité. Il peut exister un facteur caché qui explique les deux variables (exemple : ventes de glaces et noyades augmentent en été à cause de la chaleur).

b) VRAI. La droite de régression (moindres carrés) passe toujours par le point moyen \(G(\bar{x}\,;\,\bar{y})\).

Sujet B

Barème : 20 points

Question 1 (4 points)

Rappel : Le point moyen \(G\) a pour coordonnées \(G(\bar{x}\,;\,\bar{y})\) avec \(\bar{x} = \dfrac{\text{somme des } x_i}{n}\) et \(\bar{y} = \dfrac{\text{somme des } y_i}{n}\).

Un installateur thermique relève la température extérieure \(x\) (en °C) et la consommation de gaz \(y\) (en MWh) sur 4 mois :

Température \(x\) (°C)261014
Consommation \(y\) (MWh)35271911

a) Calculer \(\bar{x} = \dfrac{2 + 6 + 10 + 14}{4} = \dfrac{...}{4} = ...\)

b) Calculer \(\bar{y} = \dfrac{35 + 27 + 19 + 11}{4} = \dfrac{...}{4} = ...\)

c) En déduire les coordonnées du point moyen \(G(...\,;\,...)\).

Réponse :

a) \(\bar{x} = \dfrac{2+6+10+14}{4} = \dfrac{32}{4} = \mathbf{8}\)

b) \(\bar{y} = \dfrac{35+27+19+11}{4} = \dfrac{92}{4} = \mathbf{23}\)

c) Le point moyen est \(G(\mathbf{8}\,;\,\mathbf{23})\).

Question 2 (4 points)

Rappel : Pour utiliser la droite de régression \(y = ax + b\), on remplace \(x\) par la valeur donnée et on calcule \(y\).

La droite de régression obtenue à la calculatrice est : \(y = -2x + 39\).

a) Vérifier que la droite passe par le point moyen \(G(8\,;\,23)\) : calculer \(-2 \times 8 + 39 = ...\)

b) Estimer la consommation pour une température de 7 °C : \(y = -2 \times 7 + 39 = ...\)

c) Cette estimation est-elle une interpolation ou une extrapolation ? Justifier.

Réponse :

a) \(-2 \times 8 + 39 = -16 + 39 = \mathbf{23}\). On retrouve bien \(\bar{y} = 23\), la droite passe par \(G\).

b) \(y = -2 \times 7 + 39 = -14 + 39 = \mathbf{25}\) MWh.

c) C'est une interpolation car 7 °C est à l'intérieur de la plage de données [2 ; 14].

Question 3 (4 points)

Rappel : \(R^2\) proche de 1 = bon ajustement ; \(R^2\) proche de 0 = mauvais ajustement.

La calculatrice affiche \(R^2 = 0{,}99\).

a) L'ajustement affine est-il de bonne qualité ? Justifier.

Réponse :

b) Que signifie \(R^2 = 0{,}99\) en termes de pourcentage ?

Réponse :

a) Oui, l'ajustement est de bonne qualité car \(R^2 = 0{,}99\) est très proche de 1 (\(R^2 \geqslant 0{,}90\)).

b) Cela signifie que 99 % de la variation de \(y\) est expliquée par la relation linéaire avec \(x\).

Question 4 (4 points)

Rappel : L'extrapolation est risquée car le modèle peut ne plus être valable en dehors des données.

Toujours avec la droite \(y = -2x + 39\) :

a) Estimer la consommation pour \(x = 25\) °C : \(y = -2 \times 25 + 39 = ...\)

b) Ce résultat est-il réaliste ? Pourquoi ?

Réponse :

c) S'agit-il d'une interpolation ou d'une extrapolation ?

Réponse :

a) \(y = -2 \times 25 + 39 = -50 + 39 = \mathbf{-11}\) MWh.

b) Ce résultat n'est pas réaliste : une consommation négative n'a pas de sens. En été, le chauffage est simplement éteint.

c) C'est une extrapolation car 25 °C est en dehors de la plage [2 ; 14].

Question 5 (4 points)

Indiquer si les affirmations suivantes sont vraies ou fausses. Justifier chaque réponse.

a) « La droite de régression passe toujours par l'origine du repère. »

Réponse :

b) « Si \(R^2 = 0{,}95\), l'ajustement linéaire est de bonne qualité. »

Réponse :

a) FAUX. La droite de régression passe toujours par le point moyen \(G(\bar{x}\,;\,\bar{y})\), pas nécessairement par l'origine.

b) VRAI. \(R^2 = 0{,}95 \geqslant 0{,}90\), donc l'ajustement est de bonne qualité : 95 % de la variation est expliquée par le modèle linéaire.

Standard

Sujet A

Barème : 20 points

Question 1 (4 points)

Un menuisier agenceur relève le nombre de meubles produits par semaine \(x\) et le coût total \(y\) (en €) :

Meubles \(x\)510152025
Coût \(y\) (€)1 4002 6003 9005 1006 400

a) Calculer les coordonnées du point moyen \(G(\bar{x}\,;\,\bar{y})\).

b) Placer le point moyen dans un repère adapté.

a) \(\bar{x} = \dfrac{5+10+15+20+25}{5} = \dfrac{75}{5} = \mathbf{15}\)

\(\bar{y} = \dfrac{1400+2600+3900+5100+6400}{5} = \dfrac{19\,400}{5} = \mathbf{3\,880}\)

Le point moyen est \(G(15\,;\,3\,880)\).

b) On place le point \(G\) aux coordonnées \((15\,;\,3\,880)\) dans le repère.

Question 2 (5 points)

La calculatrice donne la droite de régression : \(y = 250x + 130\), avec \(R^2 = 0{,}998\).

a) La qualité de l'ajustement est-elle satisfaisante ? Justifier.

b) Vérifier que la droite passe par le point moyen \(G\).

c) Interpréter le coefficient \(a = 250\) dans le contexte de la situation.

a) Oui, \(R^2 = 0{,}998\) est très proche de 1 (\(\geqslant 0{,}90\)), l'ajustement est excellent.

b) \(y = 250 \times 15 + 130 = 3\,750 + 130 = 3\,880\). On retrouve bien \(\bar{y} = 3\,880\), la droite passe par \(G\). ✓

c) Le coefficient \(a = 250\) signifie que chaque meuble supplémentaire coûte environ 250 € de plus en production.

Question 3 (4 points)

a) Estimer le coût de production de 18 meubles.

b) Estimer le coût de production de 50 meubles.

c) Pour chaque estimation, préciser s'il s'agit d'une interpolation ou d'une extrapolation, et indiquer sa fiabilité.

a) \(y = 250 \times 18 + 130 = 4\,500 + 130 = \mathbf{4\,630}\) €.

b) \(y = 250 \times 50 + 130 = 12\,500 + 130 = \mathbf{12\,630}\) €.

c) Pour 18 meubles : interpolation (18 est dans [5 ; 25]) → estimation fiable.

Pour 50 meubles : extrapolation (50 est hors [5 ; 25]) → estimation risquée (des économies d'échelle ou des coûts supplémentaires peuvent modifier la relation).

Question 4 (3 points)

On observe une corrélation entre la consommation de chocolat par pays et le nombre de prix Nobel obtenus.

a) Peut-on en conclure que le chocolat rend plus intelligent ? Justifier.

b) Proposer un facteur caché qui pourrait expliquer cette corrélation.

a) Non. Corrélation ne signifie pas causalité. Ce n'est pas parce que deux variables évoluent ensemble que l'une cause l'autre.

b) Le niveau de développement économique est un facteur caché : les pays riches consomment plus de chocolat et investissent davantage dans la recherche.

Question 5 (4 points)

Un installateur thermique relève la température extérieure \(x\) et la consommation de gaz \(y\) sur 5 mois. Il obtient \(r = -0{,}96\).

a) Calculer \(R^2\).

b) Que signifie le signe négatif de \(r\) ?

c) L'ajustement linéaire est-il adapté ?

a) \(R^2 = (-0{,}96)^2 = \mathbf{0{,}9216}\).

b) Le signe négatif de \(r\) indique une corrélation négative : quand la température augmente, la consommation diminue.

c) Oui, \(R^2 = 0{,}92 \geqslant 0{,}90\), l'ajustement est bon.

Sujet B

Barème : 20 points

Question 1 (4 points)

Un artisan ébéniste relève le nombre de pièces fabriquées par semaine \(x\) et le coût total \(y\) (en €) :

Pièces \(x\)48121620
Coût \(y\) (€)1 1002 0002 9003 9004 700

a) Calculer les coordonnées du point moyen \(G(\bar{x}\,;\,\bar{y})\).

b) Placer le point moyen dans un repère adapté.

a) \(\bar{x} = \dfrac{4+8+12+16+20}{5} = \dfrac{60}{5} = \mathbf{12}\)

\(\bar{y} = \dfrac{1100+2000+2900+3900+4700}{5} = \dfrac{14\,600}{5} = \mathbf{2\,920}\)

Le point moyen est \(G(12\,;\,2\,920)\).

b) On place le point \(G\) aux coordonnées \((12\,;\,2\,920)\) dans le repère.

Question 2 (5 points)

La calculatrice donne la droite de régression : \(y = 225x + 220\), avec \(R^2 = 0{,}995\).

a) La qualité de l'ajustement est-elle satisfaisante ? Justifier.

b) Vérifier que la droite passe par le point moyen \(G\).

c) Interpréter le coefficient \(a = 225\) dans le contexte de la situation.

a) Oui, \(R^2 = 0{,}995\) est très proche de 1 (\(\geqslant 0{,}90\)), l'ajustement est excellent.

b) \(y = 225 \times 12 + 220 = 2\,700 + 220 = 2\,920\). On retrouve bien \(\bar{y} = 2\,920\), la droite passe par \(G\). ✓

c) Le coefficient \(a = 225\) signifie que chaque pièce supplémentaire coûte environ 225 € de plus en production.

Question 3 (4 points)

a) Estimer le coût de production de 14 pièces.

b) Estimer le coût de production de 40 pièces.

c) Pour chaque estimation, préciser s'il s'agit d'une interpolation ou d'une extrapolation, et indiquer sa fiabilité.

a) \(y = 225 \times 14 + 220 = 3\,150 + 220 = \mathbf{3\,370}\) €.

b) \(y = 225 \times 40 + 220 = 9\,000 + 220 = \mathbf{9\,220}\) €.

c) Pour 14 pièces : interpolation (14 est dans [4 ; 20]) → estimation fiable.

Pour 40 pièces : extrapolation (40 est hors [4 ; 20]) → estimation risquée (des économies d'échelle ou des contraintes de capacité peuvent modifier la relation).

Question 4 (3 points)

On observe une corrélation entre le nombre d'heures de soleil par jour et les ventes de crème solaire.

a) Peut-on en conclure que le soleil fait acheter de la crème solaire ? Justifier.

b) Proposer un facteur caché qui pourrait expliquer cette corrélation.

a) Attention. Ici la causalité semble plausible, mais il faut rester prudent. Corrélation ne signifie pas automatiquement causalité.

b) La saison estivale est un facteur commun : en été, il y a plus de soleil et les gens partent en vacances, ce qui augmente les deux variables simultanément.

Question 5 (4 points)

Un plombier chauffagiste relève l'âge \(x\) d'une installation et sa consommation énergétique \(y\) sur 5 mois. Il obtient \(r = 0{,}94\).

a) Calculer \(R^2\).

b) Que signifie le signe positif de \(r\) ?

c) L'ajustement linéaire est-il adapté ?

a) \(R^2 = (0{,}94)^2 = \mathbf{0{,}8836}\).

b) Le signe positif de \(r\) indique une corrélation positive : quand l'âge de l'installation augmente, la consommation augmente aussi.

c) \(R^2 = 0{,}88\), ce qui est proche de 0,90 mais légèrement inférieur. L'ajustement est correct mais pas excellent.

Approfondissement

Sujet A

Barème : 20 points

Question 1 (5 points)

Un technicien de maintenance énergétique étudie la relation entre l'âge \(x\) (en années) d'une chaudière et ses coûts d'entretien annuels \(y\) (en €) :

Âge \(x\) (années)1357911
Coût \(y\) (€)120200310380470560

a) Calculer les coordonnées du point moyen \(G\).

b) La calculatrice donne \(y = 44x + 78\) avec \(R^2 = 0{,}996\). Vérifier que la droite passe par \(G\).

c) Estimer le coût d'entretien pour une chaudière de 15 ans. Commenter la fiabilité de cette estimation.

a) \(\bar{x} = \dfrac{1+3+5+7+9+11}{6} = \dfrac{36}{6} = 6\)

\(\bar{y} = \dfrac{120+200+310+380+470+560}{6} = \dfrac{2\,040}{6} = 340\)

Le point moyen est \(G(6\,;\,340)\).

b) \(y = 44 \times 6 + 78 = 264 + 78 = 342\). On obtient 342 au lieu de 340, l'écart est dû aux arrondis des coefficients. La droite passe « au mieux » par \(G\).

c) \(y = 44 \times 15 + 78 = 660 + 78 = \mathbf{738}\) €. C'est une extrapolation (15 est hors de [1 ; 11]). Elle est risquée : au-delà d'un certain âge, les coûts pourraient augmenter plus vite (pannes graves) ou la chaudière être remplacée.

Question 2 (5 points)

Une étude compare le temps de séchage \(x\) (en heures) et la résistance \(y\) (en MPa) d'un vernis utilisé en menuiserie :

Temps \(x\) (h)246810
Résistance \(y\) (MPa)512182329

a) Calculer le point moyen \(G\).

b) On obtient \(y = 2{,}95x - 0{,}7\) et \(r = 0{,}999\). Interpréter le coefficient directeur dans le contexte.

c) À partir de combien d'heures la résistance dépasse-t-elle 15 MPa ? Résoudre l'inéquation.

a) \(\bar{x} = \dfrac{2+4+6+8+10}{5} = \dfrac{30}{5} = 6\)

\(\bar{y} = \dfrac{5+12+18+23+29}{5} = \dfrac{87}{5} = 17{,}4\)

Point moyen : \(G(6\,;\,17{,}4)\).

b) Le coefficient \(a = 2{,}95\) signifie que chaque heure de séchage supplémentaire augmente la résistance d'environ 2,95 MPa.

c) On résout \(2{,}95x - 0{,}7 \geqslant 15\) :

\(2{,}95x \geqslant 15{,}7\)

\(x \geqslant \dfrac{15{,}7}{2{,}95} \approx 5{,}3\) heures.

La résistance dépasse 15 MPa à partir d'environ 5,3 heures de séchage.

Question 3 (4 points)

Dans une étude, on observe que le nombre de cafés vendus augmente les jours où le nombre de retards au travail augmente aussi. Un journaliste écrit : « Le café provoque les retards. »

a) Cette conclusion est-elle justifiée ? Argumenter précisément.

b) Proposer deux facteurs cachés possibles qui expliqueraient cette corrélation.

c) Formuler une conclusion correcte à partir de ces données.

a) Non, cette conclusion n'est pas justifiée. Le journaliste confond corrélation et causalité. Ce n'est pas parce que deux phénomènes évoluent ensemble que l'un cause l'autre.

b) Facteurs cachés possibles :

  • Le mauvais temps : il provoque des retards (embouteillages) et incite les gens à boire du café pour se réchauffer.
  • Les lundis ou lendemains de week-end : les gens sont fatigués, arrivent en retard et consomment plus de café.

c) Conclusion correcte : « On observe une corrélation positive entre les ventes de café et les retards, mais cela ne prouve pas que le café est la cause des retards. Un facteur commun pourrait expliquer les deux phénomènes. »

Question 4 (6 points)

Un artisan achète des panneaux de bois. Il dispose de deux modèles de régression pour prévoir le coût \(y\) (en €) en fonction de la surface \(x\) (en m²) :

  • Modèle A : \(y = 18x + 50\) avec \(R^2 = 0{,}91\)
  • Modèle B : \(y = 15x + 85\) avec \(R^2 = 0{,}97\)

a) Quel modèle est le mieux ajusté aux données ? Justifier.

b) Avec le modèle B, estimer le coût pour 12 m² de panneaux.

c) Avec le modèle B, à partir de quelle surface le coût dépasse-t-il 400 € ?

d) Pour quelle surface les deux modèles donnent-ils le même coût ? Résoudre \(18x + 50 = 15x + 85\).

a) Le modèle B est le mieux ajusté car \(R^2 = 0{,}97 > 0{,}91\). Plus \(R^2\) est proche de 1, meilleur est l'ajustement.

b) \(y = 15 \times 12 + 85 = 180 + 85 = \mathbf{265}\) €.

c) On résout \(15x + 85 > 400\) :

\(15x > 315\) soit \(x > 21\). Le coût dépasse 400 € à partir de 21 m².

d) \(18x + 50 = 15x + 85\) ⇒ \(3x = 35\) ⇒ \(x = \dfrac{35}{3} \approx \mathbf{11{,}7}\) m².

Les deux modèles donnent le même coût pour environ 11,7 m².

Sujet B

Barème : 20 points

Question 1 (5 points)

Un technicien CVC étudie la relation entre l'âge \(x\) (en années) d'une pompe à chaleur et son coût de maintenance annuel \(y\) (en €) :

Âge \(x\) (années)24681012
Coût \(y\) (€)150240320410500600

a) Calculer les coordonnées du point moyen \(G\).

b) La calculatrice donne \(y = 45x + 60\) avec \(R^2 = 0{,}998\). Vérifier que la droite passe par \(G\).

c) Estimer le coût de maintenance pour une pompe à chaleur de 18 ans. Commenter la fiabilité de cette estimation.

a) \(\bar{x} = \dfrac{2+4+6+8+10+12}{6} = \dfrac{42}{6} = 7\)

\(\bar{y} = \dfrac{150+240+320+410+500+600}{6} = \dfrac{2\,220}{6} = 370\)

Le point moyen est \(G(7\,;\,370)\).

b) \(y = 45 \times 7 + 60 = 315 + 60 = 375\). On obtient 375 au lieu de 370, l'écart est dû aux arrondis des coefficients. La droite passe « au mieux » par \(G\).

c) \(y = 45 \times 18 + 60 = 810 + 60 = \mathbf{870}\) €. C'est une extrapolation (18 est hors de [2 ; 12]). Elle est risquée : au-delà d'un certain âge, les coûts pourraient augmenter plus vite (pannes fréquentes) ou l'équipement être remplacé.

Question 2 (5 points)

Une étude compare l'épaisseur \(x\) (en mm) et la résistance à la flexion \(y\) (en N) d'un panneau de bois :

Épaisseur \(x\) (mm)48121620
Résistance \(y\) (N)1022354658

a) Calculer le point moyen \(G\).

b) On obtient \(y = 2{,}98x - 1{,}4\) et \(r = 0{,}999\). Interpréter le coefficient directeur dans le contexte.

c) À partir de quelle épaisseur la résistance dépasse-t-elle 40 N ? Résoudre l'inéquation.

a) \(\bar{x} = \dfrac{4+8+12+16+20}{5} = \dfrac{60}{5} = 12\)

\(\bar{y} = \dfrac{10+22+35+46+58}{5} = \dfrac{171}{5} = 34{,}2\)

Point moyen : \(G(12\,;\,34{,}2)\).

b) Le coefficient \(a = 2{,}98\) signifie que chaque millimètre d'épaisseur supplémentaire augmente la résistance d'environ 2,98 N.

c) On résout \(2{,}98x - 1{,}4 \geqslant 40\) :

\(2{,}98x \geqslant 41{,}4\)

\(x \geqslant \dfrac{41{,}4}{2{,}98} \approx 13{,}9\) mm.

La résistance dépasse 40 N à partir d'environ 13,9 mm d'épaisseur.

Question 3 (4 points)

Une étude montre que dans certains pays, la consommation de fromage augmente en même temps que le nombre de doctorats délivrés. Un blogueur écrit : « Manger du fromage rend plus intelligent. »

a) Cette conclusion est-elle justifiée ? Argumenter précisément.

b) Proposer deux facteurs cachés possibles qui expliqueraient cette corrélation.

c) Formuler une conclusion correcte à partir de ces données.

a) Non, cette conclusion n'est pas justifiée. Le blogueur confond corrélation et causalité. Ce n'est pas parce que deux phénomènes évoluent ensemble que l'un cause l'autre.

b) Facteurs cachés possibles :

  • Le niveau de développement économique : les pays plus riches consomment plus de fromage et offrent davantage de places en doctorat.
  • L'évolution démographique : une population croissante augmente à la fois la consommation de fromage et le nombre de diplômés.

c) Conclusion correcte : « On observe une corrélation positive entre la consommation de fromage et le nombre de doctorats, mais cela ne prouve pas que le fromage favorise les études. Un facteur commun pourrait expliquer les deux phénomènes. »

Question 4 (6 points)

Un menuisier agenceur achète du placage. Il dispose de deux modèles de régression pour prévoir le coût \(y\) (en €) en fonction de la surface \(x\) (en m²) :

  • Modèle A : \(y = 22x + 40\) avec \(R^2 = 0{,}89\)
  • Modèle B : \(y = 18x + 80\) avec \(R^2 = 0{,}96\)

a) Quel modèle est le mieux ajusté aux données ? Justifier.

b) Avec le modèle B, estimer le coût pour 15 m² de placage.

c) Avec le modèle B, à partir de quelle surface le coût dépasse-t-il 500 € ?

d) Pour quelle surface les deux modèles donnent-ils le même coût ? Résoudre \(22x + 40 = 18x + 80\).

a) Le modèle B est le mieux ajusté car \(R^2 = 0{,}96 > 0{,}89\). Plus \(R^2\) est proche de 1, meilleur est l'ajustement.

b) \(y = 18 \times 15 + 80 = 270 + 80 = \mathbf{350}\) €.

c) On résout \(18x + 80 > 500\) :

\(18x > 420\) soit \(x > \dfrac{420}{18} \approx 23{,}3\). Le coût dépasse 500 € à partir d'environ 23,3 m².

d) \(22x + 40 = 18x + 80\) ⇒ \(4x = 40\) ⇒ \(x = \mathbf{10}\) m².

Les deux modèles donnent le même coût pour 10 m².