← RETOUR SOMMAIRE

Chapitre 1 – Statistiques à deux variables

Terminale Bac Pro  |  Mathématiques  |  Statistique et probabilités

Dernière mise à jour : 26 juin 2026

Je vais apprendre à :

Situation professionnelle

🔧 Analyse de la consommation d'un bâtiment tertiaire

ICCER Un technicien en génie climatique réalise le suivi énergétique d'un bâtiment de bureaux équipé d'une pompe à chaleur air/eau. Il relève chaque semaine la température extérieure moyenne et la consommation de chauffage.

ERA-MA En électrotechnique ou en agencement, ce type d'analyse permet de relier deux grandeurs mesurées (courant/tension, quantité de matière/coût) pour établir un modèle prédictif.

Problème : Comment estimer la consommation d'une semaine future à partir de la météo prévue ? La réponse passe par les statistiques à deux variables.

1. Introduction — Pourquoi étudier deux variables ensemble ?

En statistiques, on étudie souvent deux grandeurs liées entre elles : par exemple, la consommation de chauffage d'un bâtiment dépend de la température extérieure. En traçant les données dans un repère, on obtient un nuage de points qui révèle si une relation existe entre les deux grandeurs.

Exemple introductif — Chauffage d'un bâtiment

Un technicien chauffagiste relève, pour 8 semaines, la température extérieure moyenne (en °C) et la consommation de chauffage d'un immeuble de bureaux (en kWh) :

Semaine12345678
Temp. \(x\) (°C)2581014171922
Conso. \(y\) (kWh)980840720640480350260140

On observe que quand la température monte, la consommation baisse. Il y a une relation entre \(x\) et \(y\). On va la modéliser.

2. Nuage de points et point moyen

Définition — Série à deux variables
Une série statistique à deux variables est un ensemble de couples \((x_i\,;\,y_i)\) où chaque couple correspond à une observation (une semaine, un bâtiment, un appareil…).
Définition — Nuage de points
Un nuage de points est la représentation graphique des couples \((x_i\,;\,y_i)\) dans un repère orthogonal. La variable \(x\) est placée en abscisse, la variable \(y\) en ordonnée.
Propriété — Point moyen
Le point moyen \(G(\bar{x}\,;\,\bar{y})\) est le point dont les coordonnées sont les moyennes des deux séries : \[\bar{x} = \frac{x_1 + x_2 + \cdots + x_n}{n} \qquad \bar{y} = \frac{y_1 + y_2 + \cdots + y_n}{n}\] Tout ajustement affine passe obligatoirement par le point moyen \(G\).
Application

Un artisan menuisier relève 4 chantiers : surfaces \(x\) = 10, 20, 30, 40 m² et coûts \(y\) = 1 500, 2 800, 4 200, 5 600 €. Calcule les coordonnées du point moyen \(G(\bar{x}\,;\,\bar{y})\).

Nuage de points — Données de l'exemple chauffage


Méthode — Lire un nuage de points
  1. Observer la forme générale : les points forment-ils une ligne droite ? une courbe ? un nuage dispersé ?
  2. Identifier le sens de la liaison : quand \(x\) augmente, \(y\) augmente-t-il (liaison positive) ou diminue-t-il (liaison négative) ?
  3. Évaluer la dispersion : les points sont-ils serrés autour d'une tendance ou très éparpillés ?

3. Ajustement affine — Droite de régression

Quand le nuage de points a une forme allongée (linéaire), on peut l'ajuster par une droite \(y = ax + b\). Cette droite est calculée pour minimiser les écarts entre les points et la droite.

Définition — Droite de régression
La droite de régression de \(y\) en \(x\) est la droite \(y = ax + b\) qui minimise la somme des carrés des écarts verticaux entre les points du nuage et la droite. Elle passe toujours par le point moyen \(G(\bar{x}\,;\,\bar{y})\).
Méthode — Calculer \(a\) et \(b\) à la calculatrice
  1. Mettre les données dans deux listes \(x\) et \(y\) (menu Stat)
  2. Lancer le calcul de régression linéaire (LinReg ou a+bx)
  3. Lire \(a\) (coefficient directeur), \(b\) (ordonnée à l'origine) et \(r\) (coefficient de corrélation)
  4. Écrire l'équation : \(y = ax + b\)

Formules (pour comprendre, pas à mémoriser) :

\[a = \frac{\sum(x_i - \bar{x})(y_i - \bar{y})}{\sum(x_i - \bar{x})^2} \qquad b = \bar{y} - a\bar{x}\]
Exemple résolu — Chauffage

Pour les données de chauffage :

\(\bar{x} = \frac{2+5+8+10+14+17+19+22}{8} = \frac{97}{8} \approx 12{,}1\,°C\)

\(\bar{y} = \frac{980+840+720+640+480+350+260+140}{8} = \frac{4410}{8} \approx 551\,\text{kWh}\)

La calculatrice donne : \(a \approx -41{,}7\) et \(b \approx 1057\)

Droite de régression : \(\boxed{y = -41{,}7\,x + 1057}\)

Interprétation : quand la température augmente de 1°C, la consommation diminue d'environ 42 kWh.

Application

La droite de régression d'un artisan menuisier est \(y = 85x + 500\) (coût en € en fonction du nombre de mètres linéaires de corniche \(x\)). Que représentent 85 et 500 dans ce contexte ?

4. Coefficient de corrélation \(r\)

Définition
Le coefficient de corrélation linéaire \(r\) est un nombre compris entre \(-1\) et \(1\). Il mesure l'intensité et le sens de la liaison linéaire entre \(x\) et \(y\) :
Application

Un métreur obtient un coefficient de corrélation \(r = -0{,}92\) entre le nombre de fenêtres posées et la durée de la pose. Que peut-on dire de cette liaison ? L'ajustement affine est-il acceptable ?

Règle pratique
Valeur de \(|r|\)Qualité de la liaisonL'ajustement affine est…
\(|r| > 0{,}95\)Très forteExcellent
\(0{,}85 < |r| \leq 0{,}95\)ForteAcceptable
\(|r| \leq 0{,}85\)Faible ou nulleÀ rejeter ou changer de modèle
Attention
Un \(r\) faible ne signifie pas qu'il n'y a pas de relation entre \(x\) et \(y\), mais que la relation n'est pas linéaire. Il faut alors envisager un autre type d'ajustement (exponentiel, puissance…).

5. Visualisation interactive — Nuage de points et ajustement

Utilisez le curseur ci-dessous pour entrer une température et voir la consommation prévue par la droite de régression.

Données chauffage — Nuage + droite de régression (\(r \approx -0{,}999\))

12 °C
12
Température (°C)
557
Conso. prévue (kWh)
Interpolation
Type d'estimation

Zone de données réelles : 2°C à 22°C. Au-delà → extrapolation (moins fiable).

6. Ajustements non affines — Changements de variable

Quand le nuage de points n'est pas rectiligne, on peut effectuer un changement de variable pour "linéariser" la relation, puis appliquer un ajustement affine sur les nouvelles variables.

Principe
Si la relation entre \(x\) et \(y\) n'est pas linéaire, on pose une nouvelle variable \(z\) (transformée de \(x\) ou de \(y\)), de façon à ce que la relation entre \(z\) et l'autre variable soit linéaire.

Modèles courants

Type de relationChangement de variableNouvelle relation linéaire
Affine \(y = ax + b\)Aucun\(y = ax + b\)
Exponentielle \(y = A \cdot q^x\)\(z = \log(y)\)\(z = x\log(q) + \log(A)\)
Puissance \(y = A \cdot x^k\)\(z = \log(y)\), \(u = \log(x)\)\(z = ku + \log(A)\)
Inverse \(y = \frac{a}{x} + b\)\(z = \frac{1}{x}\)\(y = az + b\)
Exemple — Ajustement exponentiel (croissance bactérienne)

On observe la population d'une colonie de bactéries (en milliers) toutes les heures :

Heure \(t\)012345
Population \(N\)24,18,316,233,165

Étape 1 : Le nuage de \((t, N)\) n'est pas rectiligne → on pose \(z = \log(N)\).

Heure \(t\)012345
\(z = \log(N)\)0,3010,6130,9191,2101,5201,813

Étape 2 : Le nuage de \((t, z)\) est rectiligne → droite de régression : \(z \approx 0{,}302\,t + 0{,}300\)

Étape 3 : Retour à \(N\) : \(\log(N) = 0{,}302\,t + 0{,}300 \Rightarrow N = 10^{0{,}302t+0{,}300} \approx 2 \times 2^t\)

Modèle : \(\boxed{N \approx 2 \times 2^t}\)

7. Interpolation et extrapolation

Définitions
Méthode
Pour estimer \(y\) à partir d'une valeur \(x_0\) :
  1. Écrire l'équation de l'ajustement
  2. Remplacer \(x\) par \(x_0\)
  3. Calculer \(y\) et interpréter le résultat dans le contexte
Exemple — Interpolation et extrapolation

Avec la droite \(y = -41{,}7\,x + 1057\) :

Interpolation : pour \(x = 12\,°C\) (dans l'intervalle [2 ; 22]) → \(y = -41{,}7 \times 12 + 1057 \approx 557\,\text{kWh}\)

Extrapolation : pour \(x = 25\,°C\) (hors intervalle) → \(y = -41{,}7 \times 25 + 1057 = 14{,}5\,\text{kWh}\)

Attention À 25°C on ne chauffe plus normalement. L'extrapolation donne un résultat peu réaliste : le modèle a des limites. Il faut toujours interpréter le résultat dans le contexte professionnel.
Application

Un fabricant de mobilier modélise ses coûts : \(y = 120x + 300\) (€ en fonction du nombre de plateaux \(x\)). Estimez le coût pour 8 plateaux (interpolation) et pour 50 plateaux (extrapolation). Laquelle des deux estimations est plus fiable ?

8. Exemple professionnel — COP d'une pompe à chaleur

🌡️ Performance d'une PAC selon la température extérieure

ICCER Un technicien mesure le COP (Coefficient de Performance) d'une pompe à chaleur air/eau pour différentes températures extérieures. Plus il fait froid, moins la PAC est efficace.

Exemple résolu — COP d'une PAC
Temp. ext. \(x\) (°C)−5057101520
COP \(y\)2,12,63,13,43,84,44,9

Calcul du point moyen :

\(\bar{x} = \frac{-5+0+5+7+10+15+20}{7} = \frac{52}{7} \approx 7{,}4\,°C\)

\(\bar{y} = \frac{2{,}1+2{,}6+3{,}1+3{,}4+3{,}8+4{,}4+4{,}9}{7} = \frac{24{,}3}{7} \approx 3{,}47\)

Régression linéaire (calculatrice) : \(r \approx 0{,}999\) → liaison très forte

Droite : \(\boxed{y = 0{,}115\,x + 2{,}618}\)

Applications :

Conclusion professionnelle : si la PAC a un COP < 1, il devient plus économique de passer sur résistance électrique. Ce seuil de bascule peut être calculé par extrapolation.

9. Simulation — Comparer les types d'ajustement

Comparer visuellement les ajustements selon la forme du nuage


10. Applications concrètes — Génie climatique et Menuiserie

Lien avec les enseignements professionnels
Les statistiques à deux variables sont directement utilisées dans vos spécialités :

Bilan — Tableau récapitulatif

NotionDescription
Nuage de pointsReprésentation des couples \((x_i, y_i)\)
Point moyen \(G\)\((\bar{x}, \bar{y})\) — centre de gravité
Droite de régression\(y = ax + b\) — ajustement affine
Coefficient \(r\)Qualité de la liaison (\(-1 \leq r \leq 1\))
NotionDescription
Changement de variableLinéariser une relation non affine
InterpolationEstimer \(y\) dans l'intervalle connu
ExtrapolationEstimer \(y\) hors de l'intervalle (prudence !)
InterprétationToujours contextualiser le résultat
📌 À retenir
Erreurs fréquentes à éviter

Mini exercices

Exercice 1 — Chauffage et productivité

On relève pour 6 ouvriers leur expérience \(x\) (en années) et leur productivité \(y\) (pièces/heure) :

\(x\)124579
\(y\)121519222631

1. Calculer les coordonnées du point moyen \(G\).

2. La calculatrice donne \(y = 2{,}33x + 9{,}96\). Vérifier que \(G\) appartient à cette droite.

3. Estimer la productivité d'un ouvrier ayant 6 ans d'expérience.

Voir la correction

1. \(\bar{x} = \frac{1+2+4+5+7+9}{6} = \frac{28}{6} \approx 4{,}67\)  ;  \(\bar{y} = \frac{12+15+19+22+26+31}{6} = \frac{125}{6} \approx 20{,}8\)

2. \(2{,}33 \times 4{,}67 + 9{,}96 \approx 10{,}9 + 9{,}96 \approx 20{,}8\) ✓

3. \(y = 2{,}33 \times 6 + 9{,}96 = 13{,}98 + 9{,}96 \approx \mathbf{23{,}9}\) pièces/heure

Exercice 2 — Qualité de liaison

La calculatrice donne \(r = 0{,}72\) pour un ajustement affine.

1. La liaison linéaire est-elle forte ?

2. Faut-il conserver cet ajustement affine ou chercher un autre modèle ?

Voir la correction

1. \(|r| = 0{,}72 < 0{,}85\) → la liaison est faible.

2. Il faut chercher un autre modèle (tester un ajustement exponentiel ou puissance via un changement de variable).

Exercice 3 ICCER — COP d'une PAC

Pour la PAC de l'exemple professionnel, la droite d'ajustement est \(y = 0{,}115\,x + 2{,}618\).

1. Calculer le COP prévu pour une température extérieure de \(x = 8\,°C\). Est-ce une interpolation ou une extrapolation ?

2. Pour quelle température extérieure le COP atteindrait-il 1 ? Interpréter.

Voir la correction

1. \(y = 0{,}115 \times 8 + 2{,}618 = 0{,}92 + 2{,}618 = \mathbf{3{,}54}\). C'est une interpolation (8°C est dans l'intervalle [−5 ; 20]).

2. \(1 = 0{,}115x + 2{,}618\) → \(0{,}115x = 1 - 2{,}618 = -1{,}618\) → \(x = \frac{-1{,}618}{0{,}115} \approx -14{,}1\,°C\).

Interprétation : en dessous de −14,1°C, le COP deviendrait inférieur à 1 (la PAC consomme plus qu'elle ne produit). À cette température il faut basculer sur un autre mode de chauffage.

Exercice 4 — Bivalence physique/maths

En physique, on mesure la tension \(U\) (V) aux bornes d'un résistor pour différentes valeurs du courant \(I\) (mA) :

\(I\) (mA)1020304050
\(U\) (V)0,470,981,451,962,51

La droite de régression donne \(r = 0{,}9998\) et \(U = 0{,}0506\,I - 0{,}044\). Quelle est la résistance de ce résistor (en Ω) ?

Voir la correction

La loi d'Ohm donne \(U = R \times I\). Le coefficient directeur \(a = 0{,}0506\,\text{V/mA} = 0{,}0506 \times 1000\,\text{V/A} = \mathbf{50{,}6\,\Omega}\).

(\(r \approx 1\) confirme que la relation est bien linéaire, ce qui est cohérent avec la loi d'Ohm.)

Erreurs fréquentes

Utiliser l'ajustement sans vérifier \(r\)
Certains élèves tracent la droite de régression sans regarder si \(|r|\) est proche de 1.
Conseil : toujours lire \(r\) à la calculatrice avant d'utiliser l'ajustement.
Confondre le signe de \(r\) avec la qualité
\(r = -0{,}98\) indique une liaison très forte (négative), pas une mauvaise liaison.
Conseil : c'est \(|r|\) (valeur absolue) qui mesure la qualité, pas \(r\) seul.
Extrapoler sans le signaler
Calculer \(y\) pour un \(x\) très loin des données sans préciser que c'est une extrapolation risquée.
Conseil : indiquer toujours si la valeur estimée est dans ou hors de l'intervalle des données.
Oublier d'interpréter le coefficient directeur
Dans \(y = ax + b\), donner seulement la valeur de \(a\) sans expliquer ce qu'il représente dans le contexte.
Conseil : toujours relier \(a\) à une unité concrète (€/m², kWh/°C…).
Inverser \(x\) et \(y\)
Confondre la variable explicative (\(x\)) et la variable expliquée (\(y\)) lors de l'ajustement.
Conseil : la variable que l'on contrôle (cause) est \(x\) ; celle que l'on prédit (effet) est \(y\).

Simulation interactive