Chapitre 1 – Statistiques à deux variables | Terminale Bac Pro | Mathématiques | ⏱ 50 min
Dernière mise à jour : 4 mai 2026, 11:30
Tom, technicien forestier, étudie la croissance des chênes d'une parcelle pour planifier les coupes (éclaircies et abattage). Il mesure la hauteur de 8 chênes d'âges connus, en faisant attention de prendre des arbres de la même variété et soumis à des conditions équivalentes.
| Âge x (ans) | 10 | 20 | 30 | 40 | 50 | 60 | 70 | 80 |
|---|---|---|---|---|---|---|---|---|
| Hauteur y (m) | 4,5 | 9,0 | 13,2 | 16,8 | 19,5 | 22,0 | 24,0 | 25,8 |
L'équation de la droite d'ajustement obtenue avec une calculatrice est : y = 0,30 x + 3,0 avec un coefficient de corrélation r ≈ 0,997 (très proche de 1).
📚 Cette activité réinvestit les notions du cours §2 (nuage de points, droite d'ajustement) et §3 (coefficient de corrélation, fiabilité d'une prévision).
Lire sur le graphique :
Calculer les coordonnées du point moyen G(x̄, ȳ).
x̄ = (10 + 20 + 30 + 40 + 50 + 60 + 70 + 80) / 8 = 360 / 8 = 45 ans
ȳ = (4,5 + 9,0 + 13,2 + 16,8 + 19,5 + 22,0 + 24,0 + 25,8) / 8 = 134,8 / 8 = 16,85 m
G a pour coordonnées (45 ; 16,85).
Vérification : la droite y = 0,30 × 45 + 3 = 16,5 m, proche de 16,85 (petit écart car la croissance n'est pas strictement linéaire).
Utiliser l'équation y = 0,30 x + 3,0 pour estimer la hauteur d'un chêne de :
L'estimation à 100 ans est-elle fiable ? Pourquoi un chêne de 200 ans ne mesure-t-il pas 63 m comme le calcul le prévoit ?
Limites du modèle linéaire :
Conclusion : à 100 ans, l'estimation 33 m est douteuse mais pas absurde. À 200 ans (63 m prévus), le modèle est faux : aucun chêne n'atteint 63 m.
Règle pro : jamais extrapoler trop loin hors de la plage des données.
Que signifie le coefficient de corrélation r = 0,997 ? Est-ce une bonne valeur ?
r mesure la force de la corrélation linéaire entre x et y.
En pratique :
Tom veut prévoir le diamètre du tronc à partir de l'âge (autre étude). Il trouve r = 0,5. Peut-il utiliser ce modèle pour ses prévisions ?
r = 0,5 indique une corrélation faible. Le modèle linéaire ne captre que ~ 25 % de la variabilité (r² ≈ 0,25 → 25 % de variance expliquée).
Donc peu fiable pour des prévisions individuelles. Il y a probablement d'autres facteurs (sol, exposition, génétique) qui influencent le diamètre.
Tom doit :
Si Tom souhaite des chênes d'au moins 25 m pour la coupe d'œuvre (charpente), à quel âge minimum doivent-ils être abattus selon le modèle ?
Résoudre : 0,30 × x + 3 = 25 → 0,30 × x = 22 → x = 22 / 0,30 ≈ 73 ans.
Donc Tom doit prévoir des chênes d'au moins 73 ans pour la coupe charpente.
Vérification dans le tableau : à 70 ans, hauteur 24 m ; à 80 ans, 25,8 m → cohérent.
Cycle commercial typique d'un chêne : 80-150 ans (selon usage et qualité du bois recherchée).
Rédiger en 5 lignes une note d'aide à Tom pour utiliser correctement son modèle dans la planification des coupes.
Note régression hauteur/âge — chênes parcelle Nord
Le modèle y = 0,30 x + 3,0 (r = 0,997) prédit avec précision la hauteur des chênes dans la plage 10-80 ans. À utiliser pour décider des éclaircies à 30 ans, 50 ans, et l'abattage entre 75 et 90 ans (hauteur ≥ 25 m).
Pour les chênes > 80 ans, la croissance ralentit fortement → ne pas extrapoler la droite. Refaire des mesures terrain avant abattage des arbres anciens.
Refaire une nouvelle régression tous les 5 ans pour réajuster (climat, sol évoluent).
Tom veut tester un modèle non linéaire (courbe en racine carrée : y = a × √x + b). En plus du modèle linéaire, comment décider lequel des 2 modèles est le meilleur ?
Le modèle racine carrée s'écrit y = a × √x + b. Il modélise une croissance qui ralentit avec l'âge, ce qui est plus réaliste biologiquement.
Pour comparer 2 modèles :
Pour les arbres : la racine carrée est souvent meilleure aux grands âges (modèle linéaire diverge à 200 ans → aberrant). Mais sur 10-80 ans, le linéaire est très bon.
Choix du modèle = compromis entre simplicité et précision selon l'usage.