← RETOUR SOMMAIRE

Activité 3 – Corrélation n'est pas causalité : développer son esprit critique ÉTUDE DOCUMENTAIRE

Chapitre 1 – Statistiques à deux variables | Terminale Bac Pro | Mathématiques | ⏱ 50 min

Dernière mise à jour : 4 mai 2026, 11:30

Objectifs :

Situation – article de presse trompeur

Inès, lectrice avertie, lit dans un magazine populaire : « Étonnant : 95 % de corrélation entre la consommation de chocolat par habitant et le nombre de prix Nobel par pays ! Manger du chocolat rend-il plus intelligent ? » Inès soupçonne un piège statistique. Étudions.

Document — exemples célèbres de fausses corrélations

Variables corréléesr ≈Cause réelle
Ventes de glaces ↔ noyades+0,90Saison estivale (variable cachée : chaleur)
Cigognes ↔ naissances (Allemagne, par région)+0,85Régions rurales (espace, jeunes familles)
Pirates de la mer ↔ température mondiale−0,90Coïncidence historique (industrialisation)
Chocolat ↔ Nobel (par pays)+0,79PIB par habitant (richesse → éducation + chocolat)
Pointure de chaussure ↔ niveau de lecture (chez l'enfant)+0,80Âge (plus âgé → grande pointure ET meilleur lecteur)

Document — schéma : variable cachée

Variable cachée : exemple « glaces / noyades » Z = saison été (variable cachée) X = ventes glaces (observée) Y = noyades (observée) cause cause CORRÉLATION OBSERVÉE (mais pas de causalité directe)

📚 Cette activité approfondit les notions du cours §3 (interprétation du coefficient de corrélation) en développant l'esprit critique scientifique.

Problématique : Pourquoi une corrélation, même très forte, ne prouve-t-elle pas une causalité, et comment développer son esprit critique face aux statistiques ?

Question 1 APP

Définir avec tes propres mots :

  1. Corrélation
  2. Causalité
  • Corrélation : deux variables varient ensemble (l'une augmente avec l'autre, ou inversement). Notion statistique, mesurée par le coefficient r.
  • Causalité : l'une est la cause directe de l'autre. Notion physique / mécaniste, qui demande à être prouvée par un mécanisme explicatif.

Une corrélation peut exister sans causalité. Ce piège est très fréquent dans les médias et la communication d'entreprise.

Question 2 ANA

Pour chacun des exemples du tableau, identifier la variable cachée ou la raison qui explique la corrélation observée sans qu'il y ait causalité directe.

  • Glaces/noyades : variable cachée = été. Chaleur → plus de glaces ET plus de baignades → plus de noyades.
  • Cigognes/naissances : variable cachée = ruralité. Régions rurales → plus de cigognes ET plus de jeunes familles.
  • Pirates/température : aucune cause commune, simple coïncidence historique. Les pirates ont disparu pendant que la révolution industrielle commençait à émettre du CO₂.
  • Chocolat/Nobel : variable cachée = PIB. Pays riches → meilleur système éducatif ET plus de chocolat consommé (produit de luxe).
  • Pointure/lecture : variable cachée = âge. Enfant grandit → pied grandit ET il apprend à lire.

Question 3 VAL

Citer 3 questions à se poser face à une affirmation « X cause Y » lue dans la presse.

  1. Y a-t-il un mécanisme connu (physique, biologique, chimique) qui expliquerait pourquoi X cause Y ?
  2. Y a-t-il une variable cachée Z qui pourrait causer à la fois X et Y ?
  3. L'étude est-elle expérimentale (groupe testé vs groupe témoin, randomisation) ou seulement observationnelle ? Seule l'étude expérimentale peut prouver une causalité.
  4. (Bonus) Le résultat a-t-il été reproduit indépendamment par d'autres équipes ?
  5. (Bonus) Quelle est la taille de l'échantillon et la marge d'erreur ?

Question 4 ANA

Pour les variables suivantes, dire si la corrélation observée correspond à une causalité réelle ou non, et expliquer pourquoi.

  1. Vitesse de pédalage ↔ vitesse du vélo
  2. Nombre de pompiers ↔ ampleur des dégâts d'un incendie
  3. Nombre d'écoles dans une ville ↔ nombre de cafés

a. Causalité réelle : pédaler plus vite fait directement avancer le vélo plus vite (mécanisme physique).

b. Pas de causalité directe : variable cachée = ampleur de l'incendie (gros incendie → plus de pompiers ET plus de dégâts). Naïvement, on pourrait croire « plus de pompiers cause plus de dégâts » → faux !

c. Pas de causalité directe : variable cachée = taille de la ville (grande ville → plus d'écoles ET plus de cafés).

Toujours suspecter une variable cachée quand le mécanisme n'est pas évident.

Question 5 VAL

Pourquoi la randomisation dans une étude clinique permet-elle de démontrer une causalité ?

La randomisation consiste à diviser les participants en 2 groupes au hasard :

  • Groupe traité : reçoit le médicament
  • Groupe témoin : reçoit un placebo

Comme le tirage est aléatoire, les variables cachées (âge, santé initiale, mode de vie...) sont équilibrées entre les 2 groupes. La seule différence systématique est le médicament vs placebo.

Donc si le groupe traité va mieux, c'est nécessairement dû au médicament → causalité prouvée.

Sans randomisation (étude observationnelle), on a seulement de la corrélation. C'est pourquoi l'étude clinique randomisée double aveugle est l'étalon-or de la médecine.

Question 6 ANA

Une étude affirme : « les gens qui prennent leur petit-déjeuner ont 25 % moins de risques de maladie cardiaque ». L'auteur conclut : « petit-déjeuner = bonne santé ». Est-ce une causalité prouvée ?

Non, ce n'est qu'une corrélation observée. Variables cachées possibles :

  • Mode de vie globale : les gens qui déjeunent régulièrement ont souvent un mode de vie plus structuré (sport, sommeil régulier, moins de tabac).
  • Niveau socio-économique : avoir le temps et les moyens de prendre un vrai petit-déjeuner.
  • Type d'aliments : un petit-déjeuner sain (fruits) ≠ un déjeuner industriel sucré.

Pour prouver la causalité, il faudrait une étude randomisée : un groupe sans déjeuner, un groupe avec, comparer leur santé sur 10 ans. Coûteux et difficile.

Question 7 REA

Dans son métier, un menuisier observe que les chantiers où il pleut au moment de la pose ont 30 % de finitions médiocres. Conclusion possible : pluie cause défauts ?

Oui, une causalité directe est plausible dans ce cas :

  • L'humidité altère la prise des colles à bois.
  • Le bois mouillé se déforme et se travaille mal.
  • Les vis et fixations rouillent dans des conditions humides.

Le mécanisme physique est connu et documenté. Donc la corrélation observée correspond bien à une causalité.

Avant de conclure, vérifier qu'on n'a pas oublié de variables cachées (saison, type de chantier, équipe, etc.).

Pratique : ne pas poser sous la pluie, prévoir une bâche, ou reporter le chantier.

Question 8 COM

Rédiger en 5 lignes une réponse pédagogique à un ami qui dit « le chocolat rend intelligent ! ».

« Tu cites une étude statistique. C'est vrai que les pays qui consomment beaucoup de chocolat ont aussi plus de prix Nobel par habitant. Mais ça ne signifie pas que le chocolat rend intelligent !

Une variable cachée explique tout : le PIB. Les pays riches consomment plus de chocolat (luxe abordable) ET ont plus de moyens pour la recherche scientifique → plus de Nobels. La cause commune est la richesse économique, pas le chocolat lui-même.

C'est ce qu'on appelle une variable de confusion. Règle d'or : corrélation ≠ causalité. Pour prouver qu'un aliment rend intelligent, il faudrait une étude randomisée sur des décennies. »

🚀 Pour aller plus loin ANA

Sur le site « Spurious Correlations » (Tyler Vigen), des corrélations farfelues sont collectées. Exemple : « consommation de fromage par habitant ↔ nombre de personnes mortes étranglées par leur drap de lit » (r = +0,95). Comment interpréter ce résultat ?

r = 0,95 entre 2 variables totalement étrangères (fromage et étranglements par drap) : simple coïncidence statistique.

Quand on cherche dans des centaines de séries temporelles indépendantes, on trouve forcément des corrélations fortes par pure chance. C'est le piège du « p-hacking » : multiplier les comparaisons jusqu'à en trouver une qui semble significative.

Règle scientifique : seules les hypothèses formulées AVANT l'étude peuvent être testées. Tout test rétrospectif est suspect.

Le site de Tyler Vigen est une démonstration humoristique mais profonde : la statistique ne remplace pas la pensée.

À retenir