Écart-type \(\sigma\) : dispersion autour de la moyenne
Plus \(\sigma\) est petit, plus la série est homogène
5. Boîte à moustaches (box plot)
Représente les 5 valeurs clés : Min — Q1 — Me — Q3 — Max
La boîte s'étend de Q1 à Q3 (50 % centraux)
Le trait vertical dans la boîte = médiane
Les moustaches s'étendent de Min à Q1 et de Q3 à Max
Longueur de la boîte = IQR (indicateur de régularité)
Piège 1 : La moyenne est sensible aux valeurs extrêmes. Une seule valeur aberrante peut la tirer vers le haut ou le bas. La médiane est plus robuste.
Piège 2 : Ne pas oublier de trier la série dans l'ordre croissant avant de chercher la médiane et les quartiles.
Piège 3 : L'étendue ne dépend que de deux valeurs (min et max). Elle ne reflète pas bien la dispersion de l'ensemble des données. Préférer l'IQR ou l'écart-type.
Astuce : Pour comparer deux séries, comparer leurs médianes (efficacité) ET leurs IQR ou écarts-types (régularité). Même moyenne ne veut pas dire même dispersion.
Astuce : Sur une boîte à moustaches, une moustache très longue d'un côté signale des valeurs potentiellement aberrantes à investiguer.
Résumé express — Méthode type
Trier les données dans l'ordre croissant
Calculer la moyenne \(\bar{x} = \frac{\sum x_i \cdot n_i}{N}\)
Déterminer la médiane (rang central de la série triée)