L'écart-type (standard deviation)
Définition :
Par définition, l'
écart-type[1]
d'une série statistique – ou d'une D.O.1 ou d'une D.G.1 – est égal à la racine carrée de la variance
et est désigné, tout naturellement, par la lettre
:
.
Cette quantité a l'avantage de s'exprimer dans les mêmes unités que les observations et est donc plus facile à interpréter que la variance.
Interpréter la valeur d'un écart-type n'est souvent pas une tâche simple. La construction d'intervalles remarquables permet de la faciliter.
Complément : Intervalles remarquables
L'écart-type permet de construire des intervalles centrés en
qui contiennent un certain pourcentage de la masse totale des observations. Ainsi, lorsque la distribution observée est en forme de cloche et pas trop dissymétrique,
l'intervalle
contient à peu près
des observations ;
l'intervalle
contient à peu près
des observations.
On parle alors d'intervalles remarquables.
Exemple : Tailles (suite)
Reprenons la série statistique des 175 tailles dont la moyenne arithmétique et l'écart-type valent
et
.
Construisons l'intervalle
dont les bornes sont obtenues en retranchant et en ajoutant l'écart-type à la moyenne arithmétique. On obtient l'intervalle
. En consultant la série statistique ordonnée des tailles, on vérifie aisément que cet intervalle contient 123 observations, soit 70% du nombre total des observations.
L'intervalle
est égal à
; il contient 163 observations de la série, soit environ 93% du nombre total des observations.
Remarque : Utilisation de l'écart-type dans des comparaisons
On peut comparer visuellement des dispersions de séries statistiques ou de D.O.1 distinctes par l'intermédiaire des boîtes à moustaches. On peut aussi réaliser des comparaisons en calculant les variances ou les écarts-types.
Exemple : Résultats / étudiants (suite)
Si l'on désire comparer la dispersion des notes attribuées par cours, on peut calculer la variance ou l'écart-type pour chaque cours :

La comparaison va dans le même sens que celle qui résultait des boîtes à moustaches par cours (les notes de
sont les plus dispersées, celles de
les plus concentrées).
On doit cependant se garder d'interpréter les écarts-types pour
et
, trop influencés par les valeurs extrêmes observées pour ces deux cours.