Statistique descriptive univariée

Effectifs cumulés et fréquences cumulées

La D.O.1 et la D.G.1 fournissent une première synthèse de l'information collectée. On peut très facilement compléter les effectifs et les fréquences qui leur sont associés par des concepts supplémentaires qui mettent en évidence d'autres aspects de l'information contenue dans la distribution observée ou groupée.

Attention

Les concepts présentés ci-après n'ont de sens que si la variable étudiée est ordinale ou quantitative (d'intervalles ou de rapports) ; ils ne sont donc pas définis si la variable est nominale.

DéfinitionPour une D.O.1

Considérons la D.O.1 constituée des valeurs observées distinctes auxquelles sont associés les effectifs et les fréquences

A chaque valeur , on peut associer l'effectif cumulé correspondant au nombre d'observations, dans la série statistique de départ, inférieures ou égales à et défini par

Comme son nom l'indique, l'effectif cumulé associé à la valeur est obtenu en « cumulant » (sommant) les effectifs associés aux valeurs distinctes observées qui sont inférieures ou égales à

On peut également associer à chaque valeur la fréquence cumulée correspondant à la proportion d'observations, dans la série statistique de départ, inférieures ou égales à Cette fréquence cumulée est définie par

Nous pouvons présenter les effectifs cumulés et les fréquences cumulées dans deux colonnes supplémentaires qui viennent compléter le tableau de la D.O.1.

RemarquePremier et dernier effectifs cumulés

Notons que :

  • : puisque est la plus petite valeur observée, il n'existe aucune observation, dans la série de départ, qui soit strictement inférieure à ; dès lors, le nombre d'observations inférieures ou égales à coïncide avec le nombre d'observations égales à ;

  • : puisque est la plus grande valeur observée, l'ensemble des observations de la série de départ lui sont inférieures ou égales.

De manière similaire, si l'on raisonne en termes de proportions d'observations plutôt qu'en termes de nombres d'observations, nous avons et

RemarqueRetrouver les effectifs (fréquences) à partir des effectifs (fréquences) cumulé(e)s

Il découle directement de la définition des effectifs cumulés que

L'effectif associé à la valeur est la différence entre l'effectif cumulé associé à cette valeur et l'effectif cumulé associé à la valeur qui la précède dans la D.O.1.

De manière similaire, si l'on remplace les effectifs par les fréquences, on vérifie que

ExempleAvis pédagogiques (suite)

Ce tableau nous permet de faire, par exemple, les constatations suivantes :

  • un seul étudiant a émis un avis très défavorable ;

  • 3 étudiants ont émis un avis défavorable ou moins bon que défavorable ; il s'agit des 2 étudiants qui ont émis un avis défavorable auxquels se rajoute l'étudiant qui a émis un avis très défavorable ;

  • 1 étudiant a émis un avis très défavorable, 2 ont émis un avis défavorable et 11, un avis moyen : il y a donc au total 14 étudiants – soit encore 70% des étudiants – qui ont émis un avis moyen ou moins bon que moyen ; nous pouvons encore en déduire que 6 étudiants seulement sur les 20 ont émis un avis meilleur que moyen, c'est-à-dire favorable ou très favorable ;

  • l'effectif cumulé associé à la modalité « moyen » est égal à 14 ; celui associé à la modalité « favorable » s'élève à 18 : la différence entre 18 et 14 nous donne 4, le nombre d'étudiants qui ont émis un avis favorable.

ExemplePersonnes à charge (suite)

Nous pouvons notamment déduire de la lecture de ce tableau que :

  • dans un peu plus d'un quart des dossiers (dans 27% des dossiers exactement,) le nombre de personnes à charge déclarées est inférieur ou égal à 1 ;

  • dans 60% des dossiers étudiés, le nombre de personnes à charge déclarées est inférieur ou égal à 2 ;

  • le nombre de personnes à charge déclarées est inférieur ou égal à 4 dans 95% des dossiers étudiés ; il n'y a donc que 5% des dossiers dans lesquels le nombre de personnes à charge déclarées excède 4.

DéfinitionPour une D.G.1

Selon une démarche en tous points similaire à celle suivie pour une D.O.1, nous pouvons associer à chaque classe un effectif cumulé et une fréquence cumulée Ici, et correspondent respectivement au nombre et à la proportion d'observations, dans la série statistique de départ, qui appartiennent à ou à l'une des classes qui précèdent c'est-à-dire, en d'autres termes, au nombre et à la proportion d'observations qui sont inférieures ou égales à la borne

ExempleTailles (suite)

Ce tableau nous permet notamment de faire les constatations suivantes :

  • 26% des étudiants mesurent moins de 169.5 cm ;

  • 90% des étudiants mesurent au plus 189 cm ; il n'y a donc que 10% des étudiants dont la taille est supérieure ou égale à 190 cm (il s'agit des 10% d'étudiants qui se retrouvent dans la dernière classe de la distribution groupée).

Complément

et concernent, dans le cas d'une D.O.1, l'ensemble des observations inférieures ou égales à la valeur (par rapport à une représentation graphique traditionnelle, on pourrait dire « l'ensemble des observations à gauche de ou en »). Il peut aussi être intéressant de regarder l'importance absolue ou relative de l'ensemble des observations supérieures ou égales à (« à droite de ou en ») : ceci nous conduit aux notions d'effectif cumulé à droite et de fréquence cumulée à droite

et sont bien évidemment étroitement liés au nombre total d'observations, aux effectifs ou fréquences de la D.O.1 et à l'effectif cumulé (à gauche) et la fréquence cumulée (à gauche) Nous n'en parlerons cependant pas davantage dans le cadre de ce cours.

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimerRéalisé avec Scenari (nouvelle fenêtre)