
En statistique descriptive , les statistiques descriptives servent à résumer un ensemble d' observations , afin de communiquer le maximum d'informations de la manière la plus simple possible. Les statisticiens s'efforcent généralement de décrire les observations de manière à ce que…
- une mesure de position, ou de tendance centrale , telle que la moyenne arithmétique
- une mesure de dispersion statistique comme l' écart absolu moyen type
- une mesure de la forme de la distribution comme l'asymétrie ou le kurtosis
- Si plusieurs variables sont mesurées, une mesure de dépendance statistique telle qu'un coefficient de corrélation peut être utilisée.
Un ensemble courant de statistiques d'ordre utilisées comme statistiques récapitulatives est le résumé à cinq chiffres , parfois étendu à un résumé à sept chiffres , et le diagramme en boîte associé .
Les éléments d'un tableau d'analyse de variance peuvent également être considérés comme des statistiques descriptives.
Exemples
Emplacement
Les mesures courantes de position, ou de tendance centrale , sont la moyenne arithmétique , la médiane , le mode et la moyenne interquartile .
Propagé
Les mesures courantes de dispersion statistique sont l' écart type , la variance , l'étendue , l'écart interquartile , l'écart absolu , la différence absolue moyenne et l' écart type de la distance . Le coefficient de variation est une mesure qui évalue la dispersion par rapport à la taille typique des valeurs des données .
Le coefficient de Gini a été initialement développé pour mesurer les inégalités de revenus et est équivalent à l'un des moments L.
Un résumé simple d'un ensemble de données est parfois donné en citant des statistiques d'ordre particulières comme approximations de percentiles sélectionnés d'une distribution.
Forme
Les mesures courantes de la forme d'une distribution sont l'asymétrie et le kurtosis , tandis que d'autres peuvent être basées sur les L-moments . Une autre mesure est l' asymétrie de distance , pour laquelle une valeur nulle implique une symétrie centrale.
Dépendance
La mesure courante de la dépendance entre variables aléatoires appariées est le coefficient de corrélation de Pearson , tandis qu'une statistique de synthèse alternative courante est le coefficient de corrélation de rang de Spearman . Une valeur nulle pour la corrélation de distance indique l'indépendance.
Perception humaine des statistiques descriptives
Les humains utilisent efficacement les statistiques descriptives pour percevoir rapidement l'essentiel des informations auditives et visuelles.