6.1K views
Une valeur aberrante est une observation qui ne s'insère pas dans l'ensemble des données. Elle est parfois appelée valeur extrême. Lorsqu'une valeur aberrante est représentée graphiquement, elle semble s'écarter du schéma général du graphique. Certaines valeurs aberrantes proviennent d'erreurs (par exemple, inscrire 50 au lieu de 500), tandis que d'autres peuvent signaler la survenue d'un phénomène inhabituel. Les valeurs aberrantes se trouvent loin de la droite des moindres carrés dans la direction verticale. Elles présentent de grandes « erreurs », où l'« erreur » ou résidu est la distance verticale entre la droite et le point considéré.
Les valeurs aberrantes nécessitent une analyse approfondie. Parfois, pour diverses raisons, elles ne devraient pas être intégrées à l'analyse des données. Une valeur aberrante peut résulter d'une donnée erronée. D'autres fois, elle peut contenir des informations importantes sur la population étudiée et devrait être conservée. L'essentiel est d'étudier attentivement ce qui rend une observation aberrante.
En plus des valeurs aberrantes, un échantillon peut contenir un ou plusieurs points appelés points influents. Les points influents sont des observations éloignées horizontalement des autres points du jeu de données. Ces points peuvent avoir un effet significatif sur la pente de la droite de régression. Pour identifier un point influent, on peut le retirer de l'ensemble des données et vérifier si la pente de la droite de régression change significativement.
Des logiciels statistiques et de nombreuses calculatrices permettent d'identifier les valeurs aberrantes dans les données. Les sorties informatiques des analyses de régression identifient généralement à la fois les valeurs aberrantes et les points influents afin de faciliter leur examen.
Ce texte est adapté de l'Openstax, Introductory Statistics, Section 12.6 Outliers.
From Chapter 11:
Now Playing
Correlation and Regression
6.1K Views
Correlation and Regression
14.7K Views
Correlation and Regression
8.4K Views
Correlation and Regression
7.9K Views
Correlation and Regression
8.0K Views
Correlation and Regression
9.1K Views
Correlation and Regression
6.2K Views
Correlation and Regression
7.7K Views
Correlation and Regression
3.3K Views
Correlation and Regression
3.7K Views