boxPlot
Description
L'action boxPlot du set d'actions Percentile calcule les statistiques nécessaires pour générer des diagrammes en boîteGraphique résumant la distribution d'une variable : médiane (ligne), quartiles (boîte), moustaches (étendue) et valeurs aberrantes. Idéal pour comparer la dispersion et la symétrie des données. (box plotsGraphique résumant la distribution d'une variable : médiane (ligne), quartiles (boîte), moustaches (étendue) et valeurs aberrantes. Idéal pour comparer la dispersion et la symétrie des données.), notamment les quantilesLes quantiles sont des valeurs divisant un jeu de données trié en intervalles égaux. Ils permettent d'analyser la distribution et la dispersion des données (ex: quartiles pour des segments de 25%)., les moustaches hautes et basses, ainsi que les valeurs aberrantesObservations s'écartant significativement du reste des données. Elles peuvent résulter d'erreurs de mesure ou de phénomènes rares et influencent fortement les statistiques (moyenne, variance). (outliersValeur atypique s'écartant significativement des autres observations d'un jeu de données. Elle peut signaler une erreur de saisie ou un phénomène rare nécessitant une analyse statistique dédiée.) . C'est l'outil idéal pour inspecter la distribution de vos données et repérer les valeurs qui essaient de s'échapper du troupeau avec un peu trop d'enthousiasme.
Paramètres Clés
Préparation des données
Création de données de test pour BoxPlot
Génération d'une table CAS simple contenant des scores de performance pour démontrer l'analyse de distribution.
| 1 | PROC CAS; TABLE.loadTable / path="cars.sashdat", caslib="Samples", casOut={name="cars", replace=true}; DATA casuser.scores; DO i=1 to 1000; score=round(rand("Normal", 50, 15)); OUTPUT; END; drop i; RUN; QUIT; |
Exemples d'utilisation
Calcul de base des statistiques de boîte
Exécute une analyse boxPlot standard sur la variable 'score' de la table 'scores'.
| 1 | PROC CAS; percentile.boxPlot / TABLE={name="scores"}, inputs={{name="score"}}; RUN; QUIT; |
Résultat Attendu :
Analyse complète avec détection de valeurs aberrantes et export
Cet exemple calcule les percentiles exacts, définit les moustaches au 10ème/90ème percentile et demande l'extraction des 50 pires/meilleures valeurs aberrantes dans une table de sortie.
| 1 | PROC CAS; percentile.boxPlot / TABLE={name="scores", where="score > 0"}, inputs={{name="score"}}, method="EXACT", outliers=true, nOutLimit=50, whiskerPercentile=10, casOut={name="stats_boxplot", replace=true}; RUN; QUIT; |