Pourquoi l'action boxPlot est-elle un outil incontournable pour votre analyse exploratoire de données ?

Maîtrise de la distribution en CAS

L'action boxPlot, appartenant au set d'actions Percentile de SAS Viya, est essentielle pour tout architecte de solutions cherchant à comprendre la structure profonde de ses données. Elle permet de calculer les statistiques nécessaires à la création de diagrammes en boîteGraphique résumant la distribution d'une variable : médiane (ligne), quartiles (boîte), moustaches (étendue) et valeurs aberrantes. Idéal pour comparer la dispersion et la symétrie des données., offrant une vue claire sur la médianeValeur centrale divisant une série de données ordonnées en deux groupes égaux (50 % au-dessus, 50 % en dessous). Contrairement à la moyenne, elle est robuste face aux valeurs aberrantes., les quartilesValeurs divisant un échantillon en quatre parts égales. Le 1er (25%), la médiane (50%) et le 3er (75%) permettent de mesurer la dispersion et d'identifier la structure d'une distribution. et la dispersion. Son rôle business majeur est la détection des valeurs aberrantesObservations s'écartant significativement du reste des données. Elles peuvent résulter d'erreurs de mesure ou de phénomènes rares et influencent fortement les statistiques (moyenne, variance). (outliersValeur atypique s'écartant significativement des autres observations d'un jeu de données. Elle peut signaler une erreur de saisie ou un phénomène rare nécessitant une analyse statistique dédiée.) et l'évaluation de la symétrie des distributions, ce qui est critique avant d'injecter des données dans des modèles de machine learningBranche de l'IA utilisant des algorithmes pour apprendre des modèles à partir de données. Il permet d'automatiser des prédictions ou des décisions sans programmation explicite de chaque règle. sensibles aux bruits statistiques.

Exemples pour l'action boxPlot

Calcul de base des statistiques de boîte

Exécute une analyse boxPlot standard sur la variable 'score' de la table 'scores'.

Analyse complète avec détection de valeurs aberrantes et export

Cet exemple calcule les percentiles exacts, définit les moustaches au 10ème/90ème percentile et demande l'extraction des 50 pires/meilleures valeurs aberrantes dans une table de sortie.