simple

mdSummary

##set_simple

Description

L'action mdSummary calcule des résumés multidimensionnels pour des variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. numériques. Les données d'entrée doivent contenir au moins une variable numérique, sinon l'action renvoie une erreur et un dictionnaire vide. Parfait pour se faire une idée rapide de vos métriques et indicateurs sans trop transpirer !

Syntaxe Officielle
proc cas;
simple.mdSummary /
table={name="table-name", caslib="caslib-name"}
inputs={"var1", "var2"}
subSet={"MIN", "MAX", "MEAN", "N", "STD", "SUM", "VAR"}
sets={{groupBy={"group-var"}, where="condition"}}
groupByLimit=integer
includeMissing=TRUE | FALSE
descending=TRUE | FALSE
orderByGbyRaw=TRUE | FALSE
returnValidSet=TRUE | FALSE
weight="weight-var"
attributes={{name="var-name", format="fmt"}};
run;
quit;

Paramètres Clés

Nom du paramètre Description
table Spécifie la table d'entrée, la bibliothèque CAS et d'autres paramètres pour l'exécution.
inputs Spécifie les variables d'entrée numériques pour l'analyse des données.
subSet Spécifie les statistiques de résumé à générer, par exemple MAX, MEAN, SUM, KURTOSIS, etc.
sets Définit les spécifications de groupes, très utile pour faire des agrégations par catégories (ex: groupBy, groupByFmts, where).
groupByLimit Spécifie le nombre maximum de niveaux dans un regroupement. Pratique pour éviter de faire exploser la mémoire du serveur si vous groupez sur un identifiant unique !
includeMissing Détermine si les valeurs manquantes doivent être incluses dans la création des valeurs de groupes.
weight Variable numérique utilisée pour pondérer les observations lors des calculs des statistiques d'analyse.
orderByGbyRaw Si défini sur True, le tri des variables group-by est basé sur les valeurs brutes et non sur les valeurs formatées.

Préparation des données

Chargement des données de test

Importation de la célèbre table sashelp.cars dans une bibliothèque CAS pour pouvoir faire chauffer les moteurs statistiques.

1PROC CAS;
2 SESSION casauto;
3 TABLE.loadTable /
4 caslib="sashelp"
5 path="cars.sas7bdat"
6 casOut={name="cars", caslib="casuser", replace=true};
7RUN;
8QUIT;

Exemples d'utilisation

Résumé simple de plusieurs variables

Génère les statistiques descriptives classiques sur le prix conseillé (MSRP), le prix facturé (Invoice) et la consommation en ville (MPG_City).

1PROC CAS;
2 SIMPLE.mdSummary /
3 TABLE={name="cars", caslib="casuser"}
4 inputs={"MSRP", "Invoice", "MPG_City"}
5 subSet={"MIN", "MAX", "MEAN", "N"};
6RUN;
7QUIT;
Résultat Attendu :
Un dictionnaire de résultats contenant un tableau (ByGroupInfo) qui affiche le minimum, le maximum, la moyenne et le nombre d'observations valides pour chacune des variables ciblées.
Résumé multidimensionnel avec regroupement avancé

Produit des statistiques détaillées groupées par origine et type de véhicule, en excluant les valeurs manquantes et en ajoutant l'écart-type et le coefficient de variation.

1PROC CAS;
2 SIMPLE.mdSummary /
3 TABLE={name="cars", caslib="casuser"}
4 inputs={"MSRP"}
5 subSet={"MEAN", "STD", "CV", "MIN", "MAX"}
6 sets={
7 {groupBy={"Origin", "Type"}}
8 }
9 includeMissing=FALSE;
10RUN;
11QUIT;
Résultat Attendu :
L'action génère de multiples tableaux de résultats offrant une ventilation précise des prix moyens, écarts-types, minimas et maximas pour chaque combinaison possible (ex: Asie-SUV, Europe-Sedan). La magie du traitement multidimensionnel !