crossTab
Description
L'action simple.crossTab est le pilier de l'analyse descriptive pour les variables catégoriellesLes variables catégorielles sont des données qualitatives divisées en groupes distincts (nominales ou ordinales), utilisées dans SAS Viya pour segmenter les analyses et définir des classes. dans SAS Viya. Elle permet de générer des tableaux de contingence à une ou deux entrées (fréquences croisées). Au-delà du simple comptage, elle peut calculer des statistiques de pondération via une variable de poids , effectuer des tests d'indépendance du Chi-deux et mesurer l'association entre les variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage.. C'est l'équivalent moderne et distribué de la célèbre PROC FREQ de SAS9, mais prête pour le Big Data. Si vos données étaient des invités à une fête, crossTab serait le physionomiste qui compte qui discute avec qui !
Paramètres Clés
Préparation des données
Création de données de ventes fictives
Ce code génère une table avec des régions, des types de produits et des montants de ventes pour illustrer les tabulations.
| 1 | DATA casuser.ventes; |
| 2 | INPUT Region $ Produit $ Ventes Poids; |
| 3 | DATALINES; |
| 4 | Est Ordinateur 1500 1.2 |
| 5 | Est Tablette 800 0.8 |
| 6 | Ouest Ordinateur 1200 1.1 |
| 7 | Ouest Tablette 900 0.9 |
| 8 | Nord Ordinateur 2000 1.5 |
| 9 | Sud Tablette 600 0.7 |
| 10 | Nord Tablette 1100 1.0 |
| 11 | Est Ordinateur 1400 1.2 |
| 12 | ; |
| 13 | RUN; |
Exemples d'utilisation
Tabulation simple à une entrée
Comptage simple des occurrences pour chaque type de produit.
| 1 | PROC CAS; |
| 2 | SIMPLE.crossTab / TABLE={name="ventes"}, row="Produit"; |
| 3 | RUN; |
Résultat Attendu :
Tableau croisé à deux entrées
Croisement entre la région et le type de produit.
| 1 | PROC CAS; |
| 2 | SIMPLE.crossTab / TABLE={name="ventes"}, row="Region", col="Produit"; |
| 3 | RUN; |
Résultat Attendu :
Analyse statistique complète avec pondération
Cet exemple croise la région et le produit, applique un poids, calcule les statistiques de Chi-deux et les mesures d'association.
| 1 | PROC CAS; |
| 2 | SIMPLE.crossTab / |
| 3 | TABLE={name="ventes"}, |
| 4 | row="Region", |
| 5 | col="Produit", |
| 6 | weight="Poids", |
| 7 | aggregator="SUM", |
| 8 | chiSq=true, |
| 9 | association=true, |
| 10 | includeMissing=true, |
| 11 | niceBinning=true; |
| 12 | RUN; |
Résultat Attendu :
Tabulation avec discrétisation (Binning)
Idéal quand vous voulez croiser une variable catégorielle avec une variable numérique continue découpée en intervalles.
| 1 | PROC CAS; |
| 2 | SIMPLE.crossTab / |
| 3 | TABLE={name="ventes"}, |
| 4 | row="Produit", |
| 5 | col="Ventes", |
| 6 | colNBins=3, |
| 7 | niceBinning=true; |
| 8 | RUN; |