correlation
Description
L'action correlation du jeu d'actions simple est votre détective statistique personnel dans SAS Viya. Elle calcule les coefficients de corrélation de Pearson , mesurant la force et la direction de la relation linéaire entre vos variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. numériques. Que vous cherchiez à savoir si la consommation de café est réellement liée à votre productivité (spoiler : souvent oui, mais attention à la causalité !) ou à valider la cohérence interne d'un questionnaire via l'alpha de Cronbach, cette action est l'outil indispensable avant toute modélisationProcessus de création de structures mathématiques ou statistiques sur SAS Viya pour prédire des comportements, classifier des données ou identifier des tendances à partir de jeux de données CAS. prédictive sérieuse.
Paramètres Clés
| Nom du paramètre | Description |
|---|---|
| alpha | Si activé, calcule l'alpha de Cronbach pour évaluer la fiabilité ou la cohérence interne d'un groupe de variables. |
| table | Paramètre obligatoire spécifiant la table d'entrée chargée en mémoire CAS. |
| inputs | Liste des variables numériques à inclure dans l'analyse de corrélation. |
| pairWithInput | Permet de calculer les corrélations entre les variables de 'inputs' et cette nouvelle liste de variables (équivalent à l'instruction WITH dans SAS classique). |
| covariance | Demande le calcul de la matrice de variance-covariance en plus des corrélations. |
| pearsonOut | Spécifie le nom de la table CAS où sauvegarder les coefficients de corrélation de Pearson. |
| rank | Ordonne les coefficients de corrélation du plus élevé au plus faible pour une lecture simplifiée. |
| topCorrelation | Limite l'affichage aux 'n' meilleures corrélations (alias 'best'). Pratique quand on a 200 variables et qu'on ne veut pas d'un pavé indigeste. |
| listwiseDelMiss | Supprime une observation complète si au moins une des variables contient une valeur manquante (Pairwise par défaut). |
| sscp | Affiche la matrice des sommes des carrés et des produits croisés. |
| varianceDivisor | Définit le diviseur pour la variance : DF (degrés de liberté), N (nombre d'obs), WEIGHT ou WDF. |
Préparation des données
Création de données de test pour corrélation
Génération d'une table CAS contenant des variables corrélées (taille, poids, âge) pour illustrer l'action.
| 1 | DATA casuser.body_stats; |
| 2 | DO i = 1 to 100; |
| 3 | Age = floor(20 + 40*ranuni(1)); |
| 4 | Height = 150 + Age*0.5 + rannor(1)*5; |
| 5 | Weight = (Height - 100) * 0.9 + rannor(1)*10; |
| 6 | Income = 2000 + Age*50 + rannor(1)*500; |
| 7 | OUTPUT; |
| 8 | END; |
| 9 | drop i; |
| 10 | RUN; |
Exemples d'utilisation
Corrélation de Pearson basique
Calcule la matrice de corrélation pour toutes les variables numériques de la table.
| 1 | PROC CAS; |
| 2 | SIMPLE.correlation / TABLE={name="body_stats", caslib="casuser"}; |
| 3 | RUN; |
Résultat Attendu :
Analyse avancée avec Alpha de Cronbach et sauvegarde
Analyse complète incluant les covariances, l'alpha de Cronbach, le tri par rang, et l'exportation des résultats vers une table CAS.
| 1 | PROC CAS; |
| 2 | SIMPLE.correlation / |
| 3 | TABLE={name="body_stats", caslib="casuser"}, |
| 4 | inputs={"Height", "Weight", "Age"}, |
| 5 | alpha=true, |
| 6 | covariance=true, |
| 7 | rank=true, |
| 8 | topCorrelation=5, |
| 9 | pearsonOut={name="corr_results", replace=true}, |
| 10 | outputTables={names={PearsonCorr="corr_table"}}; |
| 11 | RUN; |
Résultat Attendu :
Corrélation croisée (With)
Calcule uniquement les corrélations entre un groupe cible (Income) et les autres variables.
| 1 | PROC CAS; |
| 2 | SIMPLE.correlation / |
| 3 | TABLE={name="body_stats", caslib="casuser"}, |
| 4 | inputs={"Income"}, |
| 5 | pairWithInput={"Age", "Height", "Weight"}; |
| 6 | RUN; |