simple

correlation

##set_simple

Description

L'action correlation du jeu d'actions simple  est votre détective statistique personnel dans SAS Viya

L'action correlation du jeu d'actions simple est votre détective statistique personnel dans SAS Viya. Elle calcule les coefficients de corrélation de Pearson , mesurant la force et la direction de la relation linéaire entre vos variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. numériques. Que vous cherchiez à savoir si la consommation de café est réellement liée à votre productivité (spoiler : souvent oui, mais attention à la causalité !) ou à valider la cohérence interne d'un questionnaire via l'alpha de Cronbach, cette action est l'outil indispensable avant toute modélisationProcessus de création de structures mathématiques ou statistiques sur SAS Viya pour prédire des comportements, classifier des données ou identifier des tendances à partir de jeux de données CAS. prédictive sérieuse.

Syntaxe Officielle
simple.correlation <result=results> <status=rc> /
alpha=TRUE | FALSE,
attributes={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}},
casOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}},
covariance=TRUE | FALSE,
csscp=TRUE | FALSE,
descriptiveStats=TRUE | FALSE,
display={caseSensitive=TRUE | FALSE, exclude=TRUE | FALSE, excludeAll=TRUE | FALSE, keyIsPath=TRUE | FALSE, names={"string-1" <, "string-2", ...>}, pathType="LABEL" | "NAME", traceNames=TRUE | FALSE},
excludeNonPosWgt=TRUE | FALSE,
excludePairStats=TRUE | FALSE,
excludeProbs=TRUE | FALSE,
freq="variable-name",
groupByLimit=64-bit-integer,
groupbyTable={casLib="string", dataSourceOptions={...}, importOptions={fileType="ANY" | "AUDIO" | "AUTO" | "BASESAS" | "CSV" | "DELIMITED" | "DOCUMENT" | "DTA" | "ESP" | "EXCEL" | "FMT" | "HDAT" | "IMAGE" | "JMP" | "LASR" | "PARQUET" | "SOUND" | "SPSS" | "VIDEO" | "XLS", fileType-specific-parameters}, name="table-name", where="where-expression"},
inputs={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}},
listwiseDelMiss=TRUE | FALSE,
outputTables={groupByVarsRaw=TRUE | FALSE, includeAll=TRUE | FALSE, names={"string-1" <, "string-2", ...>} | {key-1={casouttable-1} <, key-2={casouttable-2}, ...>}, repeated=TRUE | FALSE, replace=TRUE | FALSE},
pairWithInput={{format="string", formattedLength=integer, label="string", name="variable-name", nfd=integer, nfl=integer}, {...}},
pearsonOut={caslib="string", compress=TRUE | FALSE, indexVars={"variable-name-1" <, "variable-name-2", ...>}, label="string", lifetime=64-bit-integer, maxMemSize=64-bit-integer, memoryFormat="DVR" | "INHERIT" | "STANDARD", name="table-name", promote=TRUE | FALSE, replace=TRUE | FALSE, replication=integer, tableRedistUpPolicy="DEFER" | "NOREDIST" | "REBALANCE", threadBlockSize=64-bit-integer, timeStamp="string", where={"string-1" <, "string-2", ...>}},
rank=TRUE | FALSE,
sscp=TRUE | FALSE,
table={castable},
topCorrelation=integer,
varianceDivisor="DF" | "N" | "WDF" | "WEIGHT",
varInfo=TRUE | FALSE,
weight="variable-name";

Paramètres Clés

Nom du paramètre Description
alpha Si activé, calcule l'alpha de Cronbach pour évaluer la fiabilité ou la cohérence interne d'un groupe de variables.
table Paramètre obligatoire spécifiant la table d'entrée chargée en mémoire CAS.
inputs Liste des variables numériques à inclure dans l'analyse de corrélation.
pairWithInput Permet de calculer les corrélations entre les variables de 'inputs' et cette nouvelle liste de variables (équivalent à l'instruction WITH dans SAS classique).
covariance Demande le calcul de la matrice de variance-covariance en plus des corrélations.
pearsonOut Spécifie le nom de la table CAS où sauvegarder les coefficients de corrélation de Pearson.
rank Ordonne les coefficients de corrélation du plus élevé au plus faible pour une lecture simplifiée.
topCorrelation Limite l'affichage aux 'n' meilleures corrélations (alias 'best'). Pratique quand on a 200 variables et qu'on ne veut pas d'un pavé indigeste.
listwiseDelMiss Supprime une observation complète si au moins une des variables contient une valeur manquante (Pairwise par défaut).
sscp Affiche la matrice des sommes des carrés et des produits croisés.
varianceDivisor Définit le diviseur pour la variance : DF (degrés de liberté), N (nombre d'obs), WEIGHT ou WDF.

Préparation des données

Création de données de test pour corrélation

Génération d'une table CAS contenant des variables corrélées (taille, poids, âge) pour illustrer l'action.

1DATA casuser.body_stats;
2 DO i = 1 to 100;
3 Age = floor(20 + 40*ranuni(1));
4 Height = 150 + Age*0.5 + rannor(1)*5;
5 Weight = (Height - 100) * 0.9 + rannor(1)*10;
6 Income = 2000 + Age*50 + rannor(1)*500;
7 OUTPUT;
8 END;
9 drop i;
10RUN;

Exemples d'utilisation

Corrélation de Pearson basique

Calcule la matrice de corrélation pour toutes les variables numériques de la table.

1PROC CAS;
2 SIMPLE.correlation / TABLE={name="body_stats", caslib="casuser"};
3RUN;
Résultat Attendu :
Un tableau affichant les coefficients de corrélation entre Age, Height, Weight et Income.
Analyse avancée avec Alpha de Cronbach et sauvegarde

Analyse complète incluant les covariances, l'alpha de Cronbach, le tri par rang, et l'exportation des résultats vers une table CAS.

1PROC CAS;
2 SIMPLE.correlation /
3 TABLE={name="body_stats", caslib="casuser"},
4 inputs={"Height", "Weight", "Age"},
5 alpha=true,
6 covariance=true,
7 rank=true,
8 topCorrelation=5,
9 pearsonOut={name="corr_results", replace=true},
10 outputTables={names={PearsonCorr="corr_table"}};
11RUN;
Résultat Attendu :
Calcul des corrélations, des covariances et de la cohérence interne. Les 5 meilleures relations sont triées et sauvegardées dans la table 'corr_results'.
Corrélation croisée (With)

Calcule uniquement les corrélations entre un groupe cible (Income) et les autres variables.

1PROC CAS;
2 SIMPLE.correlation /
3 TABLE={name="body_stats", caslib="casuser"},
4 inputs={"Income"},
5 pairWithInput={"Age", "Height", "Weight"};
6RUN;
Résultat Attendu :
Une matrice rectangulaire montrant l'influence de l'âge, de la taille et du poids spécifiquement sur le revenu.