La gestion des données absentes est critique lors de la préparation des données. L'action propose le paramètre listwiseDelMiss. Lorsqu'il est activé, le moteur distribué applique une suppression stricte, écartant toute observation possédant au moins une valeur manquante parmi les variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. d'analyse. Si ce paramètre est inactif, l'approche par défaut utilise la suppression par paire. Vous pouvez également purger les statistiques associées à cette suppression via le paramètre excludePairStats afin d'alléger la lecture des résultats tout en préservant l'intégrité de votre analyse exploratoire.
Comment traiter intelligemment les valeurs manquantes sans fausser votre matrice de covariance ?
Optimisation de la Covariance en Environnement Distribué
Exemples pour l'action correlation
Corrélation de Pearson basique
Calcule la matrice de corrélation pour toutes les variables numériques de la table.
Analyse avancée avec Alpha de Cronbach et sauvegarde
Analyse complète incluant les covariances, l'alpha de Cronbach, le tri par rang, et l'exportation des résultats vers une table CAS.
Corrélation croisée (With)
Calcule uniquement les corrélations entre un groupe cible (Income) et les autres variables.
