Comment détecter automatiquement des relations complexes entre des milliers de variables ?

L'action gvarcluster de l'environnement SAS Viya est conçue pour l'exploration de données à grande échelle. Elle utilise des modèles graphiques pour identifier des groupes de variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage., ou clusters, qui présentent des dépendances statistiques significatives. Contrairement au clusteringLe clustering est une technique d'apprentissage non supervisé regroupant des données similaires en segments homogènes afin d'identifier des structures cachées sans étiquettes préalables. traditionnel, cette approche s'appuie sur l'estimation d'une matrice de précision éparse, ce qui permet de mettre en lumière non seulement les corrélations directes, mais aussi les relations conditionnelles entre les variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. au sein de vos plans de données.

Exemples pour l'action gvarcluster

Exemple simple de clustering de variables

Clustering avancé avec gestion des graphes (arêtes et sommets)

Action CAS associée

À lire aussi...