L'action gvarcluster de l'environnement SAS Viya est conçue pour l'exploration de données à grande échelle. Elle utilise des modèles graphiques pour identifier des groupes de variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage., ou clusters, qui présentent des dépendances statistiques significatives. Contrairement au clusteringLe clustering est une technique d'apprentissage non supervisé regroupant des données similaires en segments homogènes afin d'identifier des structures cachées sans étiquettes préalables. traditionnel, cette approche s'appuie sur l'estimation d'une matrice de précision éparse, ce qui permet de mettre en lumière non seulement les corrélations directes, mais aussi les relations conditionnelles entre les variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. au sein de vos plans de données.
Comment détecter automatiquement des relations complexes entre des milliers de variables ?
Exemples pour l'action gvarcluster
Exemple simple de clustering de variables
Un premier essai pour regrouper nos variables continues avec les paramètres par défaut. Simple, basique, efficace.
Clustering avancé avec gestion des graphes (arêtes et sommets)
Ici on sort l'artillerie lourde : on inclut notre variable nominale 'cat', on désactive l'approximation avec 'exact=true', on modifie la pénalité 'rho', et on prépare les tables réseaux (nœuds et arêtes). L'astuce du chef pour préparer une belle visualisation réseau !