Dendrogrammes et matrices : quels sont les livrables stratégiques de l'action gvarcluster ?

L'action propose une suite complète de résultats pour l'analyste :

  • outTree : Indispensable pour générer des dendrogrammes (diagrammes en arbre) via le langage GTL, illustrant la hiérarchie des clusters.
  • outCP : Fournit une matrice de covariance symétrique et des statistiques détaillées sur les variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. d'entrée.
  • select : Permet de choisir automatiquement le meilleur modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). en utilisant des critères comme l'ajustement du critère d'information bayésien (ADJBIC) ou la validation croisée (CV).

Exemples pour l'action gvarcluster

Exemple simple de clustering de variables

Un premier essai pour regrouper nos variables continues avec les paramètres par défaut. Simple, basique, efficace.

Clustering avancé avec gestion des graphes (arêtes et sommets)

Ici on sort l'artillerie lourde : on inclut notre variable nominale 'cat', on désactive l'approximation avec 'exact=true', on modifie la pénalité 'rho', et on prépare les tables réseaux (nœuds et arêtes). L'astuce du chef pour préparer une belle visualisation réseau !