Le paramètre rho est crucial car il contrôle la pénalité de régularisation appliquée lors de l'estimation. En ajustant ce paramètre, vous déterminez la parcimonie du modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). graphique. Une valeur de rho plus élevée augmente la pénalité, ce qui tend à déconnecter les variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. et à créer des clusters plus petits et plus granulaires. À l'inverse, un rho faible favorise des connexions plus denses, regroupant davantage de variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. au sein de structures plus vastes.
Pourquoi le paramètre rho est-il le levier de contrôle ultime de vos clusters ?
Exemples pour l'action gvarcluster
Exemple simple de clustering de variables
Un premier essai pour regrouper nos variables continues avec les paramètres par défaut. Simple, basique, efficace.
Clustering avancé avec gestion des graphes (arêtes et sommets)
Ici on sort l'artillerie lourde : on inclut notre variable nominale 'cat', on désactive l'approximation avec 'exact=true', on modifie la pénalité 'rho', et on prépare les tables réseaux (nœuds et arêtes). L'astuce du chef pour préparer une belle visualisation réseau !