Le clusteringLe clustering est une technique d'apprentissage non supervisé regroupant des données similaires en segments homogènes afin d'identifier des structures cachées sans étiquettes préalables. de variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. est une étape stratégique de réduction de dimensionnalité. En utilisant gvarcluster, vous pouvez remplacer un large groupe de variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. corrélées par une seule variable représentative ou un composant. Cela limite les problèmes de multicolinéarité dans vos modèles de régression ou de machine learningBranche de l'IA utilisant des algorithmes pour apprendre des modèles à partir de données. Il permet d'automatiser des prédictions ou des décisions sans programmation explicite de chaque règle., améliorant ainsi la stabilité et l'interprétabilité des résultats pour les décideurs métiers tout en exploitant la puissance du moteur CAS Cloud Analytic ServicesMoteur d'exécution in-memory de SAS Viya. Il assure le traitement massivement parallèle (MPP) et distribué des données pour optimiser les performances analytiques et le passage à l'échelle..
Quel est le secret pour simplifier vos modèles prédictifs sans perdre d'information ?
Exemples pour l'action gvarcluster
Exemple simple de clustering de variables
Un premier essai pour regrouper nos variables continues avec les paramètres par défaut. Simple, basique, efficace.
Clustering avancé avec gestion des graphes (arêtes et sommets)
Ici on sort l'artillerie lourde : on inclut notre variable nominale 'cat', on désactive l'approximation avec 'exact=true', on modifie la pénalité 'rho', et on prépare les tables réseaux (nœuds et arêtes). L'astuce du chef pour préparer une belle visualisation réseau !