Par défaut, l'action effectue une recherche greedy (exhaustive) pour trouver la meilleure division. Cependant, pour des variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. nominales possédant des centaines de catégories, ce calcul peut devenir extrêmement coûteux en ressources CAS Cloud Analytic ServicesMoteur d'exécution in-memory de SAS Viya. Il assure le traitement massivement parallèle (MPP) et distribué des données pour optimiser les performances analytiques et le passage à l'échelle.. En réglant greedy sur False, SAS applique un algorithme de clusteringLe clustering est une technique d'apprentissage non supervisé regroupant des données similaires en segments homogènes afin d'identifier des structures cachées sans étiquettes préalables. rapide et efficace. Cette méthode regroupe les niveaux de variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. avant de chercher la séparation, ce qui accélère considérablement le temps de traitement tout en maintenant une qualité de segmentation élevée pour le plan de données.
Pourquoi désactiver l'option greedy pour les variables à forte cardinalité ?
Exemples pour l'action dtreeSplit
Division automatique des nœuds feuilles
Cet exemple prend un arbre existant (de profondeur 2 par exemple) et tente d'ajouter une séparation supplémentaire à chaque nœud terminal.
Division ciblée et personnalisée d'un nœud
Ici, nous ciblons le nœud racine (nodeId 0) et le divisons de force en utilisant la variable 'x1' avec un point de coupure à 0.5. Parfait pour ajuster un arbre basé sur l'expertise métier.