Pour garantir la robustesse du modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting)., dtreeSplit propose des options d'élagage (pruning) sophistiquées via le paramètre prune. Pour les arbres de classification, l'action peut utiliser la méthode C4.5 (contrôlée par cfLev). Pour les modèles de régression, elle emploie l'élagage par minimal cost-complexity, où le paramètre alpha joue un rôle déterminant dans l'équilibre entre la taille de l'arbre et l'erreur résiduelle. Ces mécanismes microservicesLes microservices sont une approche d'architecture logicielle où une application est décomposée en une collection de petits services indépendants, spécialisés et communicant entre eux via des APIs légères. Contrairement aux architectures "monolithiques" anciennes, chaque microservice remplit une fonction unique (ex: gestion du catalogue, authentification, moteur de calcul).
Dans SAS Viya 4, cette architecture est native. Elle permet à la plateforme de s'exécuter sur Kubernetes, offrant une flexibilité totale : chaque composant de SAS peut être mis à jour, redémarré ou mis à l'échelle (scaling) individuellement sans affecter le reste du système. permettent de simplifier l'arbre pour améliorer sa capacité de généralisation sur de nouvelles données.
Comment éviter le surapprentissage grâce aux techniques d'élagage intégrées ?
Exemples pour l'action dtreeSplit
Division automatique des nœuds feuilles
Cet exemple prend un arbre existant (de profondeur 2 par exemple) et tente d'ajouter une séparation supplémentaire à chaque nœud terminal.
Division ciblée et personnalisée d'un nœud
Ici, nous ciblons le nœud racine (nodeId 0) et le divisons de force en utilisant la variable 'x1' avec un point de coupure à 0.5. Parfait pour ajuster un arbre basé sur l'expertise métier.