La reproductibilité est garantie par deux paramètres clés. Le paramètre seed permet de fixer la graine du générateur de nombres aléatoires pour les méthodes comme l'importance RBA. Par ailleurs, applyRowOrder permet de maintenir un ordre de ligne spécifique si vous avez préalablement partitionné vos données, assurant que les résultats restent identiques lors de tests successifs sur le clusterEnsemble de nœuds (machines) interconnectés, gérés par Kubernetes, qui collaborent pour exécuter les microservices et le moteur CAS de SAS Viya, assurant haute disponibilité et passage à l'échelle. CAS.
Comment assurer la reproductibilité de vos scores entre différents environnements ?
Exemples pour l'action dtreeScore
Scoring basique d'un modèle d'arbre
Ici, on applique notre modèle fraîchement généré sur nos données d'origine pour obtenir de simples prédictions dans une nouvelle table de sortie.
Scoring complet avec probabilités, encodage parfait et parcours d'arbre
Sortons l'artillerie lourde 🚀 ! On score la table en demandant explicitement les probabilités (%%assess%% et %%assessOneRow%%), en nommant proprement les colonnes avec un préfixe lisible 'P_' (%%encodeName%%), et en gardant la trace complète du chemin emprunté dans l'arbre pour assurer l'explicabilité de la décision (%%path%%).