Comment assurer la reproductibilité de vos scores entre différents environnements ?

La reproductibilité est garantie par deux paramètres clés. Le paramètre seed permet de fixer la graine du générateur de nombres aléatoires pour les méthodes comme l'importance RBA. Par ailleurs, applyRowOrder permet de maintenir un ordre de ligne spécifique si vous avez préalablement partitionné vos données, assurant que les résultats restent identiques lors de tests successifs sur le clusterEnsemble de nœuds (machines) interconnectés, gérés par Kubernetes, qui collaborent pour exécuter les microservices et le moteur CAS de SAS Viya, assurant haute disponibilité et passage à l'échelle. CAS.

Exemples pour l'action dtreeScore

Scoring basique d'un modèle d'arbre

Ici, on applique notre modèle fraîchement généré sur nos données d'origine pour obtenir de simples prédictions dans une nouvelle table de sortie.

Scoring complet avec probabilités, encodage parfait et parcours d'arbre

Sortons l'artillerie lourde 🚀 ! On score la table en demandant explicitement les probabilités (%%assess%% et %%assessOneRow%%), en nommant proprement les colonnes avec un préfixe lisible 'P_' (%%encodeName%%), et en gardant la trace complète du chemin emprunté dans l'arbre pour assurer l'explicabilité de la décision (%%path%%).