Maîtriser l'importance des variables : pourquoi activer la méthode RBA lors du scoring ?

L'option rbaImp (Random Branch Assignments) est une fonctionnalité avancée pour les architectes de données cherchant à comprendre la robustesse de leur modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting).. Contrairement à l'importance calculée lors de l'entraînement, cette méthode évalue l'importance des variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. durant la phase de scoringProcessus d'application d'un modèle prédictif à de nouvelles données pour calculer une probabilité ou un score, permettant ainsi d'automatiser la prise de décision en temps réel sur SAS Viya..

Elle fonctionne en réassignant aléatoirement les observations à différentes branches pour mesurer l'impact sur l'erreur de prédiction. C'est un outil puissant pour détecter les variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. qui perdent de leur pertinence au fil du temps ou à cause d'un changement de distribution dans les données de production (Data Drift).

Exemples pour l'action gbtreeScore

Scoring basique

Applique le modèle pour générer des prédictions simples dans une nouvelle table.

Scoring avancé avec évaluation et transfert de variables

Ici, on score en limitant à 50 arbres, on récupère les variables d'origine pour comparaison et on active les probabilités pour l'évaluation.