L'interprétabilité est cruciale en entreprise. En activant varImp, l'action génère un tableau d'importance des variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. basé sur la réduction de l'impureté de Gini ou la varianceMesure statistique de la dispersion des données indiquant l'écart carré moyen par rapport à la moyenne. Une variance élevée traduit une grande hétérogénéité des observations autour du centre.. Pour une analyse encore plus rigoureuse, le paramètre rbaImp (Random Branch Assignment) permet de mesurer l'importance par permutation, une méthode plus robuste qui évalue comment la précision du modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). chute lorsque les valeurs d'une variable sont mélangées de manière aléatoire, révélant ainsi sa véritable contribution prédictive.
Comment interpréter l'influence réelle des variables sur les décisions du modèle ?
Exemples pour l'action forestTrain
Entraînement de base d'une forêt
Exemple minimal pour entraîner une forêt sur la cible BAD avec quelques variables explicatives.
Forêt avancée avec sauvegarde aStore et Importance RBA
Entraînement d'une forêt robuste avec 100 arbres, calcul de l'importance RBA, évaluation OOB et sauvegarde du modèle en format binaire aStore.