Grâce au paramètre oob (Out-Of-Bag), l'action calcule automatiquement l'erreur sur les observations qui n'ont pas été sélectionnées lors de l'échantillonnage bootstrap pour un arbre donné. Puisque chaque arbre ne voit qu'environ 63 % des données, les 37 % restants servent de jeu de test naturel. Cela permet d'obtenir une évaluation de la performance du modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting)., comme le taux d'erreur OOB ou l'erreur quadratique moyenne, sans avoir à partitionner manuellement vos plans de données CAS, optimisant ainsi l'utilisation de vos ressources de calcul.
Comment obtenir une estimation fiable de l'erreur sans utiliser de jeu de données de validation ?
Exemples pour l'action forestTrain
Entraînement de base d'une forêt
Exemple minimal pour entraîner une forêt sur la cible BAD avec quelques variables explicatives.
Forêt avancée avec sauvegarde aStore et Importance RBA
Entraînement d'une forêt robuste avec 100 arbres, calcul de l'importance RBA, évaluation OOB et sauvegarde du modèle en format binaire aStore.