bartScore
Description
L'action bartScore est le bras armé de l'ensemble d'actions BART (Bayesian Additive Regression Trees ). Elle permet d'appliquer un modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). prédictif préalablement entraîné et sauvegardé (via bartGauss ou bartProbit) à de nouvelles données. Contrairement aux arbres de décision classiques qui poussent un peu n'importe comment, le BART utilise une approche bayésienne pour sommer les contributions de nombreux arbres 'faibles'. C'est un peu comme demander l'avis de 200 jardiniers amateurs pour deviner le prix d'une plante : la moyenne est souvent étonnamment précise ! Cette action génère des prédictions, des résidus et des intervalles de crédibilité (l'équivalent bayésien des intervalles de confiance).
Paramètres Clés
Préparation des données
Préparation d'un modèle BART pour le scoring
Pour utiliser bartScore, nous devons d'abord créer des données, entraîner un modèle et le sauvegarder.
| 1 | DATA casuser.immobilier; |
| 2 | DO i = 1 to 1000; |
| 3 | surface = rand('Uniform') * 200; |
| 4 | chambres = floor(surface / 40) + 1; |
| 5 | prix = 50000 + (surface * 1500) + (chambres * 10000) + rand('Normal', 0, 5000); |
| 6 | OUTPUT; |
| 7 | END; |
| 8 | drop i; RUN; |
| 9 | DATA casuser.nouveaux_biens; |
| 10 | INPUT surface chambres; |
| 11 | DATALINES; |
| 12 | 120 4 |
| 13 | 45 1 |
| 14 | 250 6 |
| 15 | ; |
| 16 | RUN; |
| 17 | PROC CAS; |
| 18 | /* 1. Entraînement et sauvegarde du cerveau (modèle) */ |
| 19 | bart.bartGauss / TABLE={name="immobilier", caslib="casuser"}, target="prix", inputs={"surface", "chambres"}, saveState={name="mon_modele_immo", replace=true}; |
| 20 | QUIT; |
Exemples d'utilisation
Scoring de base
Application simple du modèle sauvegardé sur de nouvelles données immobilières.
| 1 | PROC CAS; bart.bartScore / TABLE={name="nouveaux_biens", caslib="casuser"}, restore={name="mon_modele_immo", caslib="casuser"}, casOut={name="resultats_simples", replace=true}, pred="Prix_Estime"; RUN; |
Résultat Attendu :
Scoring complet avec intervalles de crédibilité
Cet exemple calcule les prédictions, les résidus (si la cible existe) et les bornes de confiance à 95%.
| 1 | PROC CAS; bart.bartScore / TABLE={name="immobilier", caslib="casuser"}, restore={name="mon_modele_immo", caslib="casuser"}, casOut={name="stats_completes", replace=true}, copyVars={"surface", "chambres"}, pred="Estimation", lcl="Borne_Inf", ucl="Borne_Sup", resid="Erreur", alpha=0.05; RUN; |
Résultat Attendu :
Scoring avec sortie de tous les échantillons MCMC
Utile pour analyser la distribution complète des prédictions au lieu d'une simple moyenne.
| 1 | PROC CAS; bart.bartScore / TABLE={name="nouveaux_biens", caslib="casuser"}, restore={name="mon_modele_immo", caslib="casuser"}, casOut={name="foret_entiere", replace=true}, avgOnly=false; RUN; |