bartProbit
Description
L'action bartProbit ajuste des modèles d'arbres de régression additifs bayésiens (BART) pour des données de réponse binaire. Contrairement aux forêts aléatoires classiques, le BART utilise un cadre probabiliste bayésien où chaque arbre contribue par de petits ajustements à la prédiction globale. C'est un peu comme si vous demandiez l'avis à 200 experts (les arbres) qui, au lieu de crier tous en même temps, murmurent chacun une petite partie de la vérité pour arriver à un consensus probabiliste très robuste.
Paramètres Clés
Préparation des données
Génération de données binaires synthétiques
Création d'un jeu de données avec une cible binaire 'y' influencée par deux variables continues.
| 1 | DATA mycas.donnees_simulees; |
| 2 | call streaminit(12345); |
| 3 | DO i = 1 to 2000; |
| 4 | x1 = rand('Normal'); |
| 5 | x2 = rand('Normal'); |
| 6 | lp = 0.8*x1 - 0.5*x2 + rand('Normal')*0.1; |
| 7 | prob = 1 / (1 + exp(-lp)); |
| 8 | IF rand('Uniform') < prob THEN y = 1; |
| 9 | ELSE y = 0; |
| 10 | OUTPUT; |
| 11 | END; |
| 12 | RUN; |
Exemples d'utilisation
Modèle BART Probit basique
Exécution de l'action avec les paramètres par défaut pour prédire 'y'.
| 1 | PROC CAS; |
| 2 | bart.bartProbit / |
| 3 | TABLE={name="donnees_simulees"}, |
| 4 | model={depVars={{name="y"}}, effects={{vars={"x1", "x2"}}}}; |
| 5 | RUN; |
Résultat Attendu :
Modèle BART avec prédictions et marges
Configuration avancée avec échantillonnage MCMC personnalisé, partitionnement des données et calcul de marges prédictives.
| 1 | PROC CAS; |
| 2 | bart.bartProbit / |
| 3 | TABLE={name="donnees_simulees"}, |
| 4 | model={depVars={{name="y"}}, effects={{vars={"x1", "x2"}}}}, |
| 5 | nTree=100, |
| 6 | nMC=500, |
| 7 | nBI=200, |
| 8 | seed=987, |
| 9 | partByFrac={test=0.3, seed=123}, |
| 10 | margins={{name="scenario_x1", at={{var="x1", value=1.5}}}}, |
| 11 | OUTPUT={casOut={name="predictions", replace=true}, pred="p_y", lcl="bas", ucl="haut"}; |
| 12 | RUN; |