decisionTree

forestCode

##set_decisiontree

Description

L'action forestCode de l'ensemble d'actions https://go.documentation.sas.com/doc/en/pgmsascdc/v_069/casanpg/cas-decisiontree-TblOfActions.htm permet de générer du code SAS DATA stepBloc de programmation SAS itératif utilisé pour lire, transformer et manipuler des données ligne par ligne afin de créer des tables de sortie personnalisées et calculer de nouvelles variables. à partir d'un modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). de forêt aléatoireAlgorithme d'apprentissage supervisé combinant plusieurs arbres de décision indépendants pour améliorer la précision et réduire le surapprentissage par agrégation de leurs prédictions. (Random Forest) préalablement entraîné. C'est l'outil idéal pour extraire l'intelligence de votre modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). et la rendre portable : vous pouvez ainsi transformer une forêt complexe en un script exécutable partout où SAS tourne, sans forcément avoir besoin de CAS pour le scoringProcessus d'application d'un modèle prédictif à de nouvelles données pour calculer une probabilité ou un score, permettant ainsi d'automatiser la prise de décision en temps réel sur SAS Viya. final. C'est un peu comme si vous transformiez une jungle sauvage en une liste d'instructions de jardinage bien ordonnée !

Syntaxe Officielle
decisionTree.forestCode /
code={casOut={caslib="string", name="table-name", replace=TRUE|FALSE}, comment=TRUE|FALSE, fmtWdth=integer, indentSize=integer, lineSize=integer, noTrim=TRUE|FALSE},
encodeName=TRUE|FALSE,
modelTable={caslib="string", name="table-name"},
nTree=integer,
vote="MAJORITY"|"PROB";

Paramètres Clés

Nom du paramètre Description
code Demande la génération du code de scoring. On peut y spécifier des options de formatage (indentation, commentaires) ou une table de sortie via casOut.
encodeName Si activé, modifie le préfixe des probabilités prédites (P_ au lieu de _DT_P_) dans le code généré.
modelTable Pointe vers la table CAS contenant le modèle de forêt entraîné (générée par forestTrain).
nTree Nombre d'arbres à inclure dans le code généré. Par défaut, tous les arbres sont utilisés.
vote Stratégie de vote pour la classification : 'MAJORITY' pour le vote majoritaire ou 'PROB' pour la probabilité moyenne.

Préparation des données

Préparation du modèle de Forêt

Avant de générer le code, nous devons entraîner un modèle de forêt sur les données IRIS.

1PROC CAS;
2 LOADACTIONSET "decisionTree";
3 TABLE.loadTable / path="iris.sashdat", caslib="casuser", casout={name="iris", replace=true};
4 decisionTree.forestTrain /
5 TABLE={name="iris"},
6 target="Species",
7 inputs={"SepalLength", "SepalWidth", "PetalLength", "PetalWidth"},
8 casOut={name="my_forest_model", replace=true};
9RUN;

Exemples d'utilisation

Génération simple de code

Génère et affiche le code DATA step pour le modèle entraîné précédemment.

1PROC CAS; decisionTree.forestCode / modelTable={name="my_forest_model"}; RUN;
Résultat Attendu :
Le code DATA step apparaît dans le journal (log) de SAS Studio.
Exportation du code vers une table avec noms simplifiés

Dans cet exemple, nous générons le code en utilisant des noms de probabilités simplifiés et nous sauvegardons le résultat dans une table CAS pour un usage ultérieur.

1PROC CAS; decisionTree.forestCode / modelTable={name="my_forest_model"}, encodeName=true, vote="PROB", code={casOut={name="exported_score_code", replace=true}, comment=true, indentSize=4}; RUN;
Résultat Attendu :
Le code est généré avec des commentaires, une indentation de 4 espaces, et stocké dans la table 'exported_score_code'.