forestCode
Description
L'action forestCode de l'ensemble d'actions https://go.documentation.sas.com/doc/en/pgmsascdc/v_069/casanpg/cas-decisiontree-TblOfActions.htm permet de générer du code SAS DATA stepBloc de programmation SAS itératif utilisé pour lire, transformer et manipuler des données ligne par ligne afin de créer des tables de sortie personnalisées et calculer de nouvelles variables. à partir d'un modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). de forêt aléatoireAlgorithme d'apprentissage supervisé combinant plusieurs arbres de décision indépendants pour améliorer la précision et réduire le surapprentissage par agrégation de leurs prédictions. (Random Forest) préalablement entraîné. C'est l'outil idéal pour extraire l'intelligence de votre modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). et la rendre portable : vous pouvez ainsi transformer une forêt complexe en un script exécutable partout où SAS tourne, sans forcément avoir besoin de CAS pour le scoringProcessus d'application d'un modèle prédictif à de nouvelles données pour calculer une probabilité ou un score, permettant ainsi d'automatiser la prise de décision en temps réel sur SAS Viya. final. C'est un peu comme si vous transformiez une jungle sauvage en une liste d'instructions de jardinage bien ordonnée !
Paramètres Clés
| Nom du paramètre | Description |
|---|---|
| code | Demande la génération du code de scoring. On peut y spécifier des options de formatage (indentation, commentaires) ou une table de sortie via casOut. |
| encodeName | Si activé, modifie le préfixe des probabilités prédites (P_ au lieu de _DT_P_) dans le code généré. |
| modelTable | Pointe vers la table CAS contenant le modèle de forêt entraîné (générée par forestTrain). |
| nTree | Nombre d'arbres à inclure dans le code généré. Par défaut, tous les arbres sont utilisés. |
| vote | Stratégie de vote pour la classification : 'MAJORITY' pour le vote majoritaire ou 'PROB' pour la probabilité moyenne. |
Préparation des données
Préparation du modèle de Forêt
Avant de générer le code, nous devons entraîner un modèle de forêt sur les données IRIS.
| 1 | PROC CAS; |
| 2 | LOADACTIONSET "decisionTree"; |
| 3 | TABLE.loadTable / path="iris.sashdat", caslib="casuser", casout={name="iris", replace=true}; |
| 4 | decisionTree.forestTrain / |
| 5 | TABLE={name="iris"}, |
| 6 | target="Species", |
| 7 | inputs={"SepalLength", "SepalWidth", "PetalLength", "PetalWidth"}, |
| 8 | casOut={name="my_forest_model", replace=true}; |
| 9 | RUN; |
Exemples d'utilisation
Génération simple de code
Génère et affiche le code DATA step pour le modèle entraîné précédemment.
| 1 | PROC CAS; decisionTree.forestCode / modelTable={name="my_forest_model"}; RUN; |
Résultat Attendu :
Exportation du code vers une table avec noms simplifiés
Dans cet exemple, nous générons le code en utilisant des noms de probabilités simplifiés et nous sauvegardons le résultat dans une table CAS pour un usage ultérieur.
| 1 | PROC CAS; decisionTree.forestCode / modelTable={name="my_forest_model"}, encodeName=true, vote="PROB", code={casOut={name="exported_score_code", replace=true}, comment=true, indentSize=4}; RUN; |