optBinning
Description
L'action riskmd.optBinning est l'outil ultime pour transformer vos variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. continues ou nominales indisciplinées en groupes (bins) optimisés et statistiquement significatifs. Elle est particulièrement prisée en modélisationProcessus de création de structures mathématiques ou statistiques sur SAS Viya pour prédire des comportements, classifier des données ou identifier des tendances à partir de jeux de données CAS. du risque de crédit pour maximiser le pouvoir prédictif par rapport à une cible binaire (souvent le défaut de paiement). C'est un peu comme si vous demandiez à un expert en rangement Marie Kondo de s'occuper de vos données : tout finit par être parfaitement classé là où ça fait le plus de sens mathématique.
Paramètres Clés
Préparation des données
Préparation des données de crédit et des paramètres
Nous créons une table de données fictive simulant des demandes de prêt, ainsi qu'une table de paramètres indiquant que nous voulons biner la variable 'Age' par rapport à la cible 'Default'.
| 1 | DATA casuser.credit_data; |
| 2 | INPUT ID Age Income Default; |
| 3 | DATALINES; |
| 4 | 1 25 20000 1 |
| 5 | 2 30 45000 0 |
| 6 | 3 45 60000 0 |
| 7 | 4 22 15000 1 |
| 8 | 5 35 50000 0 |
| 9 | 6 50 80000 0 |
| 10 | 7 19 12000 1 |
| 11 | 8 28 35000 0 |
| 12 | 9 40 55000 0 |
| 13 | 10 60 90000 0 |
| 14 | ; |
| 15 | RUN; |
| 16 | DATA casuser.bin_params; |
| 17 | LENGTH VarName $32 TargetName $32 VarType $8; |
| 18 | VarName='Age'; TargetName='Default'; VarType='INTERVAL'; OUTPUT; |
| 19 | VarName='Income'; TargetName='Default'; VarType='INTERVAL'; OUTPUT; |
| 20 | RUN; |
Exemples d'utilisation
Binning optimal de base
Exécution de l'action avec les paramètres minimaux pour biner nos variables de crédit.
| 1 | PROC CAS; |
| 2 | riskmd.optBinning / |
| 3 | DATA={name="credit_data", caslib="casuser"} |
| 4 | param={name="bin_params", caslib="casuser"} |
| 5 | OUTPUT={name="bin_out", caslib="casuser", replace=true}; |
| 6 | RUN; |
Résultat Attendu :
Binning complet avec génération de code et sauvegarde du modèle
Cet exemple montre comment biner les données tout en demandant la création d'un fichier de score DATA step et d'un store analytique pour le futur.
| 1 | PROC CAS; |
| 2 | riskmd.optBinning / |
| 3 | DATA={name="credit_data", caslib="casuser"} |
| 4 | param={name="bin_params", caslib="casuser"} |
| 5 | adjustFactor=0.1 |
| 6 | code={casOut={name="score_code", caslib="casuser", replace=true}} |
| 7 | OUTPUT={name="bin_results", caslib="casuser", replace=true} |
| 8 | saveState={name="bin_model", caslib="casuser", replace=true} |
| 9 | STATUS={name="bin_status", caslib="casuser", replace=true} |
| 10 | printLevel=2 |
| 11 | logLevel=2; |
| 12 | RUN; |