featureMachine
Description
L'action featureMachineAction automatisée de SAS Viya (proc CAS) qui génère, transforme et sélectionne intelligemment les variables les plus prédictives pour améliorer rapidement la qualité des modèles analytiques. est le couteau suisse automatisé pour la préparation de vos données (Feature EngineeringProcessus de transformation, création ou sélection de variables brutes en indicateurs prédictifs pertinents pour optimiser la performance et la précision des modèles de machine learning.). Elle analyse vos variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. et décide intelligemment lesquelles transformer, lesquelles supprimer (parce qu'elles sont inutiles ou trop bavardes) et lesquelles combiner pour créer de nouvelles pépites d'information . En gros, c'est comme avoir un petit data scientistExpert exploitant SAS Viya pour extraire des connaissances via le Machine Learning et les statistiques, afin de résoudre des problèmes métier complexes à partir de données massives. stagiaire qui ne dort jamais et qui prépare votre café... euh, vos données.
Paramètres Clés
Préparation des données
Création d'un jeu de données pour le Feature Engineering
On crée une petite table 'mes_donnees' avec des variables numériques, catégorielles et quelques valeurs manquantes pour faire travailler la machine.
| 1 | DATA casuser.mes_donnees; |
| 2 | INPUT id age revenu $ dette cible; |
| 3 | DATALINES; |
| 4 | 1 25 bas 100 0 |
| 5 | 2 . moyen 500 1 |
| 6 | 3 45 haut . 0 |
| 7 | 4 30 bas 200 1 |
| 8 | 5 50 . 800 0 |
| 9 | 6 22 moyen 150 1 |
| 10 | 7 35 haut 400 0 |
| 11 | 8 . bas 50 1 |
| 12 | ; |
| 13 | RUN; |
Exemples d'utilisation
Feature Engineering automatique minimaliste
Une exécution simple pour voir ce que l'action propose par défaut sur notre table.
| 1 | PROC CAS; |
| 2 | dataSciencePilot.featureMachine / |
| 3 | TABLE="mes_donnees", |
| 4 | target="cible", |
| 5 | featureOut="ma_liste_features", |
| 6 | transformationOut="mon_pipeline"; |
| 7 | RUN; |
| 8 | QUIT; |
Résultat Attendu :
Feature Engineering agressif avec interactions et sauvegarde du modèle
Ici, on active la détection d'interactions entre variables et on sauvegarde le résultat pour un déploiement futur via un astore.
| 1 | PROC CAS; |
| 2 | dataSciencePilot.featureMachine / |
| 3 | TABLE="mes_donnees", |
| 4 | target="cible", |
| 5 | featureOut={name="features_finales", replace=True}, |
| 6 | transformationOut={name="transfo_finales", replace=True}, |
| 7 | saveState={name="modele_fe", replace=True}, |
| 8 | transformationPolicy={interaction=True, polynomial=True, missing=True}, |
| 9 | rankPolicy={topKSave=2, intervalStat="MI"}; |
| 10 | RUN; |
| 11 | QUIT; |