Valeurs manquantes en analytique : comment éviter de perdre de précieuses informations lors de la préparation de données ?

Valoriser le signal des données manquantes avec SAS Viya

Dans les ensembles de données d'entreprise, les valeurs manquantes contiennent très souvent un signal prédictif fort, comme l'omission volontaire d'une information par un client. L'action gère cette réalité métier intelligemment grâce au paramètre binMissing.

Lorsqu'il est défini sur vrai, les valeurs manquantes ne sont pas purgées de votre plan de données, mais sont automatiquement isolées et assignées à une classe dédiée portant l'identifiant zéro. Cela permet à vos algorithmes d'apprentissage automatique de capturer spécifiquement le comportement lié à cette absence d'information, tout en maintenant le volume de votre table d'entrée intact pour un entraînement optimal.

Illustration de la réponse

Exemples pour l'action binning

Binning par défaut (Bucket)

Découvrez cet exemple pour l'action CAS binning qui discrétise 'MSRP' en 5 intervalles égaux (Bucket). Il génère des bins calculés in-memory, optimisant la linéarité pour vos futurs modèles SAS Viya.

Transformation complexe avec Quantiles et génération de code

Cet exemple illustre le binning par quantiles in-memory : il équilibre les effectifs, isole les manquants et exporte la logique en DATA Step pour automatiser vos pipelines de scoring SAS Viya.