Comment choisir stratégiquement entre les méthodes de binning supervisées et non supervisées pour maximiser votre pouvoir prédictif ?

Question

Arbitrage Stratégique du Binning sur Viya 4

Nicolas Housset · Accepted Answer

La sélection dépend entièrement du fait que vous souhaitiez lier ou non la création de vos segments à une variable cible (votre prédiction). Ce comportement est piloté par le paramètre method.

Si vous effectuez une simple exploration de données ou une réduction de dimensionnalité classique, les approches non supervisées sont recommandées. Vous utiliserez par exemple BUCKET pour créer des intervalles de largeur égale, ou QUANTILE pour des intervalles à fréquence égale.

En revanche, pour maximiser l'Information Value dans un modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). prédictif, l'approche supervisée est redoutable. En définissant une variable cible dans le paramètre targets, vous débloquez des algorithmes avancés tels que le WOE (Weight of EvidenceLe Weight of Evidence (WoE) mesure la capacité d'une modalité à distinguer les événements des non-événements, facilitant la transformation de variables avant une régression logistique.), le MDLP (Minimum Description Length Principle), ou encore la segmentation par arbre de décision via DTREE. Ces méthodes garantissent que chaque nouvelle classe créée discrimine au mieux l'événement que vous cherchez à prédire.

Comment choisir stratégiquement entre les méthodes de binning supervisées et non supervisées pour maximiser votre pouvoir prédictif ?

Exemples pour l'action discretize

Discrétisation basique en BUCKET (largeur égale)

Discrétisation Quantile avec renommage personnalisé et détails des bacs

Conseil de l'Expert

Action CAS associée

À lire aussi...