Comment choisir stratégiquement entre les méthodes de binning supervisées et non supervisées pour maximiser votre pouvoir prédictif ?

Arbitrage Stratégique du Binning sur Viya 4

La sélection dépend entièrement du fait que vous souhaitiez lier ou non la création de vos segments à une variable cible (votre prédiction). Ce comportement est piloté par le paramètre method.

Si vous effectuez une simple exploration de données ou une réduction de dimensionnalité classique, les approches non supervisées sont recommandées. Vous utiliserez par exemple BUCKET pour créer des intervalles de largeur égale, ou QUANTILE pour des intervalles à fréquence égale.

En revanche, pour maximiser l'Information Value dans un modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). prédictif, l'approche supervisée est redoutable. En définissant une variable cible dans le paramètre targets, vous débloquez des algorithmes avancés tels que le WOE (Weight of EvidenceLe Weight of Evidence (WoE) mesure la capacité d'une modalité à distinguer les événements des non-événements, facilitant la transformation de variables avant une régression logistique.), le MDLP (Minimum Description Length Principle), ou encore la segmentation par arbre de décision via DTREE. Ces méthodes garantissent que chaque nouvelle classe créée discrimine au mieux l'événement que vous cherchez à prédire.

Exemples pour l'action discretize

Discrétisation basique en BUCKET (largeur égale)

On découpe la variable taille en 3 catégories de largeur identique. Une approche simple, efficace et sans prise de tête !

Discrétisation Quantile avec renommage personnalisé et détails des bacs

Ici on utilise la méthode QUANTILE (pour avoir autant d'individus dans chaque bac). On personnalise le préfixe de la variable de sortie et on sauvegarde les détails de coupe dans une table séparée pour pouvoir les réutiliser.