Par défaut, l'action génère des valeurs brutes basées sur la distribution originale. Cependant, en activant generateLevels, vous demandez à l'action de générer des niveaux catégoriels. C'est particulièrement utile pour les variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. nominales où l'ordre n'a pas d'importance. Combiné avec rareThresholdPercent, cela permet de regrouper les niveaux peu fréquents et de créer des sondes qui reflètent non seulement les catégories majeures, mais aussi la structure de la longue traîne des données, optimisant ainsi le traitement des variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. à forte cardinalitéLa cardinalité représente le nombre de valeurs distinctes contenues dans une colonne. Une cardinalité élevée indique une grande diversité de données, influençant le choix des modèles dans CAS..
Quelle est la différence entre générer des valeurs brutes et générer des niveaux avec generateLevels ?
Exemples pour l'action generateShadowFeatures
Génération basique d'ombres
Génère 5 ombres par défaut pour les variables x1 et x2.
Génération contrôlée avec sauvegarde du modèle
On limite à 2 ombres, on fixe la graine aléatoire pour la reproductibilité et on sauvegarde l'état pour une utilisation future (scoring).