Transformation One-Hot : comment éviter le piège de l'explosion des données ?

Le One-Hot Encoding (méthode ONEHOT) est une technique standard pour transformer des catégories en colonnes binaires. Cependant, sur des variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. comme les codes postaux, cela peut générer des milliers de colonnes et saturer les ressources. L'action catTrans permet de mitiger ce risque en utilisant le paramètre distinctCountLimit, qui bloque la transformation si le nombre de modalités dépasse un certain seuil. Elle permet également de générer du code SAS DATA stepBloc de programmation SAS itératif utilisé pour lire, transformer et manipuler des données ligne par ligne afin de créer des tables de sortie personnalisées et calculer de nouvelles variables. via le paramètre code, facilitant ainsi le déploiement du pipeline de transformation dans d'autres environnements ou microservicesLes microservices sont une approche d'architecture logicielle où une application est décomposée en une collection de petits services indépendants, spécialisés et communicant entre eux via des APIs légères. Contrairement aux architectures "monolithiques" anciennes, chaque microservice remplit une fonction unique (ex: gestion du catalogue, authentification, moteur de calcul).

Dans SAS Viya 4, cette architecture est native. Elle permet à la plateforme de s'exécuter sur Kubernetes, offrant une flexibilité totale : chaque composant de SAS peut être mis à jour, redémarré ou mis à l'échelle (scaling) individuellement sans affecter le reste du système.
sans avoir à recalculer les métadonnéesInformations décrivant les données, les utilisateurs et les ressources dans SAS Viya. Elles assurent la traçabilité, la sécurité et la gouvernance au sein de l'architecture distribuée..

Cette réponse vous a-t-elle aidé ?

Vos votes aident à améliorer notre base de connaissances.

Exemples pour l'action catTrans

Nettoyage des niveaux rares

On regroupe les constructeurs (Make) qui apparaissent moins de 5 fois dans la table.

Transformation complète avec WOE et Statistiques

Exemple exhaustif utilisant la méthode WOE, avec gestion des valeurs manquantes, calcul des statistiques d'évaluation et génération du code de scoring.