L'ingénierie des variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. est souvent l'étape la plus chronophage. L'action technique utilise le paramètre transformationPolicy pour décider quelles opérations appliquer. Elle peut détecter automatiquement le besoin de réduire la cardinalitéLa cardinalité représente le nombre de valeurs distinctes contenues dans une colonne. Une cardinalité élevée indique une grande diversité de données, influençant le choix des modèles dans CAS., de traiter l'asymétrieMesure statistique (skewness) évaluant le manque de symétrie d'une distribution de données dans SAS Viya. Elle indique si les observations se concentrent à gauche ou à droite de la moyenne. (skewness) ou de gérer les valeurs aberrantesObservations s'écartant significativement du reste des données. Elles peuvent résulter d'erreurs de mesure ou de phénomènes rares et influencent fortement les statistiques (moyenne, variance). (outliersValeur atypique s'écartant significativement des autres observations d'un jeu de données. Elle peut signaler une erreur de saisie ou un phénomène rare nécessitant une analyse statistique dédiée.).
Les résultats sont stockés dans deux tables cruciales :
- transformationOut : conserve la logique des transformations appliquées.
- featureOut : contient les pipelines de génération de nouvelles caractéristiques.
transformationPolicy = {interaction=TRUE}, le système peut même découvrir des relations non linéaires complexes entre les variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. que l'œil humain pourrait manquer.