Comment traiter intelligemment vos données manquantes lors d'une phase de préparation de données ?

L'action fastknn ne se contente pas de chercher des voisins, elle peut également agir comme un outil de nettoyage de données avancé. En activant le paramètre impute, l'action remplace automatiquement les valeurs manquantes dans la table query en utilisant les informations provenant des k voisins les plus proches identifiés dans la table de référence. Cette méthode d'imputation par les plus proches voisins est statistiquement plus robuste qu'une simple moyenne, car elle préserve les corrélations locales entre les variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage.. La table résultante est stockée dans outImpute pour être utilisée immédiatement dans vos pipelines de Machine LearningBranche de l'IA utilisant des algorithmes pour apprendre des modèles à partir de données. Il permet d'automatiser des prédictions ou des décisions sans programmation explicite de chaque règle..

Exemples pour l'action fastknn

Recherche exacte de base

Trouver les 3 voisins les plus proches de manière exacte pour chaque point de la table 'requete' en utilisant les points de 'reference'.

Recherche approximative haute performance avec distances

Utilise la méthode approximative (HNSW) pour aller plus vite que la lumière, calcule les distances cosinus, et sauvegarde les distances dans une table séparée.

Imputation de valeurs manquantes par k-NN

Cette option permet de nettoyer vos données en remplaçant les trous par la 'sagesse du voisinage'.