Quel est le secret pour contrôler la finesse des résultats via le paramètre npc ?

Dans le bloc de paramètres output, le sous-paramètre npc (Number of Principal Components) joue un rôle déterminant sur la performance et la précision. Bien que le modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). astoreFichier binaire compact contenant la logique d'un modèle entraîné (analytique de score). Il permet de déployer et d'exécuter des modèles complexes de manière portable et ultra-rapide dans SAS Viya. puisse contenir un grand nombre de composantes, npc permet de limiter le nombre de scores calculés et enregistrés dans la table de sortie casout. Par défaut, ce paramètre est fixé à 4. Pour un analyste, ajuster cette valeur permet de trouver le point d'équilibre optimal entre la compression des données et la préservation de la varianceMesure statistique de la dispersion des données indiquant l'écart carré moyen par rapport à la moyenne. Une variance élevée traduit une grande hétérogénéité des observations autour du centre.. Une valeur trop faible pourrait omettre des micro-variations critiques, tandis qu'une valeur trop élevée pourrait inclure du bruit statistique inutile dans vos tables de données finales.

Exemples pour l'action fPcaScore

Scoring de base

Application directe du modèle sauvegardé sur de nouvelles données pour obtenir les scores par défaut.

Scoring avancé avec sélection de composantes et IDs

Dans cet exemple, nous précisons le nombre de composantes à 2 et nous nous assurons que l'identifiant 'id' est bien conservé dans la sortie.