Comment optimiser la précision de vos modèles en maîtrisant le seuil de covariance ?

Le contrôle du bruit et de la redondance est assuré par le paramètre rankThreshold (ou son alias threshold). Ce paramètre définit le seuil de varianceMesure statistique de la dispersion des données indiquant l'écart carré moyen par rapport à la moyenne. Une variance élevée traduit une grande hétérogénéité des observations autour du centre. minimale pour qu'une valeur propre soit considérée comme significative lors de la décomposition de la matrice de covariance. En ajustant ce seuil, l'expert Data ScientistExpert exploitant SAS Viya pour extraire des connaissances via le Machine Learning et les statistiques, afin de résoudre des problèmes métier complexes à partir de données massives. peut filtrer les composantes qui ne représentent que du bruit statistique, se concentrant uniquement sur les signaux robustes. Cela améliore non seulement l'interprétabilité du modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting)., mais réduit également la charge computationnelle en limitant le nombre de composantes principales fonctionnelles générées dans la table de sortie.

Exemples pour l'action fPca

Analyse FPCA élémentaire

Exécution d'une FPCA sur 10 variables d'entrée pour extraire les scores des composantes.

Analyse FPca complète avec sauvegarde du modèle

Analyse avancée incluant le binning, l'export des valeurs/vecteurs propres et la création d'un fichier d'état pour le déploiement.

Vous pourriez aussi aimer...