Comment détecter les observations suspectes grâce aux statistiques d'influence intégrées ?

Au-delà du simple calcul de la valeur prédite, cette action offre des capacités avancées de diagnostic de données. Vous pouvez générer des indicateurs de performance et d'influence critiques tels que :

  • cooksD : Pour mesurer la distance de Cook et identifier les observations qui ont un impact disproportionné sur les estimations du modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting)..
  • dffits : Pour évaluer le changement dans la valeur prédite lorsqu'une observation spécifique est omise.
  • h : Pour calculer l'effet levier (leverage) et repérer les points aberrants dans l'espace des variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. explicatives.

L'utilisation du paramètre allStats permet d'extraire l'intégralité de ces métriques pour un audit complet de la qualité du scoringProcessus d'application d'un modèle prédictif à de nouvelles données pour calculer une probabilité ou un score, permettant ainsi d'automatiser la prise de décision en temps réel sur SAS Viya..

Exemples pour l'action glmScore

Scoring de base

Application simple du modèle stocké sur de nouvelles données pour obtenir la prédiction par défaut.

Scoring avec diagnostics complets et copie de variables

Ici, on ne se contente pas de prédire. On demande les résidus, les erreurs types, les bras de levier (h) et on recopie le modèle du véhicule.