Pourquoi le brassage et l'échantillonnage des données sont-ils essentiels pour la performance dans SAS Viya ?

L'efficacité de l'analyse distribuée repose sur une répartition équilibrée de la charge de travail entre les nœuds du clusterEnsemble de nœuds (machines) interconnectés, gérés par Kubernetes, qui collaborent pour exécuter les microservices et le moteur CAS de SAS Viya, assurant haute disponibilité et passage à l'échelle.. Le paramètre shuffleData, activé par défaut, assure que les données sont redistribuées de manière optimale entre les worker nodes avant le traitement.

De plus, le paramètre bodySampleFrac permet de réduire la taille de l'échantillon traité pour la partie centrale de la distribution (le corps), tout en conservant l'intégralité des données pour la queue. Cette stratégie d'échantillonnage intelligent accélère considérablement le temps d'exécution sans compromettre la qualité des estimations sur les risques majeurs, ce qui est l'essence même des plans de données haute performance de SAS Viya.

Exemples pour l'action ecm

Calcul basique de la perte totale

Cet exemple combine une simulation de copule avec deux distributions marginales pour obtenir la perte agrégée.

Analyse complète avec Queue de Distribution et TVaR

Utilisation avancée incluant le calcul de la Tail Value-at-Risk (TVaR) à 95% et 99%, ainsi que des statistiques de résumé pour les décisions de capital.

Vous pourriez aussi aimer...