L'efficacité de l'analyse distribuée repose sur une répartition équilibrée de la charge de travail entre les nœuds du clusterEnsemble de nœuds (machines) interconnectés, gérés par Kubernetes, qui collaborent pour exécuter les microservices et le moteur CAS de SAS Viya, assurant haute disponibilité et passage à l'échelle.. Le paramètre shuffleData, activé par défaut, assure que les données sont redistribuées de manière optimale entre les worker nodes avant le traitement.
De plus, le paramètre bodySampleFrac permet de réduire la taille de l'échantillon traité pour la partie centrale de la distribution (le corps), tout en conservant l'intégralité des données pour la queue. Cette stratégie d'échantillonnage intelligent accélère considérablement le temps d'exécution sans compromettre la qualité des estimations sur les risques majeurs, ce qui est l'essence même des plans de données haute performance de SAS Viya.

