La détection de communautés repose sur des heuristiques qui, dans un environnement de traitement massivement parallèle, peuvent engendrer des variations de résultats dues à l'ordre stochastique de traitement des données par les différents threadsUnités d'exécution parallèles au sein d'un processus CAS. Ils permettent de distribuer simultanément les calculs sur plusieurs cœurs CPU pour accélérer le traitement des données dans SAS Viya.. Pour garantir la gouvernance et l'auditabilité de vos modèles en production, vous devez impérativement activer le paramètre deterministic. Lorsqu'il est défini sur vrai, ce réglage force le moteur analytique à produire un résultat final strictement identique à chaque exécution, pourvu que l'infrastructure matérielle et les hyperparamètres comme nThreads restent inchangés.
Comment assurer la reproductibilité stricte de mes résultats de clustering de graphe en production ?
Maîtrise du déterminisme en environnement distribué
Exemples pour l'action community
Détection de base (Louvain)
Utilisation de l'algorithme par défaut pour identifier les groupes naturels.
Multi-résolution et Découpage Récursif
On force l'algorithme à créer des communautés de 2 personnes maximum en utilisant une approche récursive et une résolution spécifique.

