Performances extrêmes : pourquoi le paramètre algorithm2 est-il vital pour vos traitements massifs ?

Pour les environnements distribués disposant de nombreux nœuds de calcul, l'activation de algorithm2 permet d'utiliser une logique de traitement beaucoup plus efficace. Cet algorithme optimise la répartition de la charge de travail lorsque vos données contiennent un nombre très élevé de groupes distincts. Cependant, en tant qu'architecte, notez que son utilisation désactive certaines options de formatage avancées comme divider ou nSubGroupVars pour privilégier la vitesse brute d'exécution.

Exemples pour l'action groupByInfo

Calcul basique des identifiants et fréquences de groupes

Dans cet exemple, on regroupe simplement les véhicules par origine (Origin). L'action générera toutes les colonnes de diagnostic par défaut.

Utilisation avancée avec Algorithm2, filtres et nommage sur-mesure

Passons aux choses sérieuses ! On combine plusieurs colonnes de regroupement, on active l'algorithme de haute performance, et on personnalise les noms des colonnes de métadonnées pour que la table de sortie soit immédiatement présentable.