Comment gerer finement les tables de sortie generees par l'operation de comparaison et analyser les doublons ?

Pilotage des sorties et diagnostic des doublons

L'architecture de l'action genere jusqu'a trois tables distinctes : casOut (table de base), casOut2 (table de comparaison), et freqOut (resume des frequences). Le pilotage strategique s'effectue via le parametre includeDuplicates. Par defaut, le comportement limite la sortie aux groupes exclusifs, mais specifier une configuration technique telle que s.simple.compare(table="base", table2="comp", includeDuplicates=["CASOUT", "CASOUT2"]) force le systeme a injecter la totalite des enregistrements correspondants, garantissant une tracabilite ligne par ligne pour l'investigation des ecarts.

Exemples pour l'action compare

Comparaison basique de deux tables

On compare les groupes basés sur la colonne 'produit' entre les deux tables.

Comparaison avancée avec tables de sortie et colonnes générées

Cet exemple génère une table de fréquences et inclut toutes les colonnes de diagnostic (_Frequency_, _GroupID_, etc.) pour voir exactement où les données divergent.

Vous pourriez aussi aimer...