Support relatif ou support absolu : quelle stratégie adopter pour filtrer les motifs pertinents ?

Arbitrage entre Fréquence Relative et Volume Absolu

Le filtrage de l'importance statistique d'un motif est le principe fondamental du Sequence Mining. L'action propose deux métriques pour définir ce seuil minimal d'occurrence :

  • Le paramètre support : Il requiert un ratio en valeur flottante (type double) compris entre 0 et 1. Il représente la fréquence ou le pourcentage minimum de clients devant présenter le motif pour que celui-ci soit conservé.
  • Le paramètre supportCnt : Il définit un seuil brut et absolu, exprimé sous la forme d'un nombre entier de 64 bits. Il indique le nombre exact d'occurrences requises dans la table de données.

Les séquences respectant ces règles de support seront enregistrées dans la table de résultats spécifiée dans la structure casout de la requête.

Exemples pour l'action cspade

Analyse de séquences basique

Identification des motifs de consommation apparaissant dans au moins 50% des parcours clients.

Analyse avec contraintes temporelles et de longueur

Extraction de séquences complexes : on limite la longueur à 3 éléments, avec un écart de temps maximum de 2 unités entre les étapes.