Quelles sont les limites de profondeur et de largeur configurables pour les séquences extraites ?

Optimisation des séquences en environnement distribué

Afin de préserver les performances de calcul dans l'environnement distribué et de se prémunir contre l'explosion combinatoire inhérente aux algorithmes de fouille de données, vous disposez de contraintes dimensionnelles strictes :

  • maxLen : Ce paramètre plafonne la longueur maximale de la séquence extraite (le nombre d'étapes chronologiques). La valeur doit être comprise entre 1 et 1000, avec une valeur par défaut fixée à 10.
  • maxSize : Il contrôle le nombre maximum d'éléments (items) pouvant coexister au sein d'un même événement temporel unique. Il est également plafonné à 1000 et paramétré à 10 par défaut.

Ces paramètres vous permettent d'adapter la granularité de la recherche : un grand nombre d'items simultanés pour l'analyse de tickets de caisse, ou une séquence plus longue pour le suivi de navigation web.

Exemples pour l'action cspade

Analyse de séquences basique

Identification des motifs de consommation apparaissant dans au moins 50% des parcours clients.

Analyse avec contraintes temporelles et de longueur

Extraction de séquences complexes : on limite la longueur à 3 éléments, avec un écart de temps maximum de 2 unités entre les étapes.