Est-il possible d'analyser des matrices de données creuses ou des variables catégorielles complexes avec cette action ?

Optimisation des Matrices Creuses en CAS

Absolument. Les architectures Data modernes font très souvent face à des jeux de données transactionnels ou textuels hautement dimensionnels avec une majorité de zéros. En activant le paramètre booléen sparseInputs, vous signalez au moteur CAS de traiter les données en entrée comme une matrice creuse, ce qui accélère radicalement les calculs algorithmiques. Dans ce contexte précis, vous devez fournir la cardinalitéLa cardinalité représente le nombre de valeurs distinctes contenues dans une colonne. Une cardinalité élevée indique une grande diversité de données, influençant le choix des modèles dans CAS. via le paramètre inputLevels. Par ailleurs, pour les problématiques complexes de classification multiniveaux, l'action permet de cibler un niveau spécifique de la variable de réponse via le paramètre event, convertissant nativement l'analyse en une approche d'apprentissage de type un-contre-tous.

Exemples pour l'action detectInteractions

Détection basique et aveugle des interactions

On lance l'action avec les paramètres minimaux requis pour chercher des paires de variables fortement corrélées avec la modalité 'Oui' de notre cible.

Analyse ciblée avec ajustement de la métrique et filtrage

Une approche plus professionnelle : on restreint les variables d'entrée via %%inputs%%, on utilise la médiane (%%MEDIAN%%) pour éviter de biaiser le score par des valeurs extrêmes, et on filtre les probabilités de corrélation trop faibles.