dataSegment

Pourquoi l'action dataSegment est-elle désormais obsolète et comment moderniser vos pipelines analytiques ?

L'action dataSegment de l'ensemble smartData a été officiellement dépréciée à partir de la release 2026.02 de SAS Viya. Afin de pérenniser vos environnements de production et bénéficier des dernières avancées algorithmiques sur vos serveurs CAS Cloud Analytic ServicesMoteur d'exécution in-memory de SAS Viya. Il assure le traitement massivement parallèle (MPP) et distribué des données pour optimiser les performances analytiques et le passage à l'échelle., vous devez repenser votre chaîne de traitement. La documentation recommande formellement de remplacer cette action monolithique par une approche modulaire. Vous devez désormais utiliser l'action profileText pour la phase d'ingestion textuelle, puis basculer sur l'action kClus pour l'opération de clusteringLe clustering est une technique d'apprentissage non supervisé regroupant des données similaires en segments homogènes afin d'identifier des structures cachées sans étiquettes préalables. mathématique. Le déploiement d'un workflow tel que execution sequentielle de profileText puis kClus sur la table en memoire représente la nouvelle architecture de référence, maximisant ainsi l'élasticitéL'élasticité est la capacité de SAS Viya à ajuster dynamiquement les ressources de calcul (nœuds CAS) selon la charge de travail, optimisant ainsi les performances et les coûts d'infrastructure. de vos plans de données et l'approche microservicesLes microservices sont une approche d'architecture logicielle où une application est décomposée en une collection de petits services indépendants, spécialisés et communicant entre eux via des APIs légères. Contrairement aux architectures "monolithiques" anciennes, chaque microservice remplit une fonction unique (ex: gestion du catalogue, authentification, moteur de calcul).

Dans SAS Viya 4, cette architecture est native. Elle permet à la plateforme de s'exécuter sur Kubernetes, offrant une flexibilité totale : chaque composant de SAS peut être mis à jour, redémarré ou mis à l'échelle (scaling) individuellement sans affecter le reste du système..

Exemples pour l'action dataSegment

Clustering textuel de base

Utilisation simple et directe de dataSegment pour classer automatiquement nos 4 avis clients en 2 clusters sémantiques. Remarquez que la configuration textParse est soigneusement ajustée pour la langue française.

Segmentation experte avec filtrage par dictionnaire personnalisé et paramétrage algorithmique

Cette approche 'overkill' pour seulement quatre malheureuses lignes de texte illustre parfaitement les capacités avancées du paramètre 'keepWords', réduisant drastiquement le bruit du texte. On y impose aussi un maximum d'itérations, une convergence stricte et une graine aléatoire fixe.