Oui, et c'est une pratique recommandée pour la gestion des ressources au sein de l'environnement SAS Viya. Le paramètre fields permet de spécifier précisément une liste de colonnes (champs) sur lesquelles l'analyse de fréquence des termes doit être effectuée. Au lieu de mobiliser de la puissance de calcul sur des colonnes non pertinentes comme des identifiants techniques ou des dates, vous pouvez concentrer l'action sur les champs riches en contenu comme les titres, les descriptions ou les corps de texte. Cette approche sélective réduit la charge de travail sur les nœuds du serveur CAS et produit une table de sortie casOut beaucoup plus propre et exploitable pour le métier.
Pouvez-vous limiter l'indexation à des colonnes spécifiques pour optimiser les performances ?
Optimisation de l'indexation par sélection granulaire
Exemples pour l'action buildTermIndex
Extraction de base des termes
Ce code crée une table simple contenant tous les termes trouvés dans la table d'entrée.
Extraction avancée avec segmentation en Français
Ici, on spécifie que le texte est en français, on active la segmentation et on cible une colonne précise.