textRuleDevelop

exportTextModel

##set_textruledevelop

Description

L'action exportTextModel est l'outil indispensable pour les experts du texte souhaitant déployer leurs modèles de règles linguistiques. Son rôle ? Transformer une table de règles (concepts, catégories ou sentiments) en un objet binaire ultra-performant nommé 'Analytic StoreFormat binaire (ASTORE) sauvegardant l'état d'un modèle de Machine Learning entraîné dans SAS Viya pour permettre son déploiement et son exécution rapide sur de nouvelles données.' (ou AstoreFichier binaire compact contenant la logique d'un modèle entraîné (analytique de score). Il permet de déployer et d'exécuter des modèles complexes de manière portable et ultra-rapide dans SAS Viya.). C'est un peu comme transformer votre code source en un exécutable prêt à l'emploi : cela permet de transporter et d'exécuter vos modèles de traitement automatique du langage naturel (NLPTraitement automatique du langage naturel visant à permettre aux machines de comprendre, d'interpréter et de générer du texte ou de la parole de manière cohérente et structurée.) dans différents environnements (scoringProcessus d'application d'un modèle prédictif à de nouvelles données pour calculer une probabilité ou un score, permettant ainsi d'automatiser la prise de décision en temps réel sur SAS Viya. batch, temps réel ou streamingTraitement continu et en temps réel de flux de données massifs (via SAS ESP) permettant d'analyser, de transformer et de réagir instantanément aux événements dès leur capture.) sans avoir à recompiler les règles à chaque fois. Pratique, non ?

Syntaxe Officielle
textRuleDevelop.exportTextModel /
build={modelType="CATEGORY" | "CONCEPT" | "SENTIMENT", modelType-specific-parameters},
casOut={casouttable},
table={castable},
language="string",
text="string",
fixedCharLength=integer;

Paramètres Clés

Nom du paramètre Description
build Définit le type de modèle à exporter (CATEGORY, CONCEPT ou SENTIMENT) ainsi que les options de configuration spécifiques à ce type.
casOut Spécifie la table de sortie qui contiendra le modèle Astore généré. C'est ce fichier qui sera utilisé pour le scoring futur.
table Désigne la table d'entrée contenant le modèle ou les règles (ex: table compilée de concepts).
language Indique la langue utilisée pour le traitement linguistique (ex: 'FRENCH', 'ENGLISH'). Par défaut, c'est l'anglais qui gagne.
text Nom de la variable qui contiendra le texte à analyser lors de l'utilisation future de l'Astore pour le scoring. Valeur par défaut : '_text_'.
fixedCharLength Définit la longueur maximale des variables de caractères générées lors du scoring (par défaut 1024).
modelType-specific-parameters Paramètres comme matchType (pour les concepts) ou scoringAlgorithm (pour les catégories) qui affinent le comportement du modèle.

Préparation des données

Préparation des règles de concepts

Création d'une table simple contenant des définitions de concepts pour illustrer l'exportation.

1PROC CAS;
2 TABLE.loadTable / path="concepts_data.sashdat", casout={name="concept_model", replace=true};
3 /* Note: Dans un flux réel, cette table proviendrait d'une action de compilation comme compileConcept */
4RUN;

Exemples d'utilisation

Exportation simple d'un modèle de concepts

Cet exemple transforme une table de concepts en un Astore prêt pour le déploiement.

1PROC CAS;
2 textRuleDevelop.exportTextModel / build={modelType="CONCEPT"}, TABLE={name="concept_model"}, casOut={name="my_concept_astore", replace=true}, language="FRENCH", text="mon_texte";
3RUN;
Résultat Attendu :
Une nouvelle table CAS nommée 'my_concept_astore' est créée, contenant le modèle binaire.
Exportation avancée d'un modèle de catégories avec pondération

Ici, on exporte un modèle de catégories en spécifiant un algorithme de scoring pondéré et un format de sortie spécifique.

1PROC CAS;
2 textRuleDevelop.exportTextModel /
3 build={modelType="CATEGORY", scoringAlgorithm="WEIGHTED", outputTableMode="DEFAULT", docType="TEXT"},
4 TABLE={name="category_rules"},
5 casOut={name="cat_weighted_astore", replace=true, promote=true},
6 language="FRENCH",
7 text="description_client",
8 fixedCharLength=2048;
9RUN;
Résultat Attendu :
Génère un Astore optimisé pour les catégories pondérées, promu en session globale, avec des sorties texte plus longues pour les résultats.
Exportation de modèle de Sentiment avec DataGrid

Utilisation du mode DATAGRID pour compacter les résultats du futur scoring dans une seule colonne par document.

1PROC CAS;
2 textRuleDevelop.exportTextModel / build={modelType="SENTIMENT", outputTableMode="DATAGRID"}, TABLE={name="sentiment_rules"}, casOut={name="sentiment_astore", replace=true}, language="FRENCH", text="commentaires";
3RUN;
Résultat Attendu :
Crée un Astore de sentiment qui, lors du scoring, regroupera les scores et les correspondances dans une structure DataGrid.