Quelles tables de sortie l'action applyCategory peut-elle générer pour une analyse approfondie ?

Architecture des tables de sortie applyCategory

Catégorisation Analyse linguistique Extraction données Traitement texte Optimisation tables

L'action applyCategory peut générer plusieurs tables de sortie pour détailler les résultats :

casOut : Spécifie le nom de la table de données de sortie des catégories, contenant les résultats de la catégorisation.
matchOut : Crée une table des termes correspondants qui détaille chaque correspondance de règle par ligne.
groupedMatchOut : Produit une table des termes correspondants regroupés par catégorie pour chaque document, offrant une vue consolidée des correspondances. Les informations sont les mêmes que matchOut mais dans un format différent, avec un délimiteur (matchDelimiter) qui est par défaut "|".
modelOut : Spécifie le nom de la table de sortie du modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). de catégories.

Schéma : Quelles tables de sortie l'action applyCategory peut-elle générer pour une analyse approfondie ?

Exemple de Code Additionnel

1	<pre>/* CASL Script : Analyse Granulaire avec applyCategory
2	(c) Nicolas Housset 2026 */
3	PROC CAS;
4	textMining.applyCategory /
5	TABLE={name="REVIEWS_DATA", caslib="Public"}
6	model={name="SENTIMENT_MODEL", caslib="Models"}
7	text="review_text"
8	docId="review_id"
9	/* Sortie standard : Résultats par document */
10	casOut={name="CAT_RESULTS", caslib="Casuser", replace=true}
11	/* Sortie détaillée : Chaque occurrence de règle /
12	matchOut={name="CAT_MATCHES", caslib="Casuser", replace=true}
13	/* Sortie groupée : Synthèse des termes par catégorie */
14	groupedMatchOut={name="CAT_GROUPED", caslib="Casuser", replace=true};
15	QUIT;</pre>

Exemples pour l'action applyCategory

Catégorisation basique de documents

Gemini said
Cet exemple automatise l'extraction de concepts via l'action applyCategory. Il projette un modèle de règles linguistiques sur un corpus CAS pour mapper chaque docId à ses thématiques cibles.

Catégorisation détaillée avec extraction des correspondances (matches)

Cet exemple déploie un scoring pondéré pour isoler les déclencheurs textuels. Il génère une traçabilité granulaire via matchOut et groupedMatchOut afin d'auditer les preuves de classification.

Conseil de l'Expert

Pour des performances optimales sur de gros volumes de données (plusieurs millions de lignes), évitez de générer systématiquement la table matchOut en environnement de production. Elle peut devenir extrêmement volumineuse car elle génère une ligne par "match". Réservez-la pour la phase de Test & Validation de vos concepts linguistiques (LCO) afin d'ajuster la précision de vos règles de catégorisation.

Cette réponse vous a-t-elle aidé ?