Quelles sont les options de correspondance pour l'extraction de concepts et leur impact ?

Stratégie de Correspondance : Le Paramètre matchType

Le paramètre matchType spécifie le type de correspondance d'entrée et peut prendre les valeurs "ALL", "BEST", ou "LONGEST". La valeur par défaut est ALL.

Schéma : Quelles sont les options de correspondance pour l'extraction de concepts et leur impact ?

Exemple de Code Additionnel

1<pre>/* CASL Script : Gestion des Chevauchements avec matchType
2(c) Nicolas Housset 2026 */
3PROC CAS;
4/* Chargement de l'action set d'analyse textuelle */
5LOADACTIONSET "textRuleScore";
6/* Application du modèle avec la stratégie de correspondance "La plus longue" */
7textRuleScore.applyConcept /
8TABLE={
9name="corpus_bancaire",
10caslib="Public"
11}
12model={
13name="modele_entites_financieres",
14caslib="Public"
15}
16docId="document_id"
17text="contenu"
18 casOut={
19 name="concepts_extraits",
20 caslib="casuser",
21 replace=true
22 }
23 /* Paramètre stratégique : on ne garde que l'entité la plus longue
24 pour éviter le multi-comptage sur les mots imbriqués */
25 matchType="LONGEST";
26PRINT "Exécution terminée. Les concepts ont été extraits sans chevauchement (LONGEST).";
27RUN;
28QUIT;</pre>

Exemples pour l'action applyConcept

Application du modèle de concept de base
Schéma conceptuel de l'exemple : Application du modèle de concept de base

Cet exemple illustre l'extraction d'entités via l'action applyConcept. Sans paramètre model, le moteur NLP déploie son modèle LISI natif pour isoler types d'entités et faits structurés.

Extraction avancée avec filtrage de concepts et optimisation mémoire
Schéma conceptuel de l'exemple : Extraction avancée avec filtrage de concepts et optimisation mémoire

Cet exemple optimise l'action applyConcept : segmentation par chunks de 16 Ko, filtrage sélectif via dropConcepts et traçabilité des règles avec ruleMatchOut pour un scoring haute précision.