Quels sont les composants clés pour configurer un pipeline d extraction de règles réussi ?

Architecture de l'Action brTrain

La réussite d'un projet avec brTrain repose sur une configuration rigoureuse de trois piliers techniques :

  • La table de données (table) : Elle doit contenir les identifiants de documents et de termes préalablement traités par un processus de text mining.
  • Le dictionnaire de termes (termInfo) : Essentiel pour faire correspondre les identifiants techniques aux labels textuels lisibles par l'homme via le paramètre label.
  • L information documentaire (docInfo) : C'est ici que l'on définit les variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. cibles (targets) et les événements d'intérêt (events) qui guideront l'apprentissage supervisé de l'action.

Exemples pour l'action brTrain

Extraction de règles de base

Un exemple minimaliste pour extraire des règles binaires à partir des tables générées précédemment.

Entraînement avec réglages de précision et multiclasse

Ici, on ajuste les paramètres de score G et on demande explicitement un traitement binaire sur une cible spécifique pour être plus sélectif.