La réussite d'un projet avec brTrain repose sur une configuration rigoureuse de trois piliers techniques :
- La table de données (table) : Elle doit contenir les identifiants de documents et de termes préalablement traités par un processus de text mining.
- Le dictionnaire de termes (termInfo) : Essentiel pour faire correspondre les identifiants techniques aux labels textuels lisibles par l'homme via le paramètre label.
- L information documentaire (docInfo) : C'est ici que l'on définit les variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. cibles (targets) et les événements d'intérêt (events) qui guideront l'apprentissage supervisé de l'action.