La qualité prédictive d'un modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). CRF repose sur deux paramètres fondamentaux. Le paramètre target doit obligatoirement pointer vers la variable cible de votre table d'entrée contenant la vérité terrain (les étiquettes réelles). En parallèle, le paramètre template sert de gabarit textuel pour construire l'espace des caractéristiques. Il définit exactement comment l'algorithme doit analyser le voisinage de chaque mot (unigrammes, bigrammes, décalage positionnel). Une définition précise de ce gabarit est le secret pour capturer efficacement la sémantique locale du texte.
Target et Template : comment paramétrer correctement le contexte pour l'algorithme d'apprentissage ?
Configuration Avancée du CRF sur Viya 4
Exemples pour l'action crfTrain
Entraînement CRF basique
Découvrez cet exemple pour l'action CAS crfTrain : il initialise un apprentissage supervisé par champs aléatoires conditionnels via un fenêtrage local ([-1,0] à [1,0]) pour extraire les features.
Entraînement CRF avec Optimisation Avancée
Découvrez cet exemple pour l'action CAS crfTrain : il optimise un modèle CRF via LBFGS avec régularisation L2 et contrôle de convergence (fConv), assurant une extraction d'entités stable et performante.