Lors de la compilation d'un modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). de catégorisation via l'option modelType paramétrée sur CATEGORY, vous avez le contrôle absolu sur le mécanisme de calcul du score de pertinence. Le paramètre scoringAlgorithm propose deux options métier :
- L'algorithme FREQUENCY : Cette approche se base sur le décompte brut des occurrences des règles validées. Elle est redoutable d'efficacité pour des documents courts ou très standardisés.
- L'algorithme WEIGHTED : Cette méthode pondérée est souvent privilégiée par les architectes de solutions Data sur des corpus hétérogènes. Elle permet de valoriser l'impact de certaines règles syntaxiques spécifiques, offrant ainsi une classification textuelle beaucoup plus fine et nuancée face à l'ambiguïté inhérente au langage naturel.