Quelle stratégie adopter pour classer automatiquement les meilleurs algorithmes de Machine Learning ?

Le pilotage de la performance se fait via le paramètre objective. Vous pouvez choisir des métriques comme AUCL'AUC (Area Under the Curve) mesure la capacité d'un modèle à distinguer les classes. Comprise entre 0,5 et 1, plus elle est élevée, plus la performance de classification est robuste. pour la classification, F1 pour l'équilibre précision-rappel, ou ASE (Average Square Error) pour la régression. L'action supporte une vaste gamme d'algorithmes via modelTypes, incluant les GRADBOOST (Gradient BoostingMéthode d'apprentissage itérative créant une suite d'arbres de décision. Chaque nouvel arbre corrige les erreurs de prédiction des précédents pour minimiser globalement la fonction de perte.), les FOREST (Forêts Aléatoires) et les NEURALNET (Réseaux de neurones).

Une fois l'exécution terminée, la table définie dans pipelineOut fournit un rapport détaillé. Ce document technique classe chaque pipelineChaîne de flux de données automatisée intégrant prétraitement, sélection de variables et modèles supervisés pour comparer leurs performances et déployer le meilleur candidat dans SAS Viya. testé, permettant de comparer la robustesse des modèles grâce à la validation croisée paramétrée par kFolds.

Exemples pour l'action dsAutoMl

Lancement d'un AutoML basique

Voici comment lancer une exploration automatique de base en spécifiant uniquement les paramètres requis.

AutoML avec optimisation avancée et filtres

On passe à la vitesse supérieure en limitant les types de modèles à des forêts aléatoires et des réseaux de neurones, avec une validation croisée.