De quelle manière dnnTrain prend-il en charge la gestion des valeurs manquantes dans les données d'entrée et cible ?

La préparation des plans de données est essentielle avant l'entraînement. dnnTrain intègre des mécanismes d'imputation directe configurables par les paramètres missing (pour les variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. prédictives définies dans inputs) et targetMissing (pour la variable cible). Pour les modèles de régression, vous pouvez choisir de remplacer les valeurs manquantes par la moyenne (MEAN, le comportement par défaut), le maximum (MAX) ou le minimum (MIN). Si vous préférez gérer les valeurs manquantes en amont ou si vous souhaitez que le modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). ignore simplement les observations incomplètes, la valeur NONE peut être utilisée. En parallèle, l'action permet de normaliser les données à la volée avec std et targetStd, offrant des méthodes comme MIDRANGE, qui met à l'échelle les valeurs entre -1 et 1, ou STD pour obtenir une moyenne nulle et un écart-type unitaire, particulièrement utile pour stabiliser la descente de gradient.

Exemples pour l'action dnnTrain

Entraînement d'un perceptron multicouche (MLP) basique

Cet exemple entraîne un réseau de neurones avec deux couches cachées de 5 neurones chacune, en utilisant la fonction d'activation RELU par défaut. La table des poids est sauvegardée.

Entraînement avancé avec Optimiseur ADAM, Dropout et Arrêt précoce

Dans cet exemple, nous poussons les réglages : utilisation de l'optimiseur ADAM, ajout de régularisation par 'dropout' (pour éviter le surapprentissage), suivi de la stagnation sur une table de validation, et sauvegarde des meilleurs poids ('bestWeights') rencontrés pendant l'entraînement.