Peut-on injecter des connaissances préalables pour faire du transfert d'apprentissage de haut vol ?

Question

Nicolas Housset · Accepted Answer

Absolument, c'est l'un des avantages compétitifs les plus puissants pour les architectes Data. L'action dlTrain intègre nativement le paramètre initWeights spécialement conçu pour le transfert d'apprentissage et le réglage fin (fine-tuning). Au lieu de forcer le réseau de neurones à initialiser ses poids aléatoirement, vous pouvez lui passer une table contenant les poids d'un modèle préalablement entraîné sur des volumes massifs de données. Vous capitalisez ainsi sur une extraction de caractéristiques déjà performante. De plus, grâce au paramètre freezeLayers de l'optimiseur, vous pouvez geler techniquement les premières couches de votre réseau pour protéger ces connaissances apprises, et concentrer la puissance de calcul uniquement sur l'optimisation des dernières couches spécifiques à votre cas d'usage métier.

Peut-on injecter des connaissances préalables pour faire du transfert d'apprentissage de haut vol ?

Exemples pour l'action dlTrain

Entraînement basique d'un modèle DNN

Entraînement avancé avec algorithme ADAM et sauvegarde des meilleurs poids

Action CAS associée

À lire aussi...