Dans l'action addLayer, comment gérer le remplacement de couches existantes ou le partage de poids entre les couches ?

L'action addLayer offre des paramètres spécifiques pour gérer la dynamique des couches au sein du modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). :

  • replace : Si défini à TRUE, toute couche existante portant le même nom que la nouvelle couche sera remplacée. Par défaut, cette option est à FALSE.
  • sharingWeights (alias sharedWeights) : Permet de spécifier le nom d'une couche existante dont les poids seront partagés avec la nouvelle couche. C'est utile pour des architectures où certaines parties du réseau doivent avoir des poids identiques, réduisant ainsi le nombre de paramètres à entraîner et favorisant le transfert de connaissances.

Cette réponse vous a-t-elle aidé ?

Vos votes aident à améliorer notre base de connaissances.

Exemples pour l'action addLayer

1. Ajout de la couche d'entrée (INPUT)
Illustration corporate

Cet exemple définit la couche INPUT (tenseurs RGB 3x32x32). Le paramètre scale (1/255) normalise les pixels dans [0,1], une étape critique pour stabiliser la descente de gradient.

2. Ajout d'une couche de convolution (CONVO)
Illustration corporate

Cet exemple intègre une couche CONVO (16 filtres 3x3, stride=1). L'activation ReLU introduit la non-linéarité, et l'initialisation XAVIER préserve la variance des gradients.

Assemblage d'un réseau CNN de bout en bout
Illustration corporate

Cet exemple finalise le CNN : Max Pooling (réduction spatiale), FC (dropout 0.2) et OUTPUT Softmax (entropie croisée).