3.6 – Deep Learning appliqué au SAR : Transfer Learning et ResNet-18

Contenu du cours
Section 1 – Introduction à la Télédétection
Découvrez les fondements de la télédétection, les objectifs du cours et la propagation du rayonnement électromagnétique depuis la source jusqu'à l'analyse finale. Cette section pose les bases de notre parcours scientifique.
0/2
Section 2 – Télédétection Optique ( Sentinel-2 )
Maîtriser la chaîne complète de prétraitement optique Sentinel-2 : correction atmosphérique, harmonisation géométrique, découpe spatiale et extraction d'indices spectraux (NDVI). Durée : 3 heures | 6 parties structurées | 4 vidéos tutoriels
0/10
Section 4 – Projets Pratiques et Évaluation
M232 – Physique de la Télédétection : Optique, Radar et Ingénierie du Traitement (ESA SNAP)

Du seuillage classique au Deep Learning

Les méthodes classiques (seuillage, ratio) présentent des limitations : le choix du seuil est manuel, sensible au speckle résiduel, et difficile à généraliser. Les approches par Deep Learning permettent d’automatiser et d’améliorer significativement la détection de changement.

Référence de base : Hamdi et al., Computer Optics, 2021DOI: 10.18287/2412-6179-CO-814

Notre pipeline en 4 étapes

Etape 1 : Pré-traitement par CNN Despeckling

Réduction du speckle par réseau de neurones convolutif avant toute analyse DL.

  • Référence : Hamdi et al., IEEE Morgeo 2020DOI: 10.1109/Morgeo49228.2020.9121890
  • Architecture : réseau convolutif 17 couches, noyaux 3×3
  • Cette approche surpasse les filtres classiques pour la préservation des détails fins

Etape 2 : Segmentation par Mask R-CNN

Mask R-CNN (He et al., 2017) combine détection d’objets et segmentation d’instances pour délimiter précisément les régions changées et non-changées.

  • Architecture : backbone CNN + Regional Proposal Network (RPN) + RoI Align + 3 branches (classification, box regression, mask prediction)
  • Application : segmentation pixel-level des zones inondées

Etape 3 : Augmentation de données

Dataset initial : 100 patches de 224×224×3 pixels, augmenté à 1104 images par :

  • Translations aléatoires (±20 pixels)
  • Rotations (0°, 90°, 180°, 270°)
  • Flips horizontaux et verticaux
  • Redimensionnement léger (±10%)

La taille 224×224 correspond à la couche d’entrée standard de ResNet-18.

Etape 4 : Transfer Learning avec ResNet-18

ResNet-18 est pré-entraîné sur ImageNet (>1 million d’images, 1000 classes). Les trois dernières couches sont remplacées par :

  • Nouvelle couche Fully Connected (FC)
  • Nouvelle couche Softmax
  • Nouvelle couche de Classification : 2 classes (changé / non-changé)

Entraînement : 810 itérations, 10 epochs, batch size 10, split 70%/30% train/test.
Optimiseur : SGD avec momentum 0.9, learning rate 0.001.
Fonction de perte : Cross-Entropy.

Tableau comparatif des résultats

Méthode Dataset FCM (Q%) DCNet (Q%) Notre méthode (Q%) Notre méthode (F1%)
Résultats Eddahbi SAR 81.2 88.5 94.84 93.1

Résultat clé : Précision globale de 94.84% sur le dataset El Mansour Eddahbi, surpassant FCM (+13.6%) et DCNet (+6.3%).

Architecture ResNet-18 : résidus et skip connections

L’innovation de ResNet repose sur les connexions résiduelles (skip connections) :

H(x) = F(x) + x

  • F(x) : transformation apprise par les couches convolutives
  • x : identité (skip connection) — évite le problème de vanishing gradient
  • 18 couches pondérées : 8 blocs résiduels + FC + Softmax

Références publiées

  1. Hamdi et al. (2021) — Change Detection in SAR Images using Deep Learning — Computer Optics, Vol. 45, No. 2DOI: 10.18287/2412-6179-CO-814
  2. Hamdi et al. (2020) — CNN-Based SAR Image Despeckling — IEEE Morgeo 2020DOI: 10.1109/Morgeo49228.2020.9121890

Points clés à retenir

  • Le pipeline CNN + Mask R-CNN + ResNet-18 atteint 94.84% de précision sur les inondations SAR
  • Le Transfer Learning permet d’obtenir de bonnes performances avec peu de données (<1000 images)
  • L’augmentation de données est indispensable pour les datasets SAR de petite taille
  • Les skip connections de ResNet résolvent le problème de vanishing gradient pour les réseaux profonds