Vision 3D artificielle (cours de master)

Rattachement

Enseignants

Objectifs

La facilité et le coût minimal d'acquisition d'images numériques d'excellente qualité et de bonne résolution incitent à s'intéresser à l'information qui peut s'obtenir à partir de plusieurs images de la même scène. Supposant la scène statique et la caméra ou l'appareil photo mobile, deux cas sont possibles :
  1. S'il s'agit d'une pure rotation de la caméra, un panorama peut être construit par recalage paramétrique des images, simulant un angle de vue élargi de l'appareil.
  2. Par contre si ce mouvement comporte une part de translation, le parallaxe induit permet de reconstuire théoriquement la géométrie 3D de la scène, modulo les occlusions.
Les applications sont multiples, que ce soit en robotique, cartographie aérienne, réalité virtuelle, jeux vidéos, télévision 3D... Le but de ce cours est d'explorer les fondements théoriques permettant cette reconstruction 3D à partir de 2 ou plusieurs images, mais aussi d'en montrer les limitations pratiques dans l'état actuel des algorithmes. Bien que ce domaine de recherche ait réellement commencé il y a plus de 30 ans et malgré (ou grâce à) d'importantes avancées, il reste extrêmement actif. Il fait appel à de nombreux domaines des mathématiques, avec en premier lieu la géométrie projective et l'algèbre linéaire, mais aussi la géométrie différentielle, l'optimisation continue ou discrète, les probabilités, la géométrie algébrique...

Des exemples de reconstruction 3D obtenue en utilisant les techniques enseignées sont rassemblés dans une galerie.

Prérequis, déroulement du cours

Les bases mathématiques d'analyse, de calcul différentiel et d'algèbre linéaire indispensables à tout étudiant de master de mathématiques appliquées, ainsi qu'une compétence minimale en programmation dans un langage procédural (C, C++, java ou python) sont les seuls prérequis. Les exercices se feront en C++, mais l'expérience d'un des autres langages mentionés sera suffisante.
Une bibliothèque C++ de routines de base nécessaires aux exercices sera fournie : Imagine++.
Il est conseillé d'installer ce logiciel avant la première séance. Les cours comportent une partie magistrale et une partie TP sur machine. Pour cela, chaque étudiant est encouragé à amener son ordinateur portable. Les TP seront à terminer pour la semaine suivante.

Évaluation

La note finale est une pondération des notes de rendu de TP et de la note de l'examen final écrit.

Séances 2017

Les cours ont lieu à Télécom ParisTech (adresse et plan), horaire : 12:45-15:45

Valid XHTML 1.0 Transitional