RAP - Perception visuelle d'Humains & Videosurveillance

Les applications privilégiées sont l'interaction passive humain-robot (e.g., la navigation en environnement humain encombré), l'interaction active humain-robot (e.g., l'interaction proximale par des postures et gestes), et la surveillance.  Des espaces privatifs ainsi que des environnements humains à grande échelle sont considérés.  Les fonctions couvrent la détection d'humains, le suivi de personnes et postures multiples, l'identification d'humains, et l'interprétation du mouvement humain.  Une caractéristique importante est qu'elles réalisent une fusion de données au niveau capteur (fusion de primitives bas niveau extraites de signaux bruts) ou bien à des niveaux plus élevés (en combinant les résultats d'algorithmes de plus bas niveau).

La détection et le suivi sont principalement abordés au moyen de méthodes de classification supervisée et de filtrage probabilistes et Monte-Carlo, respectivement.  Nous avons réalisé la détection de personnes sur la base de caractéristiques hétérogènes au moyen de méthodes mono-classe telles que le boosting (thèse A.A. Mekonnen).  Des méthodes multi-classes telles que les "forêts aléatoires'' ont été utilisées pour détecter des limbes pour la reconnaissance de posture (thèse de L. Marti).  En ce qui concerne le suivi, une fusion originale de primitives vision et RFID dans un filtrage particulaire MCMC avec sauts réversibles (RJ-MCMC) a permis la navigation robuste en temps réel d'un robot dans un environnement humain encombré [Mekonnen-et-al_CVIU2013] (thèses A.A. Mekonnen et TGerma).  Nous avons pu suivre et ré-identifier des personnes à partir d'un réseau de caméras à champs de vue disjoints, grâce au couplage de systèmes de suivi et d'identification locaux (un par caméra, sur la base d'un filtre particulaire à état mixte) avec un superviseur basé MCMC en charge de l'association des "tracklets" [Meden-et-al_BMVC2012] (thèse de B. Meden).  Des travaux récents ont concerné la reconstruction et le suivi de posture sur la base d'un ou plusieurs capteurs Kinect par filtrage ou lissage stochastique (thèses L. Marti et J.T. Masse).

Visual Perception of Humans and Videosurveillance
(Haut) Suivi et mouvement coordonné d'un robot-guide dans une foule par vision et RFID.
(Bas) Suivi visuel et ré-identification de personnes dans un réseau de caméras à champs de vue disjoints.