Retour au site du LAAS-CNRS

Laboratoire d’analyse et d’architecture des systèmes

Publications personnelle

Choisir la langue : FR | EN

138documents trouvés

18334
01/03/2019

Hyper-parameter optimization tools comparison for Multiple Object Tracking applications

J.MADRIGAL DIAZ, C.MAURICE, F.LERASLE

RAP

Revue Scientifique : Machine Vision and Applications, Vol.30, N°2, pp.269-289, Mars 2019, doi 10.1007/s00138-018-0984-1 , N° 18334

Lien : https://hal.archives-ouvertes.fr/hal-01897032

Diffusable

Plus d'informations

Abstract

Commonly, when developing an algorithm it is necessary to define a certain number of variables that control its behavior. Optimal parameters result in better performance that could translate into profits for companies, stand out among similar applications or better ranking on algorithm competitions. However, it is not a simple task to find the combination of parameters that provides the best results. Manual tuning could be a stressful and difficult task even for expert users. In this paper we present, evaluate and compare several tools in the literature for hyper-parameter optimization. We focus on 4 tools that have been selected due to their number of citations, code availability and impact on literature: MCMC, SMAC, TPE and Spearmint. We analyze these tools in the context of Multi Object Tracking (MOT) that have not been well studied in the literature. MOT itself has been well-studied topic with multiple parameters to be tuned. We evaluate these tools using public benchmarks such as PETS09 or ETH and using the publicly available source code provided by the authors. We analyze the impact of these tools in terms of stability, performance, and usabil-ity, among others. Our results show how the use of these tools change the performance of the application and how this would affect the results of real ranked competitions. Our goal is (1) to encourage the reader to use these tools and (2) to provide a guide that helps to choose the most pertinent tool.

144949
18679
28/06/2018

Localisation sonore par attention et apprentissage profond semi-supervisé

M.MOREAUX, M.GARCIA ORTIZ, I.FERRANE, F.LERASLE

RAP, AI Lab, IRIT-UPS

Manifestation avec acte : Congrès Reconnaissance des Formes, Image, Apprentissage et Perception ( RFIAP ) 2018 du 25 juin au 28 juin 2018, Marne-la-Vallée (France), Juin 2018, 3p. , N° 18679

Lien : https://hal.archives-ouvertes.fr/hal-02289999

Diffusable

Plus d'informations

Résumé

Afin d’interagir avec l’humain et son environnement, un robot de service doit pouvoir percevoir des informations visuelles et sonores de la scène qu’il observe ou à laquelle il participe. Il doit notamment être capable de repérer des éléments saillants dans les différents signaux captés : localisation spatiale dans une image ou temporelle dans un flux audio. L’aspect "datavore"des méthodes dites d’apprentissage profond, et le coût considérable de l’annotation des données, militent pour l’utilisation de méthodes semi-supervisées, capables d’une part d’extraire de l’information de manière supervisée, et d’autre part de prédire l’organisation spatiale ou temporelle des événements présents dans le signal traité. Dans le domaine de la vision, ce concept a été utilisé à plusieurs reprises pour effectuer de la localisation spatiale d’objet ou d’activité sur des images [1, 2, 3] à partir des signaux 2D bruts (pixels). Au niveau audio, la tendance consistant à s’affranchir des représentations bas niveau de type MFCC [4] a fait son apparition, permettant ainsi un traitement direct du signal audio brut [5, 6, 7, 8] et laissant aux réseaux de neurones la tâche d’extraire les caractéristiques représentatives optimales des signaux traités. Dans cet article,nous proposons un réseau convolutionnel, associé à un mécanisme d’attention, permettant l’exploitation du signal audio brut,afin non seulement de classifier, mais aussi de localiser temporellement un événement sonore présent dans le flux traité, et ce de manière semi-supervisé.

147993
18209
28/06/2018

Suivi de passagers de bus par apprentissage profond

C.LABIT-BONIS, J.THOMAS, F.LERASLE, J.MADRIGAL DIAZ

RAP, ACTIA

Manifestation avec acte : Congrès Reconnaissance des Formes, Image, Apprentissage et Perception ( RFIAP ) 2018 du 25 juin au 28 juin 2018, Marne-la-Vallée (France), Juin 2018, 8p. , N° 18209

Lien : https://hal.laas.fr/hal-01830834

Diffusable

Plus d'informations

Résumé

Cet article présente une étude comparative de suivi par détection appliqué au comptage passager dans les bus de ville. Un détecteur cible les passagers à chaque instant image, puis un traqueur reconstruit leurs trajectoires en associant ces détections. Nous comparons trois détecteurs par apprentissage profond peu explorés dans notre contexte applicatif, que nous couplons avec un traqueur temps réel pour une évaluation globale sur notre base large échelle d'images en situation réelle. Les résultats présentés sont très encourageants tant en terme de détection et de suivi que de rapidité pour nos perspectives embarquées.

144199
18064
15/03/2018

Soft-Cascade Learning with Explicit Computation Time Considerations

FBARBOSA ANDA, F.LERASLE, C.BRIAND, A.A.MEKONNEN

RAP, ROC

Manifestation avec acte : IEEE Winter Conference on Applications of Computer Vision ( WACV ) 2018 du 12 mars au 15 mars 2018, Lake Tahoe (USA), Mars 2018, 10p. , N° 18064

Lien : https://hal.archives-ouvertes.fr/hal-01726292

Diffusable

Plus d'informations

Abstract

This paper presents a novel framework for learning a soft-cascade detector with explicit computation time considerations. Classically, training techniques for soft-cascade detectors select a set of weak classifiers and their respective thresholds, solely to achieve the desired detection performance without any regard to the detector response time. Nevertheless, since computation time performance is of utmost importance in many time-constrained applications , this work divulges an optimization approach that aims to minimize the mean cascade response time, given a desired detection performance, fixed beforehand. The resulting problem is NP-Hard, therefore finding an optimal threshold vector can be very time-consuming, especially when building a soft-cascade detector of long length. An efficient local search procedure is presented that deals with long-length detectors. Our evaluations on two challenging public datasets confirm that a faster cascade detector can be learned while maintaining similar detection performances .

142834
18087
15/03/2018

3D Head Pose Estimation enhanced through SURF-based Key-Frames

J.MADRIGAL DIAZ, F.LERASLE, A.MONIN

RAP

Manifestation avec acte : IEEE Winter Conference on Applications of Computer Vision ( WACV ) 2018 du 12 mars au 15 mars 2018, Lake Tahoe (USA), Mars 2018, 9p. , N° 18087

Lien : https://hal.laas.fr/hal-01755776

Diffusable

Plus d'informations

Abstract

This work presents a method that incorporates 2D and 3D cues for the estimation of head pose. We propose the use of the concept of Key-Frames (KF), a set of frames where the position and orientation of the head is automatically calculated off-line, to improve the precision of pose estimation and detection rate. Each KF consists of: 2D information, encoded by SURF descriptors; 3D information from a depth image (both acquired by an RGB-D sensor); and a generic 3D model that corresponds to the head localization and orientation in the real world. Our algorithm compares a new frame against all KFs and selects the most relevant one. The 3D transformation between both, selected KF and current frame, can be estimated using the depth image and the Iterative Closest Point algorithm in an online framework. Compared to reference approaches, our system can handle partial occlusions and extreme rotations even with noisy depth data. We evaluate the proposal using two challenging datasets: (1) an dataset acquired by us where the ground-truth information is given by a commercial Motion Capture system and (2) the public benchmark Biwi Kinect Head Pose Database.

143199
18171
01/03/2018

Comparative Evaluations of Selected Tracking-by-Detection Approaches

A.A.MEKONNEN, F.LERASLE

RAP

Revue Scientifique : IEEE Transactions on Circuits and Systems for Video Technology, Vol.24, N°4, pp.996-1010, Mars 2018, DOI: 10.1109/TCSVT.2018.2817609 , N° 18171

Lien : https://hal.laas.fr/hal-01815850

Diffusable

Plus d'informations

Abstract

In this work, we present a comparative evaluation of various multi-person tracking-by-detection approaches on public datasets. The work investigates five popular trackers coupled with six relevant visual people detectors evaluated on seven public datasets. The evaluation emphasizes on exhibited performance variation depending on tracker-detector choices. Our experimental results show that the overall performance depends on how challenging the dataset is, the performance of the detector on the specific dataset, and the tracker-detector combination. Some trackers are more sensitive to the choice of a detector and some detectors to the choice of a tracker than others. Based on our results, two of the trackers demonstrate the best performances consistently across different datasets whereas the best performing detectors vary per dataset. This underscores the need for careful application context specific evaluation when choosing a detector.

143917
18108
23/02/2018

Partitionnement en cliques à profit maximum de graphes orientés avec contraintes de flot

FBARBOSA ANDA, C.BRIAND, F.LERASLE

RAP, ROC

Manifestation avec acte : Congrès Annuel de la Société Française de Recherche Opérationnelle et d'Aide à la Décision ( ROADEF ) 2018 du 21 février au 23 février 2018, Lorient (France), Février 2018, 2p. , N° 18108

Lien : https://hal.archives-ouvertes.fr/hal-01765307

Diffusable

Plus d'informations

Résumé

Nous présentons un problème de partitionnement en cliques à profit maximum d’un graphe orientés avec contraintes de flots. Ce problème est voisin du problème de partition en cliques classique [2] excepté que le graphe est orienté et composé de deux catégories d’arcs : ceux sur lesquels circule un flot et les autres. Il est issu d’un problème de ré-identification de personnes dans un réseau de caméras.

143375
18001
29/01/2018

Mind the regularized GAP, for human action classification and semi-supervised localization based on visual saliency

M.MOREAUX, N.LYUBOVA, I.FERRANE, F.LERASLE

RAP, Softbank Robotics, IRIT-UPS

Manifestation avec acte : International Conference on Computer Vision Theory and Applications ( VISAPP ) 2018 du 27 janvier au 29 janvier 2018, Funchal (Portugal), Janvier 2018, 9p. , N° 18001

Lien : https://hal.laas.fr/hal-01763103

Diffusable

Plus d'informations

Abstract

This work addresses the issue of image classification and localization of human actions based on visual data acquired from RGB sensors. Our approach is inspired by the success of deep learning in image classification. In this paper, we describe our method and how the concept of Global Average Pooling (GAP) applies in the context of semi-supervised class localization. We benchmark it with respect to Class Activation Mapping initiated in (Zhou et al., 2016), propose a regularization over the GAP maps to enhance the results, and study whether a combination of these two ideas can result in a better classification accuracy. The models are trained and tested on the Stanford 40 Action dataset (Yao et al., 2011) describing people performing 40 different actions such as drinking, cooking or watching TV. Compared to the aforementioned baseline, our model improves the classification accuracy by 5.3 percent points, achieves a localization accuracy of 50.3%, and drastically diminishes the computation needed to retrieve the class saliency from the base convolutional model.

142173
17136
01/09/2017

Hyper-optimization tools comparison for parameter tuning applications

C.MAURICE, J.MADRIGAL DIAZ, F.LERASLE

RAP

Manifestation avec acte : International Conference on Advanced Video and Signal-based Surveillance ( AVSS ) 2017 du 29 août au 01 septembre 2017, Lecce (Italie), Septembre 2017, 6p. , N° 17136

Lien : https://hal.laas.fr/hal-01584100

Non disponible

Plus d'informations

Abstract

This paper evaluates and compares different hyper-parameters optimization tools that can be used in any vision applications for tuning their underlying free parameters. We focus in the problem of multiple object tracking, as it is widely studied in the literature and offers several parameters to tune. The selected tools are freely available or easy to implement. In this paper we evaluate the impact of parameter optimization tools over the tracking performances using videos from public datasets. Also, we discuss differences between the tools in term of performances, stability , documentation, etc.

140752
16467
27/02/2017

Trade-off between GPGPU based implementations of multi object tracking particle filter

P.JECMEN, F.LERASLE, A.A.MEKONNEN

RAP

Manifestation avec acte : International Conference on Computer Vision Theory and Applications ( VISAPP ) 2017 du 27 février au 01 mars 2017, Porto (Portugal), Février 2017, 10p. , N° 16467

Lien : https://hal.laas.fr/hal-01763095

Diffusable

Plus d'informations

Abstract

In this work, we present the design, analysis and implementation of a decentralized particle filter (DPF) for multiple object tracking (MOT) on a graphics processing unit (GPU). We investigate two variants of the implementation , their advantages and caveats in terms of scaling with larger particle numbers and performance on several datasets. First we compare the precision of our GPU implementation with standard CPU version. Next we compare performance of the GPU variants under different scenarios. The results show the GPU variant leads to a five fold speedup on average (in best cases the speedup reaches a factor of 18) over the CPU variant while keeping similar tracking accuracy and precision.

139712
Les informations recueillies font l’objet d’un traitement informatique destiné à des statistiques d'utilisation du formulaire de recherche dans la base de données des publications scientifiques. Les destinataires des données sont : le service de documentation du LAAS.Conformément à la loi « informatique et libertés » du 6 janvier 1978 modifiée en 2004, vous bénéficiez d’un droit d’accès et de rectification aux informations qui vous concernent, que vous pouvez exercer en vous adressant à
Pour recevoir une copie des documents, contacter doc@laas.fr en mentionnant le n° de rapport LAAS et votre adresse postale. Signalez tout problème de dysfonctionnement à sysadmin@laas.fr. http://www.laas.fr/pulman/pulman-isens/web/app.php/