Apprentissage automatique pour le diagnostic/pronostic de systèmes

DISCO développe des méthodes de classification statique avec extraction d'indicateurs (normal, anormal, sain, malade, fautif, etc.) sur des populations d'individus exploitant la logique floue, les réseaux de neurones. Une méthode de classification dynamique offre quant à elle, la possibilité d'apprendre des états de comportement dynamiques et de détecter des changements entre ces états en détectant également des états nouveaux. DISCO contribue également à l'apprentissage automatique de modèles temporels (type chroniques) en exploitant des techniques de fouilles de données temporelles sur des logs de systèmes afin de découvrir des classes de fonctionnements temporellement discriminables.


Classification non supervisée statique et sélection d'attributs

DISCO développe des algorithmes de classifications non supervisées basé sur des concepts de logique floue (outil P3S). L'une des originalités de ces outils est de permettre la classification des individus décrits par des attributs de nature hétérogène (quantitatifs, symboliques et intervalles) gérant ainsi des données imprécises ou incertaines (type intervalle). DISCO développe également des algorithmes pour la sélection d'attributs hétérogènes discrimants qui reposent notamment sur la maximisation de la marge d'erreur de classification menant à une solution analytique. Cette sélection d'attributs est une aide à la synthèse et au placement de capteurs pour le diagnostic et le pronostic. Ces développements génériques ont été appliqués avec succès, en particulier, dans le domaine médical (diagnostic et extraction de nouvelles signatures pour le pronostic du cancer du sein) en collaboration avec l’Institut Claudius Regaud de Toulouse et dans le domaine des procédés chimiques.



Classification non supervisée dynamique

Dans l'objectif de pouvoir suivre en-ligne l'évolution d'un système dynamique sans connaissance a priori sur un modèle de comportement, DISCO propose des algorithmes de classification non supervisée et dynamique (base de l'outil Dyclee). Ces algorithmes gèrent à la volée des flux de données massives produits par des systèmes/procédés évolutifs et apprend leur comportement sous la forme d'un modèle d'évolution (chaîne de Markov). L'originalité de ces algorithmes est de proposer une technique de classification dynamique capable de gérer des grappes (clusters) d'états non convexes et de détecter des données aberrantes ou de nouveaux états. Un classifieur dynamique et hiérarchique de ces grappes est également en cours de développement.




Extraction non supervisée de motifs temporels caractéristiques: chroniques

Les données sous forme de séquences d'événements sont caractéristiques de nombreux domaines d'application. Apprendre la signature d'une situation afin de pouvoir la reconnaître, la détecter ultérieurement consiste alors à extraire des motifs caractéristiques dans ces séquences: des chroniques. DISCO propose des méthodes d'extraction de motifs temporels (avec information sur la durée entre événements) de type chroniques par des techniques d'exploration de données non supervisées sur la base d'un critère de fréquence ou de répétition. Afin de guider la classification, une distance de similarité entre motifs temporels a également été proposée. Elle compare les caractéristiques temporelles et événementielles de motifs en les transposant dans un espace Euclidien k-dimensionnel. Ces méthodes sont également adaptées pour des motifs purement séquentiels (non-temporels) et appliquées à l'apprentissage de procédures de diagnostic dans le domaine automobile. Une étude de similarité.

Apprentissage supervisé par réseaux de neurones

Dans le cadre supervisé, DISCO des architectures de réseaux de neurones profonds pour la classification supervisée de données de type géométrique 2D et 3D. Ces architectures s'appuient sur une analyse fonctionnelle et structurelle du système à apprendre (couplages et dépendances entre variables). Ces connaissances se sont avérées décisives sur les performances du réseau dans le cadre de la reconstruction de doses de rayons thérapeutiques surpatient et la détection de surdosage. Cette structure a été conçue pour une application en radiothérapie. L'entrée du réseau étant fournie par le signal d'un imageur électronique haute énergie (EPID), le réseau estime de la dose de rayons administrée au patient, en 2D lors du contrôle qualité avant traitement ou en 3D pendant le traitement (dosimétrie in-vivo). Cette estimation permet le diagnostic de l'appareil ou d'un sur-dosage lors du traitement du patient. Travaux en collaboration avec l'Institut Université du Cancer de Toulouse Oncopole.