Apprentissage automatique pour la détection d'anomalies

La détection d'anomalie est l'identification d'observations aberrantes, hors distribution ou correspondant à des motifs inhabituels dans les données. Les anomalies peuvent constituer des symptômes de défauts. Par ailleurs, elles doivent être rejetées pour la bonne utilisation d'un modèle de diagnostic issu d'un apprentissage.


La détection d'anomalie est l'identification d'observations aberrantes, hors distribution ou correspondant à des motifs inhabituels dans les données. Les anomalies peuvent constituer des symptômes de défauts. Par ailleurs, elles doivent être rejetées pour la bonne utilisation d'un modèle de diagnostic issu d'un apprentissage. La détection d'anomalies peut être abordée en utilisant un modèle de prédiction qui délivre une référence à laquelle on vient comparer les nouvelles données. L'équipe DISCO a récemment développé plusieurs techniques.

  • Modèle de prédiction pour la détection de défauts de panneaux photovoltaïques basé sur un algorithme de type PLS Partial Least Squares adapté pour réduire la dimension dans les problèmes de régression sur-dimensionnés mal conditionnés [hal-03736670] (collaboration avec l'équipe ISGE du LAAS).
  • Détection d'anomalie dans des flux de données basé sur des résultats concernant le noyau de Christoffel-Darboux et la fonction de Christoffel associés, issus de la théorie de l'approximation et des polynômes orthogonaux (algorithmes DycG et DycF) [hal-04630422], [tel-04281671] (collaboration avec l'équipe POP du LAAS)

  • Détection d'anomalies des composants électroniques soumis à radiations spatiales en s'appuyant sur l'algorithme DyD2 un algorithme embarquable de partionnement. Du fait que la solution doit être embarquable, l'algorithme DyD2 proposé requiert une faible puissance de calcul et est basé sur une double détection en cascade [hal-03609573].
  • Détection d'anomalies dans les séries temporelles par l'exploitation de modèles de mélanges Gaussien (GMM) [hal-03277031], de techniques de type XGBoost [hal-03711267], application sur des données industrielles de chaînes d'assemblage de circuits imprimés (PCB). Exploitation de métriques de type Dynamic Time Warping (DTW) et ses variantes Sequence-DTW et Soft-DTW pour la détection de déviations dans les séries temporelles incomplètes et déformées [hal-03773781].