Détection en ligne d’anomalies par apprentissage

Le cloud computing est une technologie attrayante dans la mesure où elle permet de mutualiser des capacités de traitement et de stockage, réduisant ainsi les coûts pour les clients de telles infrastructures. Un des défis des fournisseurs de service cloud est de répondre à des exigences de sûreté de fonctionnement très variées, provenant d’utilisateurs aux demandes hétérogènes, et s'appliquant à des services aux ressources mutualisées. La détection au plus tôt d’anomalies affectant les services déployés dans ces infrastructures est fondamentale dans ce contexte.

Dans le cadre de la thèse de C. Sauvanaud et du Post Doc de G. Silvestre nous avons défini un système de détection d’anomalies dans le cloud, en ligne et générique, permettant de réagir rapidement à d'éventuelles violations de niveaux de services dans un but de recouvrement des sources de défaillance.

Le système de détection traite les données de surveillance système des hyperviseurs et des machines virtuelles (VMs) des services par des modèles de classification à apprentissage automatique (supervisé, non-supervisé et hybride). Les anomalies qu’il est possible de détecter incluent les erreurs, les symptômes préliminaires de violation de service et les violations de service. La performance de détection de notre système est évaluée grâce à une plateforme cloud dans laquelle sont injectées artificiellement des anomalies.

L’efficacité de notre approche a été validée sur deux cas d’études[1] : un système de gestion de base de données (MongoDB) et une fonction réseau virtualisée.

 

[1] Sauvanaud C., Kaâniche M., Kanoun K. , Lazri K., Da Silva Silvestre G., Anomaly Detection and Diagnosis for Cloud services: Practical experiments and lessons learned, Journal of  Systems and Software, 139, pp. 84-106, 2018