Stage
Combiner apprentissage et raisonnement sur l’exemple de l’addition MNIST
Date de publication
23.10.25
Prise de poste souhaitée
02.02.26
Contexte du stage
L’intelligence artificielle ne se limite pas aux IA génératives: elle contient plusieurs branches, dont l’apprentissage et le raisonnement.
Les approches neuro-symboliques combinent un réseau de neurones pour l’apprentissage à une méthode symbolique pour le raisonnement. Durant ce stage, on s’intéressera à une tâche simple requérant cette combinaison: l’addition MNIST. Le jeu de données MNIST [3] représente des chiffres manuscrits et le but est d’entraîner un réseau de neurones à les reconnaître. Ici, on ne connaît pas directement les étiquettes (vraie valeur) des données d’entraînement, mais on observe des additions correctes. Il faut donc exploiter la règle logique de l’addition pour pouvoir entraîner un réseau de neurones à reconnaître les images de chiffres.

Différentes méthodes ont déjà été développées pour traiter le problème d’addition MNIST [4, 5], mais elles sont coûteuses en temps (résolution de nombreux problèmes NP-difficiles). Durant ce stage, le but est d’adapter une fonction de perte (loss) que nous avons récemment proposée pour apprendre à raisonner, l’Emmental-PLL (E-PLL [2, 1]) pour l’étendre au problème de l’addition MNIST. Cette loss permet d’apprendre un problème d’optimisation combinatoire complet (contrainte + objectif) à partir d’exemples de solutions. L’avantage de cette méthode est que la résolution d’une addition ne nécessitera pas de résoudre de problème NP-difficile.
Objectifs du stage
- Modéliser le problème de l'addition MNIST (comme un problème de satisfaction de contraintes pondérées)
- D'étendre l’E-PLL pour la rendre capable de prendre en compte des contraintes connues d’arité supérieure 2
- Résoudre l'addition MNIST et comparer à l’état de l’art
- Intégrer le code réalisé à une librairie en cours de création pour sa diffusion
En fonction de l'avancement de l'étudiant.e, d'autres tâches neuro-symboliques pourront être explorées. Ce travail de stage pourrait mener à la participation à une publication dans une conférence ou un journal en IA.
Durée et organisation
Stage 6 mois à partir de février/mars 2026. Il aura lieu à
- LAAS-CNRS, 7 avenue du Colonel Roche, 31400 Toulouse. Equipe ROC
- MIAT-INRAE, 24 Chemin de Bordé Rouge, Auzeville CS 52627, 31326 Castanet-Tolosan Cedex
Profil recherché
- M2 ou école d’ingénieurs en informatique et/ou recherche opérationnelle
- Aucune connaissance préalable sur les problèmes de satisfaction de contraintes pondérées n'est attendue
- Connaissances en apprentissage profond appréciées
- Compétences en programmation Python
- Capacités à communiquer et synthétiser les résultats son travail
Encadrement et contacts
- Marianne Defresne, LAAS-CNRS ( )
- Thomas Schiex, MIAT-INRAE et ANITI ( )
Références bibliographiques
[1] Marianne Defresne, Sophie Barbe, and Thomas Schiex. Scalable Coupling of Deep Learning with Logical Reasoning. In Thirty-second International Joint Conference on Artificial Intelligence, IJCAI’2023, 2023.
[2] Marianne Defresne, Romain Gambardella, Sophie Barbe, and Thomas Schiex. Efficient neuro-symbolic learning of constraints and objective. arXiv preprint arXiv:2508.20978, 2025.
[3] Y. Lecun, L. Bottou, Y. Bengio, and P. Haffner. Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11):2278–2324, 1998.
[4] Robin Manhaeve, Sebastijan Dumancic, Angelika Kimmig, Thomas Demeester, and Luc De Raedt. Deepproblog: Neural probabilistic logic programming. Advances in neural information processing systems, 31, 2018.
[5] Jingyi Xu, Zilu Zhang, Tal Friedman, Yitao Liang, and Guy Broeck. A semantic loss function for deep learning with symbolic knowledge. In International conference on machine learning, pages 5502–5511. PMLR, 2018