Bahjat Safadi - Indexation sémantique des images et des vidéos par apprentissage actif

08:00
Lundi
17
Sep
2012
Organisé par : 

Bahjat Safadi

Intervenant : 

Bahjat Safadi

Équipes : 

La thèse a été effectuée sous la direction de M. Georges Quénot. La soutenance sera en anglais et se déroulera le Lundi 17 septembre à partir de 10h dans l’Amphi-MJK, sur le campus.

Membres du jury :

M. Alan Smeaton, Professeur, Dublin City University (Ireland), Rapporteur 
M. Matthieu Cord, Professeur, UPMC Sorbonne Universités (France), Rapporteur 
M. Denis Pellerin, Professeur, Université Joseph Fourier (France), Président 
M. Georges Quénot, Chargé de recherche CNRS, CNRS (France), Directeur de thèse 
M. Hervé Jégou, Chercheur INRIA, INRIA- Rennes (France), Examinateur 
M. Stéphane Ayache, Maître de Conférences, Université de la Méditerranée (France),Examinateur

Le cadre général de cette thèse est l’indexation sémantique et la recherche d’informations, appliquée à des documents multimédias. Plus précisément, nous nous intéressons à l’indexation sémantique des concepts dans des images et vidéos par les approches d’apprentissage actif, que nous utilisons pour construire des corpus annotés. Tout au long de cette thèse, nous avons montré que les principales difficultés de cette tâche sont souvent liées, en général, à l’fossé sémantique. En outre, elles sont liées au problème de classe-déséquilibre dans les ensembles de données à grande échelle, où les concepts sont pour la plupart rares. Pour l’annotation de corpus, l’objectif principal de l’utilisation de l’apprentissage actif est d’augmenter la performance du système en utilisant que peu d’échantillons annotés que possible, ainsi minimisant les coûts de l’annotations des données (par exemple argent et temps). Dans cette thèse, nous avons contribué à plusieurs niveaux de l’indexation multimédia et nous avons proposé trois approches qui succèdent des systèmes de l’état de l’art : i) l’approche multi-apprenant (ML) qui surmonte le problème de classe-déséquilibre dans les grandes bases de données, ii) une méthode de reclassement qui améliore l’indexation vidéo, iii) nous avons évalué la normalisation en loi de puissance et de l’APC et a montré son efficacité dans l’indexation multimédia. En outre, nous avons proposé l’approche ALML qui combine le multi-apprenant avec l’apprentissage actif, et nous avons également proposé une méthode incrémentale qui accélère l’approche proposé (ALML). En outre, nous avons proposé l’approche de nettoyage actif, qui aborde la qualité des annotations. Les méthodes proposées ont été tous validées par plusieurs expériences, qui ont été menées et évaluées sur des collections à grande échelle de l’indice de benchmark internationale bien connue, appelés TRECVid. Enfin, nous avons présenté notre système d’annotation dans le monde réel basé sur l’apprentissage actif, qui a été utilisé pour mener les annotations de l’ensemble du développement de la campagne TRECVid en 2011, et nous avons présenté notre participation à la tâche d’indexation sémantique de cette campagne, dans laquelle nous nous sommes classés à la 3ème place sur 19 participants.