Berekmeri Mihaly - La Modélisation et le Contrôle des services BigData : Application à la Performance et la Fiabilité de MapReduce

09:30
Mercredi
18
Nov
2015
Organisé par : 
Lucas Perronne
Intervenant : 
Berekmeri Mihaly
Équipes : 


Lieu de Soutenance de la Thèse :

GIPSA-lab - Bat D - 1er étage - 11 rue des mathématiques
38402 Saint-Martin d’Hères - France - salle Mont Blanc

 

Membres du jury :

  • Karama KANOUN, LAAS Toulouse - Rapporteur
  • Karl-Erik ARZEN, Lund University - Rapporteur
  • Lydia Y. CHEN, IBM Zurich - Examinateur
  • Daniel SIMON, INRIA Montpellier - Examinateur
  • Nicolas MARCHAND, GIPSA-lab Grenoble - Examinateur
  • Sara BOUCHENAK, INSA Lyon - Directeur de thèse
  • Bogdan ROBU, GIPSA-lab Grenoble - Co-encadrant de thèse

Le grand volume de données généré par nos téléphones mobiles, tablettes, ordinateurs, ainsi que nos montres connectées présente un défi pour le stockage et l'analyse. De nombreuses solutions ont émergées dans l'industrie pour traiter cette grande quantité de données, la plus populaire d'entre elles est MapReduce. Bien que la complexité de déploiement des systèmes informatiques soit en constante augmentation, la disponibilité permanente et la rapidité du temps de réponse sont toujours une priorité. En outre, avec l'émergence des solutions de virtualisation et du cloud, les environnements de fonctionnement sont devenus de plus en plus dynamiques. Par conséquent, assurer les contraintes de performance et de fiabilité d'un service MapReduce pose un véritable challenge.

 
Dans cette thèse, les problématiques de garantie de la performance et de la disponibilité de services de cloud MapReduce sont abordées en utilisant une approche basée sur la théorie du contrôle. Pour commencer, plusieurs modèles dynamiques d'un service MapReduce exécutant simultanément de multiples tâches sont introduits. Par la suite, plusieurs lois de contrôle assurant les différents objectifs de qualités de service sont synthétisées. Des contrôleurs classiques par retour de sortie avec feedforward  garantissant les performances de service ont d'abord été développés. Afin d'adapter nos contrôleurs au cloud, tout en minimisant le nombre de reconfigurations et les coûts, une nouvelle architecture de contrôle événementiel a été mise en œuvre. Finalement, l'architecture de contrôle optimal MR-Ctrl a été développée. C'est la première solution à fournir aux systèmes MapReduce des garanties en termes de performances et de disponibilité, tout en minimisant le coût. Les approches de modélisation et de contrôle ont été évaluées à la fois en simulation, et en expérimentation sous MRBS, qui est une suite de tests complète pour évaluer la performance et la fiabilité des systèmes MapReduce. Les tests ont été effectuées en ligne sur un cluster MapReduce de 60 nœuds exécutant une tâche de calcul intensive de type Business Intelligence. Nos expériences montrent que le contrôle ainsi conçu, peut garantir les contraintes de performance et de disponibilité.