Carlos Manuel López Enríquez - HyQoZ – Optimisation de requêtes hybrides basée sur des contrats SLA

Organized by: 
Carlos Manuel López Enríquez
Carlos Manuel López Enríquez
Jury :
  • Dr. Cedric DU MOUZAConservatoire National des Arts et Métiers, Paris (Rapporteur)
  • Dr. Thierry DELOTUniversité de Valenciennes (Rapporteur)
  • Pr. Parisa GHODOUSUniversité de Lyon 1 (Examinateur)
  • Pr. Christine COLLETInstitut polytechnique de Grenoble (Directrice de thèse)
  • Dr. Genoveva VARGAS-SOLARC.R. CNRS (Co-Encadrant de thèse)
  • Pr. José-Luis ZECHINELLI-MARTINIUDLAP-LAFMIA (Codirecteur de thèse)
Pot de thèse : salle D102 de l'ENSIMAG
Dans ce travail, nous traitons du problème de l’optimisation de requêtes hybrides sur les données produites par des services de données à la demande ou en continu. Ces requêtes sont évaluées par des query workflows qui coordonnent les services de données et de calcul. L’exécution d’un query workflow doit respecter un contrat de niveau de service (Service Level Agreement) qui définit l’objectif d’optimisation en termes de qualité de service attendue. L’objectif d’optimisation est representé par un vecteur d’attributs de coût pondérés tels que le prix, le temps, l’énergie, etc. Les poids définissent les préférences parmi les attributs de coût pour permettre la comparaison entre query workflows.

L’optimisation de requêtes hybrides consiste à déterminer le meilleur query workflow satisfaisant le contrat SLA. Notre approche pour générer l’espace de recherche de query workflows, l’estimation de coût, et l’espace de solutions vise donc à satisfaire des contrats SLA. Nos principaux résultats sont : (1) la génération de l’espace de recherche compte-tenu à la fois du flot de contrôle et du flux de données des query workflows, (2) une fonction de coût qui tient compte de l’absence de paramètres asociés aux données, et (3) l’adaptation d’un algorithme top-k pour sélectionner les query workflows appropriés pour un SLA donné.


Mots-clés : Services de données, coordination de services, optimisation de requêtes, Service Level Agreement, workflows

In this work we tackle the problem of optimizing hybrid queries over data produced by data services either on-demand or continuously. Such queries are implemented by query workflows that coordinate data and computing services. The execution of query workflows has to respect Service Level Agreement contracts that define the optimization objective in terms of the expected quality of service. The optimization objective is described by a vector of weighted cost attributes such as the price, the time, the energy, etc. The weights define the preferences among the cost attributes for enabling the comparison among query workflows.

In this context, the hybrid query optimization is about to find the query workflow that best conforms the SLA contract. Our approach for generating the search space of query workflows, the cost estimation, and the solution space is therefore oriented to satisfy SLA contracts. Our main results are: (1) the generation of the search space considering both control-flow and data-flow of query workflows, (2) a cost function that considers the absence of data-related parameters, and (3) the adaptation of a top-k algorithm for selecting the suitable query workflows for a given SLA.