Des milliers de noms, autant d’adresses et de numéros de téléphone. Un fichier clients peut vite atteindre un volume astronomique de l’ordre du pétaoctet (un million de milliards d’octets).
À l’Inria, l’équipe de recherche KerData, présentée à l’assemblée générale du pôle Image et Réseaux, le 6 avril, se penche depuis juillet dernier sur la gestion de ces données gargantuesques.
« Les systèmes de stockage classiques dupliquent souvent les données, afin de pouvoir écrire sur l’une des copies – entrer les mises à jour par exemple – et lire les données sur l’autre. Cela double l’espace nécessaire ! D’autres systèmes bloquent l’écriture pendant la lecture et vice-versa, avec une baisse de performance. Notre méthode consiste à exécuter ces deux tâches en même temps, sur les mêmes données. » Lors des tests préliminaires, les techniques développées par KerData se sont montrées plus efficaces que la plate-forme Hadoop développée par Yahoo!, qui fait office de référence pour le traitement massivement parallèle des données à l’heure actuelle : le gain en temps de lecture est de l’ordre de 30% ! « Nous voudrions intégrer notre solution dans les plates-formes de cloud computing, qui louent de l’espace à distance pour stocker et traiter des données. »
Gabriel Antoniu
Tél. 02 99 84 72 44
Gabriel.Antoniu@inria.fr
Ajouter un commentaire