Petasky

Le LPC a accentué son implication dans la partie Data Management (DM) de LSST en initiant des collaborations inter-disciplinaires au niveau national avec des laboratoires spécialisés dans les technologies de l’information et ceux de l’IN2P3. Le projet Petasky, financé par la mission du CNRS pour l’inter-disciplinarité, étudie les aspects liés aux gros volumes de données (Big Data) issus des relevés astronomiques. Il s’agit de répondre aux défis technologiques attachés à l’accès efficace aux données, à l’impact de la taille des ensembles à traiter sur les méthodes de fouilles dans les catalogues, aux problèmes de visualisation. Les contributions principales du LPC ont concerné les défis liés à l’accès aux données.

Une alternative à Qserv a été testée en considérant les aspects organisation et partage des données comme des problèmes plus généraux d’intégration de données. L’une des limites de Qserv réside dans le traitement non optimal des requêtes soumises aux bases de données. Un prototype de réécriture des requêtes été mis en place et a permis de montrer que la limitation de l’approche d’intégration des données résidait dans certaines insuffisances des systèmes de gestion des bases de données.

Le LPC a également mis en place un ensemble de ressources informatiques disponibles pour les études de ses partenaires. La conclusion de l’utilisation de ces plateformes est qu’il n’existe pas, à ce jour, de structure adaptée au niveau national pour étudier les gros volumes de données. Le principal problème des outils existants (grid5000, cloud, …) réside dans l’impossibilité de garder la trace des données dans le système lorsque le traitement est achevé. Ce défaut majeur pour les Big Data pourrait être corrigé par la construction d’une plateforme de recherche dédiée au traitement de gros volumes de données issus par exemple de l’astronomie. Cette plateforme sera construite au mésocentre informatique de l’université de Clermont-Ferrand (CCRI), financée par le Contrat de Plan Etat Région (CPER) Audaces.

Ce travail interdisciplinaire pionnier a suscité l’émergence d’autres projets: BigSkyEarth, action interdisciplinaire du COST (European Cooperation in Science and Technology), a vu le jour en 2015 et s’attachera à l’étude des problématiques liées aux Big Data dans les domaines de l’astronomie et des sciences de la terre. Le LPC fut l’un des promoteurs de cette action, et l’un de ses membres siège au comité directeur. Cette évolution fait suite à un travail d’intégration déjà initié dans Petasky, lors de l’accueil des astronomes de Corot et de Gaïa.