Lhc et big data

Gestion informatique Lors du fonctionnement normal de la machine, trente millions de croisements entre les paquets de protons de l’accélérateur auront lieu chaque seconde dans chaque détecteur des quatre expériences du LHC (Alice, Atlas, CMS et LHCb). Chaque croisement générant des collisions de particules qui créent alors une multitude de particules secondaires (plus de 6 000 traces reconstituées par événement ion-lourds38 dans un détecteur tel que CMS).

Le flot de données résultant est bien au-delà des capacités de traitement et de stockage actuelles, c’est pourquoi les vénements produits sont traités en ligne par des processus de S. v. p page déclenchements rapi intéressants avant m détecteur. Cependant, même a que quelques événe nements jugés peu soient sorties du ction qui ne retient Its, cela fait encore de quelques dizaines à quelques centaines d’événements par seconde, pesant chacun de l’ordre d’un mégaoctet pour les données brutes (quelques centaines de kilooctets pour les données reconstruites) qu’il s’agit de stocker puis d’analyser39.

Au total, ce seront environ quinze pétaoctets de données qui evront être enregistrés et analysés chaque année par le système informatique associé au LHC40. ce CERN ne dispo Sv. ‘ipe to disposant pas à lui seul d’une puissance suffisante de calcul, les instituts et les physiciens travaillant à ce projet étant répartis sur toute la planète, on a choisi de répartir les données dans le monde entier pour les analyses et de créer une couche logicielle (la grille) pour ce faire41 . La grille informatique du LHC La grille de calcul du LHC a été nommée WLCG (Worldwide LHC Computing Grid)42.

D’un point de vue matériel, elle est composée e plusieurs dizaines de milliers d’ordinateurs, de plusieurs dizaines de pétaoctets de stockage disque et bandes répartis dans plus d’une centaine de centres de calcul dans le monde. Cet ensemble matériel est coordonné par l’infrastructure logicielle gLite (intergiclel – en anglais middleware – de grille). Cette grille est hiérarchisée en Tiers (niveaux) afin de répartir les rôles entre les différents centres de calcul impliqués dans WLCG.

NIVEAIJ O (CERN): le centre de calcul du Cern récupère les données brutes produites par les détecteurs, les stocke et les edistribue vers les centres du niveau 1 NIVEAU 1 (1 Igrands centres): disponibles 24 heures sur 24 pour la gestion initiale reçoivent chacun une fraction des données brutes (stockage) reconstruction et re-reconstruction (alignements, calibrations) mise à disposition des données résumées aux centres d’analyse (niveau2) LES NIVEAUX 2 (38 réseaux de plus petits partout sur la plan 2 centres d’analyse (niveau2) LES NIVEAUX 2 (38 réseaux de plus petits partout sur la planète): analyse des données à production des ROOTup finaux retour des sorties vers les niveau 1 SUR QUOI REPOSE LA GRILLE? Le matériel informatique Chaque centre de calcul gère de nombreux ordinateurs et systèmes de stockage. L’installation et la mise à jour manuelle et régulière des logiciels est un travail Intensif, raison pour laquelle des systèmes de gestion, tels que Quattor (développe au CERN), réalisent ces opérations automatiquement.