Un serveur de données de classe mondiale pour amplifier le superordinateur de Clemson
CLEMSON, Caroline du Sud – Cela peut sembler une boîte simple, mais le serveur DGX-2 contient la technologie qui permet d’améliorer les performances informatiques à un niveau jamais vu auparavant.
Grâce au travail de six membres du corps professoral du College of Science et du College of Engineering, Computing and Applied Sciences, l'Université Clemson recevra son propre serveur DGX-2 dans les prochains mois. Financé par une subvention de 316 000 dollars du programme d’instrumentation de recherche de l’université de la défense du Bureau de la recherche navale du ministère de la Défense, ce serveur aidera les professeurs et les étudiants de Clemson qui résolvent les plus grands défis de demain en utilisant le Big Data.
Le DGX-2 combine la technologie de l’UC avec le tout dernier circuit GPU (Graphics Processing Unit).
Crédit d'image: NVIDIA
Apprentissage automatique, intelligence artificielle, science des données: le «big data» revêt de nombreuses branches, mais chacune est ancrée dans le même objectif consistant à utiliser de vastes ensembles de données complexes dans des problèmes appliqués dans des domaines aussi variés que le gouvernement, les soins de santé, l'ingénierie et la fabrication. La résolution des problèmes de données volumineuses, décomposés en modèles mathématiques ou statistiques, nécessite une architecture informatique et des logiciels plusieurs fois plus puissants que les ordinateurs portables classiques.
Heureusement, l'Université Clemson possède l'un des quatre supercalculateurs d'une institution publique: le cluster Palmetto, hébergé au laboratoire de recherche sur les matériaux de pointe (Advanced Materials Research Laboratory) à Pendleton. Le cluster Palmetto utilise plus de 23 000 cœurs d'unités centrales, les circuits «cérébraux» d'un ordinateur pouvant effectuer des trillions d'opérations mathématiques par seconde. Exploité sur un système de copropriété démocratisé, tout professeur, membre du personnel ou étudiant de Clemson peut créer un compte et utiliser gratuitement Palmetto Cluster, un avantage qui met les étudiants de Clemson en avantage.
«Pour vous donner une idée de la place qu'occupe actuellement le calcul dans les sciences mathématiques, j'ai un étudiant qui a travaillé sur un problème de modélisation spatio-temporelle qui prend un ordinateur très puissant en une semaine et demie pour résoudre le problème», a déclaré Christopher McMahan. , professeur associé à la Faculté des sciences mathématiques et statistiques. «J'ai des étudiants de troisième cycle qui, sans le cluster Palmetto, ne seraient pas en mesure d'écrire leurs mémoires en raison de la nature même du calcul.»
Avec l’ajout du serveur DGX-2, les capacités de calcul de l’Université Clemson seront renforcées grâce à la puissance de calcul la plus avancée disponible, combinant la technologie de l’UC avec celle des circuits de l’unité de traitement graphique (GPU).
Commercialisé par NVIDIA, le serveur fonctionne sur le principe de l’informatique parallèle en scindant une tâche importante en milliers de tâches plus petites, chacune étant prise en charge par un processeur graphique différent. À lui seul, un seul GPU ne sera jamais comparable à la capacité informatique d’un seul processeur, mais la puissance du DGX-2 vient de ses chiffres, a déclaré McMahan. Il compare le processus à l'écoulement de l'eau à travers une passoire.
«Vous déversez de l’eau dans un baril et un processeur serait un tuyau. Cette eau coule dans ce tuyau, et il y en a tellement qu’elle devient bouchée. Il ne peut passer dans le tuyau que si vite, alors qu'un GPU serait comme une passoire. Chaque trou traversé par l'eau est plus petit, mais il y en a plus, de sorte que plus d'eau puisse le traverser », a déclaré McMahan. «C’est littéralement la différence entre un processeur et un processeur GPU. C’est le 1-en-1000 où les GPU gagnent. "
Le DGX-2 est doté de 24 cœurs de processeur et de 16 puces GPU de pointe, spécialement conçus pour un calcul rapide et hautes performances. Le serveur peut atteindre une vitesse de traitement de 2 pétaFLOP, soit 2 000 trillions d'opérations en virgule flottante par seconde. En d’autres termes, le DGX-2 est vite, capable de réaliser des milliards de calculations par seconde en tant que serveur le plus récent et le meilleur au monde sur le marché de la superinformatique scientifique.
L'équipe chargée de la proposition, dans le sens des aiguilles d'une montre à partir de la gauche: Yiqiang Han, Yuyuan «Lance» Ouyang, Qingshan Chen, Boshi Yang, Christopher McMahan et Cole Smith.
Crédit d'image: College of Science
Les membres du corps professoral de Clemson qui bénéficient de la subvention pour l’achat du DGX-2 représentent de nombreux domaines de recherche – calcul mathématique, statistiques, recherche opérationnelle, ingénierie mécanique et industrielle, par exemple – mais soutiennent que le serveur peut être utilisé dans diverses disciplines. tant que la question analysée est informatique et peut être divisée pour une plateforme de calcul intensif.
Pour cette raison, Yuyuan “Lance” Ouyang, professeur adjoint à la Faculté de mathématiques et de statistique et chercheur principal chargé de la proposition de subvention, a déclaré que toute l'université bénéficierait de la présence du DGX-2, en particulier des étudiants diplômés qui entrent dans une marché du travail de streaming de données de plus en plus orienté technologie.
«Lorsque nos étudiants entrent sur le marché du travail, les employeurs souhaitent qu’ils aient une certaine expérience des applications d’apprentissage en profondeur pratiques et à la pointe de la technologie, ce qui nécessite du matériel. Maintenant, il y a cette ressource de calcul de marque supérieure que nous avons réellement dans notre université. Les étudiants pourront acquérir leur expérience avec le DGX-2 et, lorsqu'ils entreront sur le marché du travail, ils pourront vraiment avoir confiance en la théorie de l’apprentissage automatique, mais également en ce qui concerne le codage et le fonctionnement des applications. plate-forme d’apprentissage en profondeur », a déclaré Ouyang. "Cette expérience est géniale pour eux."
«Toute une génération d’étudiants issus de nos programmes sauront utiliser les plates-formes de calcul de pointe, et la plupart des diplômés ne sortent pas de cela en dehors d’un département d’informatique. mis à part dans ce contexte », a ajouté McMahan.
La livraison de la DGX-2 est prévue dans les mois à venir, après quoi l'équipe de proposition de subvention sera la première à recevoir une formation sur la plate-forme. Après une période d’embargo, le modèle de copropriété de l’université ouvrira le DGX-2 à tous les professeurs et étudiants de Clemson menant des recherches en big data.
L’équipe chargée de la proposition – Ouyang, McMahan, Qingshan Chen (Sciences mathématiques et statistiques), Yiqiang Han (génie mécanique), Cole Smith (génie industriel) et Boshi Yang (Sciences mathématiques et statistiques) – reconnaît le Centre de conseil en statistique et en mathématiques, Clemson. Operations Research Institute et Clemson Computing and Information Technology (CCIT) pour avoir collaboré à la subvention DURIP afin d’amener le DGX-2 sur le campus.
FIN
Ce matériel est financé par le Programme d’instrumentation de recherche de l’université de la défense (DURIP) de l’Office de la recherche navale du Département de la défense, sous le numéro N00014-19-1-2295. Les opinions, conclusions, conclusions et recommandations exprimées dans ce document sont celles des chercheurs et ne reflètent pas nécessairement les vues de l'Office of Naval Research.







Commentaires
Laisser un commentaire