Advanced search options

Advanced Search Options 🞨

Browse by author name (“Author name starts with…”).

Find ETDs with:

in
/  
in
/  
in
/  
in

Written in Published in Earliest date Latest date

Sorted by

Results per page:

Sorted by: relevance · author · university · dateNew search

You searched for +publisher:"Université Paris-Sud – Paris XI" +contributor:("Baboulin, Marc"). Showing records 1 – 2 of 2 total matches.

Search Limiters

Last 2 Years | English Only

No search limiters apply to these results.

▼ Search Limiters


Université Paris-Sud – Paris XI

1. Rémy, Adrien. Solving dense linear systems on accelerated multicore architectures : Résoudre des systèmes linéaires denses sur des architectures composées de processeurs multicœurs et d’accélerateurs.

Degree: Docteur es, Informatique, 2015, Université Paris-Sud – Paris XI

Dans cette thèse de doctorat, nous étudions des algorithmes et des implémentations pour accélérer la résolution de systèmes linéaires denses en utilisant des architectures composées de processeurs multicœurs et d'accélérateurs. Nous nous concentrons sur des méthodes basées sur la factorisation LU. Le développement de notre code s'est fait dans le contexte de la bibliothèque MAGMA. Tout d'abord nous étudions différents solveurs CPU/GPU hybrides basés sur la factorisation LU. Ceux-ci visent à réduire le surcoût de communication dû au pivotage. Le premier est basé sur une stratégie de pivotage dite "communication avoiding" (CALU) alors que le deuxième utilise un préconditionnement aléatoire du système original pour éviter de pivoter (RBT). Nous montrons que ces deux méthodes surpassent le solveur utilisant la factorisation LU avec pivotage partiel quand elles sont utilisées sur des architectures hybrides multicœurs/GPUs. Ensuite nous développons des solveurs utilisant des techniques de randomisation appliquées sur des architectures hybrides utilisant des GPU Nvidia ou des coprocesseurs Intel Xeon Phi. Avec cette méthode, nous pouvons éviter l'important surcoût du pivotage tout en restant stable numériquement dans la plupart des cas. L'architecture hautement parallèle de ces accélérateurs nous permet d'effectuer la randomisation de notre système linéaire à un coût de calcul très faible par rapport à la durée de la factorisation. Finalement, nous étudions l'impact d'accès mémoire non uniformes (NUMA) sur la résolution de systèmes linéaires denses en utilisant un algorithme de factorisation LU. En particulier, nous illustrons comment un placement approprié des processus légers et des données sur une architecture NUMA peut améliorer les performances pour la factorisation du panel et accélérer de manière conséquente la factorisation LU globale. Nous montrons comment ces placements peuvent améliorer les performances quand ils sont appliqués à des solveurs hybrides multicœurs/GPU.

In this PhD thesis, we study algorithms and implementations to accelerate the solution of dense linear systems by using hybrid architectures with multicore processors and accelerators. We focus on methods based on the LU factorization and our code development takes place in the context of the MAGMA library. We study different hybrid CPU/GPU solvers based on the LU factorization which aim at reducing the communication overhead due to pivoting. The first one is based on a communication avoiding strategy of pivoting (CALU) while the second uses a random preconditioning of the original system to avoid pivoting (RBT). We show that both of these methods outperform the solver using LU factorization with partial pivoting when implemented on hybrid multicore/GPUs architectures. We also present new solvers based on randomization for hybrid architectures for Nvidia GPU or Intel Xeon Phi coprocessor. With this method, we can avoid the high cost of pivoting while remaining numerically stable in most cases. The highly parallel architecture of these accelerators…

Advisors/Committee Members: Baboulin, Marc (thesis director).

Subjects/Keywords: Systèmes linéaires denses; Factorisation LU; Bibliothèques logicielles pour l’algèbre linéaire dense; Bibliothèque MAGMA; Calcul hybride multicœur/GPU; Processeurs graphiques; Intel Xeon Phi; . ccNUMA; Communication-avoiding; Randomisation; Placement des processus légers; Dense linear systems; LU factorization; Dense linear algebra libraries; MAGMA library; Hybrid multicore/GPU computing; Graphics process units; Intel Xeon Phi; . ccNUMA; Communication-avoiding algorithms; Randomization; Thread placement

Record DetailsSimilar RecordsGoogle PlusoneFacebookTwitterCiteULikeMendeleyreddit

APA · Chicago · MLA · Vancouver · CSE | Export to Zotero / EndNote / Reference Manager

APA (6th Edition):

Rémy, A. (2015). Solving dense linear systems on accelerated multicore architectures : Résoudre des systèmes linéaires denses sur des architectures composées de processeurs multicœurs et d’accélerateurs. (Doctoral Dissertation). Université Paris-Sud – Paris XI. Retrieved from http://www.theses.fr/2015PA112138

Chicago Manual of Style (16th Edition):

Rémy, Adrien. “Solving dense linear systems on accelerated multicore architectures : Résoudre des systèmes linéaires denses sur des architectures composées de processeurs multicœurs et d’accélerateurs.” 2015. Doctoral Dissertation, Université Paris-Sud – Paris XI. Accessed December 09, 2019. http://www.theses.fr/2015PA112138.

MLA Handbook (7th Edition):

Rémy, Adrien. “Solving dense linear systems on accelerated multicore architectures : Résoudre des systèmes linéaires denses sur des architectures composées de processeurs multicœurs et d’accélerateurs.” 2015. Web. 09 Dec 2019.

Vancouver:

Rémy A. Solving dense linear systems on accelerated multicore architectures : Résoudre des systèmes linéaires denses sur des architectures composées de processeurs multicœurs et d’accélerateurs. [Internet] [Doctoral dissertation]. Université Paris-Sud – Paris XI; 2015. [cited 2019 Dec 09]. Available from: http://www.theses.fr/2015PA112138.

Council of Science Editors:

Rémy A. Solving dense linear systems on accelerated multicore architectures : Résoudre des systèmes linéaires denses sur des architectures composées de processeurs multicœurs et d’accélerateurs. [Doctoral Dissertation]. Université Paris-Sud – Paris XI; 2015. Available from: http://www.theses.fr/2015PA112138


Université Paris-Sud – Paris XI

2. Wang, Yushan. Solving incompressible Navier-Stokes equations on heterogeneous parallel architectures : Résolution des équations de Navier-Stokes incompressibles sur architectures parallèles hétérogènes.

Degree: Docteur es, Informatique, 2015, Université Paris-Sud – Paris XI

Dans cette thèse, nous présentons notre travail de recherche dans le domaine du calcul haute performance en mécanique des fluides. Avec la demande croissante de simulations à haute résolution, il est devenu important de développer des solveurs numériques pouvant tirer parti des architectures récentes comprenant des processeurs multi-cœurs et des accélérateurs. Nous nous proposons dans cette thèse de développer un solveur efficace pour la résolution sur architectures hétérogènes CPU/GPU des équations de Navier-Stokes (NS) relatives aux écoulements 3D de fluides incompressibles.Tout d'abord nous présentons un aperçu de la mécanique des fluides avec les équations de NS pour fluides incompressibles et nous présentons les méthodes numériques existantes. Nous décrivons ensuite le modèle mathématique, et la méthode numérique choisie qui repose sur une technique de prédiction-projection incrémentale.Nous obtenons une distribution équilibrée de la charge de calcul en utilisant une méthode de décomposition de domaines. Une parallélisation à deux niveaux combinée avec de la vectorisation SIMD est utilisée dans notre implémentation pour exploiter au mieux les capacités des machines multi-cœurs. Des expérimentations numériques sur différentes architectures parallèles montrent que notre solveur NS obtient des performances satisfaisantes et un bon passage à l'échelle.Pour améliorer encore la performance de notre solveur NS, nous intégrons le calcul sur GPU pour accélérer les tâches les plus coûteuses en temps de calcul. Le solveur qui en résulte peut être configuré et exécuté sur diverses architectures hétérogènes en spécifiant le nombre de processus MPI, de threads, et de GPUs.Nous incluons également dans ce manuscrit des résultats de simulations numériques pour des benchmarks conçus à partir de cas tests physiques réels. Les résultats obtenus par notre solveur sont comparés avec des résultats de référence. Notre solveur a vocation à être intégré dans une future bibliothèque de mécanique des fluides pour le calcul sur architectures parallèles CPU/GPU.

In this PhD thesis, we present our research in the domain of high performance software for computational fluid dynamics (CFD). With the increasing demand of high-resolution simulations, there is a need of numerical solvers that can fully take advantage of current manycore accelerated parallel architectures. In this thesis we focus more specifically on developing an efficient parallel solver for 3D incompressible Navier-Stokes (NS) equations on heterogeneous CPU/GPU architectures. We first present an overview of the CFD domain along with the NS equations for incompressible fluid flows and existing numerical methods. We describe the mathematical model and the numerical method that we chose, based on an incremental prediction-projection method.A balanced distribution of the computational workload is obtained by using a domain decomposition method. A two-level parallelization combined with SIMD vectorization is used in our implementation to take advantage of the current distributed…

Advisors/Committee Members: Baboulin, Marc (thesis director), Le Maître, Olivier P. (thesis director).

Subjects/Keywords: Équations de Navier-Stokes; Méthode de prédiction-projection; Calcul haute performance; Parallélisation multi-niveaux; Calcul sur GPU; Navier-Stokes equations; Prediction-projection method; Helmholtz solver; Poisson solver; High performance computing; Multi-level parallelization; GPU computing

Record DetailsSimilar RecordsGoogle PlusoneFacebookTwitterCiteULikeMendeleyreddit

APA · Chicago · MLA · Vancouver · CSE | Export to Zotero / EndNote / Reference Manager

APA (6th Edition):

Wang, Y. (2015). Solving incompressible Navier-Stokes equations on heterogeneous parallel architectures : Résolution des équations de Navier-Stokes incompressibles sur architectures parallèles hétérogènes. (Doctoral Dissertation). Université Paris-Sud – Paris XI. Retrieved from http://www.theses.fr/2015PA112047

Chicago Manual of Style (16th Edition):

Wang, Yushan. “Solving incompressible Navier-Stokes equations on heterogeneous parallel architectures : Résolution des équations de Navier-Stokes incompressibles sur architectures parallèles hétérogènes.” 2015. Doctoral Dissertation, Université Paris-Sud – Paris XI. Accessed December 09, 2019. http://www.theses.fr/2015PA112047.

MLA Handbook (7th Edition):

Wang, Yushan. “Solving incompressible Navier-Stokes equations on heterogeneous parallel architectures : Résolution des équations de Navier-Stokes incompressibles sur architectures parallèles hétérogènes.” 2015. Web. 09 Dec 2019.

Vancouver:

Wang Y. Solving incompressible Navier-Stokes equations on heterogeneous parallel architectures : Résolution des équations de Navier-Stokes incompressibles sur architectures parallèles hétérogènes. [Internet] [Doctoral dissertation]. Université Paris-Sud – Paris XI; 2015. [cited 2019 Dec 09]. Available from: http://www.theses.fr/2015PA112047.

Council of Science Editors:

Wang Y. Solving incompressible Navier-Stokes equations on heterogeneous parallel architectures : Résolution des équations de Navier-Stokes incompressibles sur architectures parallèles hétérogènes. [Doctoral Dissertation]. Université Paris-Sud – Paris XI; 2015. Available from: http://www.theses.fr/2015PA112047

.