Analysing colliding particles with 256 Threads - Performance of an embarrassingly parallel problem on the Intel Xeon Phi Knights Landing

chrysh

Playlists: 'mrmcd17' videos starting here / audio / related events

Ich habe ein Jahr lang am CERN meine Masterarbeit zum Thema Vektorisierung/Parallelisierung eines CERN-Photon-Pattern-Recognition-Algorithmus geschrieben. Das Hauptaugenmerk lag auf Optimierung der Performance durch Vektorisierung/Parallelisierung, sodass der Algorithmus auf einem Intel Xeon Phi Knights Landing (64 Kerne à 4 Hyperthreads) möglichst performant läuft.

Kurz gesagt, ich habe versucht ein "inherently embarrassingly parallel problem" mit OpenMP, Vector libraries, Variablen im Speicher an Cacheline-Grenzen ausrichten, Mathe-Tricks, etc so schnell wie möglich zu kriegen.

Dieser Vortrag gibt eine Einführung in die Welt der manycore-Systeme aus Sicht eines Informatikers.

Download

Related

Embed

Share:

Tags