Ich habe ein Jahr lang am CERN meine Masterarbeit zum Thema Vektorisierung/Parallelisierung eines CERN-Photon-Pattern-Recognition-Algorithmus geschrieben. Das Hauptaugenmerk lag auf Optimierung der Performance durch Vektorisierung/Parallelisierung, sodass der Algorithmus auf einem Intel Xeon Phi Knights Landing (64 Kerne à 4 Hyperthreads) möglichst performant läuft.
Kurz gesagt, ich habe versucht ein "inherently embarrassingly parallel problem" mit OpenMP, Vector libraries, Variablen im Speicher an Cacheline-Grenzen ausrichten, Mathe-Tricks, etc so schnell wie möglich zu kriegen.
Dieser Vortrag gibt eine Einführung in die Welt der manycore-Systeme aus Sicht eines Informatikers.