»Ich brauche sofort 100 CPUs für meinen Rechenjob!«
Zum Glück steht ein HPC-Cluster mit hunderten Servern und tausenden CPUs bereit.
Wie verwaltet man nun aber solche Mengen an Hardware-Ressourcen möglichst effizient und fair?
Dieser Vortrag behandelt genau diese Thematik im Zusammenhang mit dem Job-Organisator SLURM.
Folgende Schwerpunkte werden behandelt:
- Was ist Job-Scheduling und wann benötigen wir es?
- Warum SLURM ? Was sind die Alternativen ?
- Anwendungsbeispiele und Demonstrationen anhand einer fiktiven Universität