FAQ

Übersicht

Zugang

Wie beantrage ich Clusternutzung?
Muss ich für die Clusternutzung Geld zahlen?
Mein Lehrstuhl ist Teil einer Industriekooperation, kann ich Ihre Systeme nutzen?
Verfügt das ZIMT über GPU-Knoten?
Wann kommt der neue Cluster?

Rechnungen

Warum muss ich meine eigenen Jobskripte erstellen und SLURM-Optionen lernen, kann man das nicht automatisieren?
Ich habe eine dringende Deadline, können Sie meine Priorität erhöhen?
Nutzer X kommt vor mir dran, obwohl mein Job läger in der Warteschlange steht!
Kann ich Rechenzeit reservieren?
Hilfe, mein Job ist abgebrochen!

Software

Welche Software ist auf dem Cluster installiert?
Können Sie bitte Software X installieren?
Können Sie bitte Software Y updaten?

Dateien

Hilfe, ich habe aus Versehen Dateien aus meinem Home-Verzeichnis gelöscht!
Hilfe, mein Workspace ist abgelaufen!

Zugang

Wie beantrage ich Clusternutzung?

Den Vorgang beschreiben wir hier für Mitarbeiter und hier für Studierende. (Zurück zur Übersicht)

Muss ich für die Clusternutzung Geld zahlen?

Nein, alle Angehörigen der Uni Siegen (Studierende wie Mitarbeiter) können den Cluster nutzen, ohne dass sie Geld bezahlen müssen. Eventuell müssen Sie sich für die Nutzung bestimmter Software z.B. Abaqus an den Lizenzgebühren beteiligen, in diesen Fällen wird Ihnen beim Laden des Moduls eine Warnung angezeigt. (Zurück zur Übersicht)

Mein Lehrstuhl ist Teil einer Industriekooperation, kann ich Ihre Systeme nutzen?

Nein, industriefinanzierte Projekte dürfen unsere Rechenressourcen leider nicht nutzen. (Zurück zur Übersicht)

Verfügt das ZIMT über GPU-Knoten?

Ja, der OMNI-Cluster verfügt über 10 Knoten mit insgesamt 24 GPUs vom Typ nVidia Tesla V100, mehr dazu hier. (Zurück zur Übersicht)

Wann kommt der neue Cluster?

Der OMNI-Cluster ist am 8.3.2021 für den allgemeinen Betrieb geöffnet worden. (Zurück zur Übersicht)

Rechnungen

Warum muss ich meine eigenen Jobskripte erstellen und SLURM-Optionen lernen, kann man das nicht automatisieren?

Auch wenn man den Prozess des Schreibens von Jobskripten und Einstellen von Jobs noch mehr vereinfachen oder automatisieren könnte, haben wir uns entschieden, dies in den meisten Fällen nicht zu unterstützen. Das liegt daran, dass Sie sich die begrenzten Ressourcen des Clusters mit allen anderen Nutzern teilen und wir Sie dazu bringen möchten, sich ein Grundverständnis anzueignen und sich über Ihre Ressourcennutzung Gedanken zu machen. (Zurück zur Übersicht)

Ich habe eine dringende Deadline, können Sie meine Priorität erhöhen?

Nein. Die Kapazität des Clusters ist begrenzt, und der Scheduler SLURM stellt Jobs nach einem Fair-Share-/Backfilling-Algorithmus ein, der für alle die geringste Wartezeit gewährleistet. Es ist unsere erklärte Politik, nicht in dieses System einzugreifen. (Zurück zur Übersicht)

Nutzer X kommt vor mir dran, obwohl mein Job läger in der Warteschlange steht!

Der von SLURM verwendete Algorithmus zur Priorisierung hat vier Hauptkriterien:

  • Fair Share: wenn ein Nutzer in kurzer Zeit viele Ressourcen (d.h. viel CPU-Zeit) verbraucht, sinkt die Priorität für folgende Jobs. Dieses Kriterium ist mit Abstand am stärksten gewichtet.
  • Alter: je länger ein Job in der Warteschlange steht, desto höher die Priorität
  • Jobgröße: große Jobs werden leicht bevorzugt, um die längere Wartezeit zu kompensieren
  • Backfilling: nachdem die Jobs nach den obigen drei Kriterien sortiert sind, füllt SLURM eventuelle Lücken mit kleineren Jobs, die somit früher drankommen.

Sie können sich die Prioritäten mit dem Befehl sprio anzeigen lassen. (Zurück zur Übersicht)

Kann ich Rechenzeit reservieren?

Für reguläre Rechenjobs nicht. In Ausnahmefällen richten wir Reservierungen für bestimmte Lehrveranstaltungen ein, damit die Teilnehmer während der Lehrveranstaltung ihre Jobs direkt laufen lassen können. Bitte kontaktieren Sie uns, wenn Sie daran Interesse haben. (Zurück zur Übersicht)

Hilfe, mein Job ist abgebrochen!

Dies kann viele verschiedene Ursachen haben. Zuallererst sollten Sie im SLURM-Logfile nach Fehlermeldungen sehen (vor allem am Schluss des Logfiles). Wenn Ihr Job mit der Meldung “not enough memory” abgebrochen ist, haben Sie eventuell in den SLURM-Einstellungen zu wenig RAM angefordert (Option --mem), mehr dazu hier.

Wenn Sie den Fehler nicht erkennen können, schicken Sie das Logfile und das Jobskript mit einer Beschreibung des Problems an hpc-support@uni-siegen.de. (Zurück zur Übersicht)

Software

Welche Software ist auf dem Cluster installiert?

Unter Anwendungssoftware finden Sie eine Übersicht der installierten Software und unter Programmiersprachen eine Übersicht der installierten Compiler und Interpreter. Wenn Sie bereits Clusterzugang haben, können Sie sich mit module avail die installierten Module anzeigen lassen (Achtung: eventuell darf eine Software nicht von allen Uni-Angehörigen oder nur gegen Gebühr genutzt werden, in diesem Fall erhalten Sie eine Warnung beim Laden des Moduls). (Zurück zur Übersicht)

Können Sie bitte Software X installieren?

Wir entscheiden von Fall zu Fall, ob wir etwas installieren. Kommen Sie am besten in unsere Sprechstunde oder kontaktieren Sie uns per Email. (Zurück zur Übersicht)

Können Sie bitte Software Y updaten?

Wir entscheiden von Fall zu Fall, ob wir Software updaten. Um den Wartungaufwand überschaubar zu halten, sowie um Kompatibilität und Sicherheit zu gewährleisten, installieren wir Software nur aus bestimmten Quellen (wie z.B. dem Software-Repository des Betriebssystemherstellers), in denen nicht immer die neuesten Versionen verfügbar sind. (Zurück zur Übersicht)

Dateien

Hilfe, ich habe aus Versehen Dateien aus meinem Home-Verzeichnis gelöscht!

Es werden automatisch tägliche Snapshots Ihres Home-Verzeichnisses erstellt. Wenn Sie nicht zu lange warten (höchstens 30 Tage), können Sie die Dateien selbst wiederherstellen. Wie Sie das tun können, ist hier beschrieben. (Zurück zur Übersicht)

Hilfe, mein Workspace ist abgelaufen!

In den ersten 10 Tagen nach dem Ablaufen Ihres Workspaces können Sie ihn selbst wiederherstellen, wie Sie das tun ist hier beschrieben. (Zurück zur Übersicht)

Aktualisiert um 12:46 am 7. Mai 2018 von Gerd Pokorra