Die folgende Anleitung ist für neue Nutzerinnen und Nutzer unseres Clusters gedacht. Sie erklärt einige Grundbegriffe und enthält Links zu weiterführenden Informationen. Im Einzelnen wird erklärt, was ein Cluster ist, wie sich die Benutzung von einem normalen Computer unterscheidet, wie Sie Zugang zum Cluster bekommen und wohin Sie sich bei Fragen wenden können.

Was ist ein Cluster?

Ein Cluster ist in erster Linie ein großer Computer, der aus vielen kleineren Computern zusammengeschaltet wurde. Ein Cluster teilt sich auf in sogenannte Knoten (Nodes), von denen jeder seinen eigenen Arbeitsspeicher und eine bestimmte Anzahl Prozessoren, auch Kerne genannt, hat. Der OMNI-Cluster hat beispielsweise etwa 450 Compute-Knoten, auf denen Rechnungen laufen, 4 Login-Knoten, die für Nutzer direkt erreichbar sind, und eine Reihe von spezialisierten Knoten. Die normalen Compute-Knoten haben 64 CPU-Kerne und 256 GB Arbeitsspeicher, eine detailliertere Auflistung finden Sie hier. Die einzelnen Knoten haben beim OMNI-Cluster keine eigenen Festplatten, sondern teilen sich ein zentrales Dateisystem.

Das ZIMT betreibt derzeit noch den HoRUS-Cluster, der nach einer Übergangsphase durch den OMNI-Cluster ersetzt wird.

Linux

Unser Cluster wird, wie praktisch alle Cluster, mit Linux betrieben. Wenn Sie Linux (noch) nicht so gut beherrschen, bieten wir mehrere Möglichkeiten, sich einzuarbeiten.

Erstens bieten wir jedes Semester einen Linux-Einführungskurs an, abwechselnd in deutsch und englisch. Unser Linux-Kurs findet in der Regel gegen Ende der Vorlesungszeit statt. Eine Übersicht über unsere Schulungstermine finden Sie hier.

Zweitens hat das ZIMT in Zusammenarbeit mit anderen Unis in NRW die HPC-Wiki erstellt. Auf der HPC-Wiki finden Sie ein Video-Tutorial zu Linux, das vom Inhalt her ähnlich unserem Linux-Einführungskurs ist.

Schließlich beschreiben wir auf dieser Seite einige Grundbegriffe von Linux.

Unterschiede zwischen Cluster und normalem Rechner

Viele Sachen an einem Cluster sind identisch mit jedem anderen (Linux-)Rechner. Es gibt allerdings auch Unterschiede. Der wichtigste Unterschied ist der, dass Sie nicht vor dem Cluster selbst sitzen, sondern sich von einem anderen Computer zu ihm verbinden. Dies ist in der folgenden Abbildung dargestellt:

Interaktion mit einem Cluster
Interaktion mit einem Cluster

Wie Sie sehen, verbinden Sie sich immer mit einem der Login-Knoten. Mit den Compute-Knoten interagieren Sie üblicherweise nur indirekt über den Scheduler SLURM, der noch beschrieben wird. Außerdem teilen sich alle Knoten das Dateisystem, das heißt die Festplatten des Clusters.

Hier sind weitere wesentliche Unterschiede:

Workspaces

Sie haben auf dem Cluster ein Home-Verzeichnis wie bei allen Linux-Systemen. Wenn Sie allerdings Rechnungen durchführen, sollten Sie einen sogenannten Workspace erstellen. Workspaces liegen auf einem anderen Teil des Dateisystems, der eine schnellere Verbindung zu den Compute-Knoten hat. Außerdem sind sie im Gegensatz zum Home-Verzeichnis von der Größe her unbegrenzt. Allerdings laufen sie nach einer Weile ab und werden dann gelöscht. Details zu Workspaces finden Sie hier.

Der OMNI-Cluster hat einen sogenannten Burst Buffer. Dabei handelt es sich um eine Partition von SSDs (Solid-State-Drives), die für Jobs gedacht sind, die besonders viele Dateien schreiben oder lesen. Wir beschreiben die Nuztzung des Burst Buffers hier.

Module

Betriebssysteme verwenden sogenannte Umgebungen (Environments), um zu entscheiden, welches Programm mit einem bestimmten Befehl ausgeführt wird. In Umgebungsvariablen sind zum Beispiel die Dateipfade zu den ausführbaren Dateien und verschiedene weitere Einstellungen hinterlegt. Da viele Nutzer mit verschiedenen Anforderungen auf einem Cluster arbeiten, müssen oft verschiedene Versionen derselben Software zur Verfügung stehen und die Befehle wären mehrdeutig, wenn alle dieselbe Umgebung benutzen würden. Deshalb ist auf dem Cluster die Umgebung modular gestaltet und kann leicht ausgetauscht werden.

Für viele auf dem Cluster installierte Programme sind Umgebungen in sogenannten Modulen vordefiniert. Sie können die benötigten Module einfach laden. Wie Sie das tun ist hier beschrieben.

Wie komme ich auf den Cluster?

Der Cluster steht allen Beschäftigten der Uni Siegen kostenlos zur Verfügung und diese können auch Studierende eintragen, die dann ebenfalls den Cluster benutzen können. Sie müssen nur Ihr Nutzerkonto für den Cluster freischalten lassen und dann eine Verbindung von Ihrem Computer zum Cluster einrichten.

Die Account-Freischaltung für Uni-Angehörige und Studierende ist hier beschrieben.

Die Verbindung wird mittels Secure-Shell-Protokoll (SSH) aufgebaut und ist prinzipiell von Windows, Linux und Mac OS möglich. Die Einrichtung einer SSH-Verbindung ist hier beschrieben.

Die Adresse der Cluster wird Ihnen bei der Account-Freischaltung per Email mitgeteilt. Die Cluster sind aus dem Uninetz (inklusive Uni-VPN) und mit Einschränkungen auch aus dem Internet erreichbar.

Wie rechne ich auf dem Cluster?

Rechnungen auf dem Cluster werden in sogenannten Jobs durchgeführt. Sie definieren für einen Job, wie viele Ressourcen (CPUs, Arbeitsspeicher etc.) Sie benötigen und für wie lange. Außerdem beschreiben Sie, üblicherweise in einem sogenannten Jobskript, welche Programme während des Jobs ausgeführt werden sollen. Den Job stellen Sie dann in eine Warteschlange ein und der Scheduler SLURM entscheidet nach Jobgröße und anderen Faktoren, wann er läuft. Wie Sie Jobskripte erstellen und Jobs einstellen, erfahren Sie hier, mehr Informationen zu SLURM gibt es hier.

Hilfe bei Fragen

Die Cluster-Website behandelt die wichtigsten Themen und verweist für installierte Programme auf die entsprechende Dokumentation. Wenn Sie Hilfe zu einem bestimmten Linux-Befehl suchen, helfen Ihnen auch oft die eingebauten Hilfefunktionen. Unter Linux ist das insbesondere die Manual-Funktion, dazu geben Sie man <Befehlsname> ein. Wenn der Entwickler eine Man-Page eingerichtet hat, wird diese dadurch angezeigt.

Wenn die Informationen auf dieser Website Ihnen nicht weiterhelfen, können Sie eine E-Mail an hpc-support@uni-siegen.de schicken oder in unsere Sprechstunde kommen. Dies sind auch bei Problemen mit dem Cluster oder bei Installationswünschen Ihre besten Anlaufpunkte.

Das ZIMT bietet auch ein Schulungsprogramm rund um das Thema High Performance Computing und Cluster-Nutzung an. Kommende Schulungen finden Sie hier.

Außerdem bietet das ZIMT Unterstützung bei der Entwicklung und Optimierung Ihrer Software. Hierzu stehen Experten des ZIMT zur Verfügung, um mit Ihnen Ihre Software durchzugehen oder Sie anderweitig persönlich zu beraten. Wenn Sie Beratung wünschen, können Sie ebenfalls eine E-Mail an hpc-support@uni-siegen.de schicken.

Aktualisiert um 14:28 am 2. Juli 2018 von Gerd Pokorra