Hostname: altix-uv.rz.unibw-muenchen.de

Hier ist als Betriebssystem SLES 11  für x86_64 im Einsatz. Damit kann dieses System auch seine Home-Verzeichnisse zusammen mit "applxsrv.rz.unibw-muenchen.de" nutzen.

Das System ist auf einen Betrieb mit einem Warteschlangensystem ausgelegt, d.h. es sind mit einer fixen Resourcenzuteilung (Cores+RAM) verschiedene Warteschlangen definiert.
Pro Core stehen 5.33 GB zur Verfügung, Nodes 2...31, 10.66 GB bei den Nodes 32...47.
Für den interaktiven Betrieb stehen 12 Cores mit ~ 60GB inkl. der Systemverwaltung zur Verfügung.
Hier sollen/können lediglich kurze Programmläufe mit geringer Speicheranforderung gestarted werden. Ab sofort ist eine Limitierung der CPU-Zeit für alle interaktiven Aufträge von 3600 Sekunden pro Prozess gesetzt. Dieses Limit wird beim submitieren von Jobs z.B "qsub -I -V -q n6t96h" nicht wirksam! Als Default-Queue ist "n6t96h" gesetzt.

 

1. Variante

Sie defineren die Angaben für Ihren Programmlauf in einem Shellscript.

vi/nedit run_job

#!/bin/bash
#PBS -o /scratch/<kennung>/myjob.out
#PBS -j oe
#PBS -S /bin/bash
#PBS -q n6t96h
#PBS -N myjob
#PBS -M  name.vorname@unibw.de
#PBS -m abe
cd mydir
./<myprog>

<< ENDE SHELL

chmod 700 run_job


Starten Job

qsub run_myjob

Damit wird in der Warteschlange "n6t96h" das Programm "myprog" zur Ausführung gebracht und sie erhalten Mails zum Jobablauf.
 

2. Variante

Sie steuern die von ihnen gewünschte Warteschlange interaktiv an.
Mit dem Kommando "qsub -q <queue-name> -I -V" wird eine neue Shell gestartet, analog zur SSH-Verbindung z.B per Putty.
Danach werden alle von ihnen gestarteten Tasks in dieser "Queue-Umgebung" ausgeführt.

Wann enden diese "interaktiven" Jobs?

  1. Mit Steuerung-D wird dieser Job wieder beendet.
  2. Mit dem Erreichen der vorgegebenen Verweil/Rechenzeit.
  3. Bricht ihre Task in der Queue "n12t96h" nach 1 Stunde ab, bleiben die Ressourcen dieser Queue für weitere 95 Stunden belegt. Deshalb sollten sie hier ihre Tasks immer unter Kontrolle haben.


Beim Jobstart bekommen Sie eine Jobnummer z.B 123.altix-uv

Mit dem Kommando "qdel 123" können sie den Job vorzeitig beenden.
Mit "qstat -a" bekommen sie eine Übersicht gestarteter Jobs.
Mit "qstat -Q" bekommen Sie eine Queue Übersicht
Pro Kennung können derzeit max. 48 Cores verwendet werden. Wenn es die Auslastung des Systems zulässt, werden vom Administrator wartende Jobs aktiviert.

Wie ist der Queue-Name zu interpretieren:
n steht für Core, die folgende Ziffer bestimmt die max. Anzahl der nutzbaren Cores.
t steht für Time, die folgende Ziffer bestimmt die max. Verweilzeit/Rechenzeit aller genutzer Cores
h steht für Stunde und ist die Masseinheit für die vorgestellte Ziffer

z.B n24t96h besagt, dass mit max. 24 Cores 96 Stunden Rechenzeit erreicht werden kann.