Slurm เป็นซอฟต์แวร์ Job scheduler มีหน้าที่ในการจัดลำดับงานในระบบ โดยหลักการทำงานของ Slurm คือผู้ใช้ต้องส่ง Job script ผ่านเครื่อง Login node เข้าไปต่อคิวใน Slurm เพื่อรอที่จะรันงาน เมื่อถึงคิว Slurm จะทำการส่งงานไปรันที่เครื่อง Compute node ตาม Partition ที่ท่านกำหนดในไฟล์ Job script เมื่อประมวลผลเสร็จ ผลลัพธ์จะเก็บอยู่ในตำแหน่งที่ท่านรัน
Partition คือ แบบแผนการจัดสรรทรัพยากรหรือกลุ่มเครื่องใช้งานในประเภทต่าง ๆ ที่ให้บริการในการรันงาน
Queue คือ ลำดับของงานที่ต้องรัน
Partition | Node | CPU | GPU | Time Limit |
---|---|---|---|---|
CPU | 2 | 192 | - | 168 hours |
GPU | 2 | 64 | 16 | 168 hours |
Mixed | 1 | 128 | 8 | 24 hours |
Partition | Max CPU/Job | Running Job/User | Submit Job/User |
---|---|---|---|
CPU | 32 | 2 | 3 |
GPU | 4 | 2 | 3 |
Mixed | 64 | 1 | 2 |