Miksi eräajoni jonottaa niin pitkään?
Jonottaminen on väistämätöntä, kun töitä on enemmän kuin resursseja. CSC käyttää SLURMin fair share -priorisointialgoritmia, mikä tarkoittaa, että mitä enemmän resursseja olet käyttänyt viime aikoina, sitä matalampi alkuprioriteetti seuraavilla töilläsi on. Töiden prioriteetti kasvaa niiden jonottaessa, ja lopulta ne suoritetaan.
Voit tarkistaa parhaillaan käynnissä olevien ja jonossa olevien töiden tilanteen
squeue-komennolla.
Yleisesti ottaen, jos haluat töidesi jonottavan mahdollisimman vähän, on hyvä ajatus varata vain ne resurssit, joita työt todella tarvitsevat.
Erityisesti liian suuren muistimäärän pyytäminen pidentää varmasti työsi jonotusaikaa. Laskenta-aika ei sen sijaan ole tässä yhtä kriittinen, paitsi jos pyydetty ajoaika on hyvin lyhyt (alle 30 minuuttia tai vastaavaa), jolloin backfiller saattaa löytää työllesi paikan ennen kuin se pääsisi ajoon sen todellisen prioriteetin perusteella. Liian lyhyiden töiden ajamista ei kuitenkaan suositella, jotta ajastuksen yleiskustannukset pysyvät kohtuullisina.
Jos olet lähettänyt työn longrun-partitioon ja squeue kertoo, että työsi
odottavan tilan syy on QOSGrpCpuLimit, se tarkoittaa, että partitiolla ei
tällä hetkellä ole vapaata kapasiteettia. Saat hyvin todennäköisesti resursseja
nopeammin jostakin toisesta partiosta, kuten small. Katso
Saatavilla olevat eräajopartiot.
Kannattaa tutustua myös näihin usein kysyttyihin kysymyksiin: