Hyppää sisältöön

Welcome to our weekly research support coffee hour on Zoom! Click here for more information.

Warning!

Puhti scratch disk is becoming very full (80+ % ) resulting in performance degradation. Everybody is advised to only keep actively processed data on scratch, all other data should be deleted, transferred to host institute or stored in Lumi-O. No new quota will be granted. Click here for a tool for examining your disk usage.

Roihu-supertietokone

Huomio

Tämä sivu sisältää alustavaa tietoa CSC:n seuraavasta kansallisesta supertietokoneesta Roihusta, jonka arvioidaan olevan tutkijoiden käytössä keväällä 2026. Huomaa, että yksityiskohdat voivat muuttua ajan myötä. Katso alustava aikataulu alta.

Aikataulu

graph LR;
    A{{"<b>September 2025</b>
        Roihu installation
        in progress"}} --> B;
    B{{"<b>April 2026</b>
        Pilot phase
        starts"}} --> C;
    C{{"<b>May 2026</b>
        Roihu general
        availability (GA)"}} --> D;
    D{{"<b>One month after Roihu GA</b>
        Puhti <i>computing
        services</i> shut down"}} --> E;
    E{{"<b>August 2026</b>
        Puhti <i>storage
        services</i> shut down"}} --> F;
    F{{"<b>August 2026</b>
        Mahti
        shut down"}}
    style A fill:#dceeceff;

Roihu asennetaan samaan datakeskukseen kuin LUMI, mikä tarkoittaa, että järjestelmä voidaan ottaa käyttöön häiritsemättä Puhdin ja Mahdin palveluita. Roihun yleisen saatavuuden ja Puhdin sekä Mahdin käytöstäpoiston väliin jää myös siirtymäaika, jotta käyttäjät voivat siirtyä Roihuun ilman katkosta HPC-käyttöön.

Puhti poistetaan käytöstä kahdessa vaiheessa: ensin Puhdin laskentapalvelut suljetaan kuukauden kuluttua Roihun yleisestä saatavuudesta. Tämä tarkoittaa, että töitä ei voi enää lähettää Puhtiin. Puhdin tallennustila on kuitenkin edelleen käytettävissä elokuuhun 2026 asti, minkä jälkeen Puhti poistuu kokonaan käytöstä. Mahti suljetaan elokuussa 2026.

Jos sinulla on dataa, joka täytyy siirtää Puhdista Roihuun, varaudu tekemään se kevään 2026 aikana ja viimeistään elokuussa 2026. CSC julkaisee yksityiskohtaisen Roihuun siirtymisen oppaan vuoden 2026 alussa.

Laskenta

Roihussa on yhteensä 486 CPU-solmua ja 132 GPU-solmua. High-performance LINPACKin (HPL) suorituskyvyn arvioidaan olevan CPU-solmuille 10,5 PFlop/s ja GPU-solmuille 23,4 PFlop/s, jolloin koko järjestelmän yhteenlaskettu HPL-suorituskyky on 33,9 PFlop/s.

CPU-solmuissa on kussakin kaksi 192-ytimistä AMD Turin 9965 -prosessoria, eli yhteensä 186 624 CPU-ydintä. Prosessorit perustuvat AMD Zen 5 -arkkitehtuuriin, joka tukee AVX-512-vektorikäskykantaa. CPU-solmuista 414:ssä on muistia 768 GiB, kun taas lopuissa 72 solmussa on laajennettu muisti, 1 536 GiB kussakin.

Jokainen GPU-solmu varustetaan neljällä Nvidia GH200 Grace Hopper -supersirulla. Kukin GH200-supersiru koostuu yhdestä Hopper (H100) -GPU:sta ja yhdestä Grace-CPU:sta, jossa on 72 ARM CPU -ydintä ja jotka on yhdistetty erittäin nopealla liitännällä. Jokaisessa GH200-supersirussa on 120 GiB CPU-muistia ja 96 GiB GPU-muistia, joten solmua kohden on yhteensä 480 GiB CPU-muistia. Tämä tarkoittaa yhteensä 528 GPU:ta ja 38 016 CPU-ydintä koko GPU-osiolla.

Järjestelmä tarjoaa lisäksi neljä visualisointisolmua, joissa on kussakin kaksi Nvidia L40 GPU:ta, sekä neljä suuren muistin CPU-solmua, joissa on 6 TiB muistia ja parempi yhden säikeen suorituskyky.

Solmut

Nimi Solmujen määrä Laskenta Ytimet Muisti (GiB) Paikallinen levy (TB)
M 414 AMD Turin 9965 2 x 192 ydintä (x86) @ 2.25 GHz 768 0.96
L 72 AMD Turin 9965 2 x 192 ydintä (x86) @ 2.25 GHz 1536 0.96
XL 4 AMD Turin 9555 2 x 64 ydintä (x86) @ 3.20 GHz 6144 15.36
V 4 AMD Turin 9335
Nvidia L40
2 x 32 ydintä (x86) @ 3.40 GHz
2 x GPU:ta
384
2 x 48
15.36
GPU 132 Nvidia GH200 4 x 72 ydintä (ARM)
4 x GPU:ta
4 x 120
4 x 96
0.96

Roihun käyttöjärjestelmä on Red Hat Enterprise Linux 9 (RHEL9).

Tallennus

Rinnakkainen tiedostojärjestelmä

Roihussa on kaksi toisistaan riippumatonta flash-pohjaista DDN EXAScaler Lustre -tiedostojärjestelmää – 6,0 PiB:n Scratch-tila ja 0,5 PiB:n tallennusjärjestelmä projektien sovelluksille sekä käyttäjien henkilökohtaisille Home-hakemistoille. Erilliset tiedostojärjestelmät varmistavat Home- ja ProjAppl-alueiden hyvän vasteajan myös silloin, kun Scratch on kovassa käytössä.

Roihun Scratch-levy on yli kymmenen kertaa suorituskykyisempi kuin Puhdin Scratch. Tarkemmin sanottuna Roihu Scratchin huippu-I/O-suorituskyvyn odotetaan olevan noin 560 GB/s lukemisessa ja 280 GB/s kirjoittamisessa. Home- ja ProjAppl-alueiden luku- ja kirjoituskaistat ovat vastaavasti 120 GB/s ja 100 GB/s.

Puhdin tapaan myös Roihun Scratch-levyltä poistetaan säännöllisesti tiedostoja, joita ei ole käytetty viimeisten 180 päivän aikana, jotta järjestelmään ei kerry inaktiivista dataa. Aineistojen pidempiaikaista säilytystä ja jakamista varten otamme käyttöön uuden levyalueen nimeltä ProjData. ProjDatan käyttöoikeutta ja kiintiötä haetaan ja hallinnoidaan MyCSC:ssä, ja levyalueella on oma laskutusmallinsa.

Paikallisen tallennuksen kapasiteetti

Jokaisessa Roihun CPU- ja GPU-solmussa on pieni 960 GB:n paikallinen levy, joka soveltuu väliaikaisten tiedostojen tallentamiseen töiden aikana. Suorituskykyinen paikallinen tallennus on saatavilla suuren muistin solmuissa ja visualisointisolmuissa, joista jokaisessa on 2 x 7.68 TB nopeita NVMe-levyjä.

Uutena ominaisuutena käyttäjät voivat myös pyytää paikallisia levyosliitoksia keskitetystä nopeiden tallennusresurssien poolista. Tämä nopea tallennuskapasiteetti tarjotaan verkon yli, ja se näkyy paikallisena scratch-tilana Slurm-työn sisältä. Hajautetun NVMe-resurssin kokonaiskapasiteetti on 307.2 TB.

Verkko

Roihun verkko perustuu Infiniband NDR -yhteenliitäntään. Jokainen CPU-solmu liitetään verkkoon yhdellä 200 Gb/s linkillä, kun taas GPU-osiossa solmua kohden on neljä 200 Gb/s linkkiä, yksi jokaiselle GPU:lle.

Ohjelmistot ja ohjelmointiympäristö

Tavoitteenamme on tarjota Roihussa kattava valikoima valmiiksi asennettuja HPC-kirjastoja ja tieteellisiä ohjelmistoja samaan tapaan kuin Puhdissa ja Mahdissa. Osa vanhemmista ja vähemmän käytetyistä ohjelmistoista ja ohjelmistoversioista voidaan kuitenkin poistaa käytöstä. Huomaa myös, että kaikki Puhdissa ja Mahdissa käännetyt ohjelmistot täytyy todennäköisesti kääntää uudelleen Roihussa. Lisätietoa sisällytetään siirtymisoppaaseen.

Roihun ohjelmointiympäristö on muilta osin samankaltainen kuin Mahdissa, mukaan lukien esimerkiksi

  • GNU-kääntäjäkokonaisuus
  • AOCC-kääntäjäkokonaisuus
  • CUDA ja Nvidia HPC Software Development Kit (SDK)
  • OpenMPI pääasiallisena MPI-kirjastona

Puhdin ja Mahdin tavoin Roihussa on myös selainkäyttöliittymä helppoon interaktiiviseen käyttöön ja graafisten käyttöliittymien ajamiseen.

Lisätietoja

Roihu-supertietokone – tulossa keväällä 2026!

Suomenkielinen tekoälykäännös

Sisällössä voi esiintyä virheellistä tietoa tekoälykäännöksestä johtuen.

Klikkaa tästä antaaksesi palautetta