Hyppää sisältöön

Docs CSC now features an automatic Finnish translation. Click here for more information.

Warning!

Puhti scratch disk is becoming very full (80+ % ) resulting in performance degradation. Everybody is advised to only keep actively processed data on scratch, all other data should be deleted, transferred to host institute or stored in Lumi-O. No new quota will be granted. Click here for a tool for examining your disk usage.

Roihu-supertietokone

Huomio

Tämä sivu sisältää alustavaa tietoa CSC:n seuraavasta kansallisesta supertietokoneesta Roihusta, jonka arvioidaan tulevan tutkijoiden käyttöön keväällä 2026. Huomaa, että yksityiskohdat voivat vielä muuttua ajan myötä. Katso alustava aikataulu alta.

Aikataulu

graph LR;
    A{{"<b>September 2025</b>
        Roihu installation
        in progress"}} --> B;
    B{{"<b>April 2026</b>
        Pilot phase
        starts"}} --> C;
    C{{"<b>June 2026</b>
        Roihu general
        availability (GA)"}} --> D;
    D{{"<b>One month after Roihu GA</b>
        Puhti <i>computing
        services</i> shut down"}} --> E;
    E{{"<b>August 2026</b>
        Puhti <i>storage
        services</i> shut down"}} --> F;
    F{{"<b>August 2026</b>
        Mahti
        shut down"}}
    style A fill:#dceeceff;

Roihu asennetaan samaan datakeskukseen kuin LUMI, mikä tarkoittaa, että järjestelmä voidaan ottaa käyttöön häiritsemättä Puhdin ja Mahdin palveluita. Roihun yleisen saatavuuden ja Puhdin sekä Mahdin käytöstäpoiston väliin jää myös siirtymäaika, jotta käyttäjät voivat siirtyä Roihuun ilman katkosta HPC-palveluiden käytössä.

Puhti poistetaan käytöstä kahdessa vaiheessa: ensin Puhdin laskentapalvelut suljetaan kuukauden kuluttua Roihun yleisestä saatavuudesta. Tämä tarkoittaa, että töitä ei voi enää lähettää Puhtiin. Puhdin tallennustila on kuitenkin edelleen käytettävissä elokuuhun 2026 asti, minkä jälkeen Puhti poistuu kokonaan käytöstä. Mahti suljetaan elokuussa 2026.

Jos sinulla on dataa, joka täytyy siirtää Puhdista Roihuun, varaudu tekemään se kevään 2026 aikana ja viimeistään elokuussa 2026. CSC julkaisee yksityiskohtaisen Roihu-siirtymäoppaan vuoden 2026 alussa.

Laskenta

Roihussa on yhteensä 486 CPU-solmua ja 132 GPU-solmua. High-Performance LINPACKin (HPL) suorituskyvyn arvioidaan olevan CPU-solmuille 10,5 PFlop/s ja GPU-solmuille 23,4 PFlop/s, jolloin koko järjestelmän yhteenlaskettu HPL-suorituskyky on 33,9 PFlop/s.

CPU-solmuissa on kussakin kaksi 192-ytimistä AMD Turin 9965 -prosessoria, yhteensä 186 624 CPU-ydintä. Prosessorit perustuvat AMD Zen 5 -arkkitehtuuriin, joka tukee AVX-512-vektorikäskykantaa. CPU-solmuista 414:ssä on 768 GiB muistia, kun taas lopuissa 72 solmussa on laajennettu 1 536 GiB muisti kussakin.

Jokainen GPU-solmu varustetaan neljällä Nvidia GH200 Grace Hopper -superpiirillä. Kukin GH200-superpiiri koostuu yhdestä Hopper (H100) -GPU:sta ja yhdestä Grace-CPU:sta, jossa on 72 ARM-CPU-ydintä ja jotka on kytketty toisiinsa erittäin nopealla liitännällä. Jokaisessa GH200-superpiirissä on 120 GiB CPU-muistia ja 96 GiB GPU-muistia, joten solmua kohden on yhteensä 480 GiB CPU-muistia. Tämä tarkoittaa koko GPU-osiolle yhteensä 528 GPU:ta ja 38 016 CPU-ydintä.

Järjestelmä tarjoaa lisäksi neljä visualisointisolmua, joissa on kussakin kaksi Nvidia L40 GPU:ta, sekä neljä suuren muistin CPU-solmua, joissa on 6 TiB muistia ja parempi yhden säikeen suorituskyky.

Solmut

Nimi Solmujen määrä Laskenta Ytimet Muisti (GiB) Paikallinen levy (TB)
M 414 AMD Turin 9965 2 x 192 ydintä (x86) @ 2.25 GHz 768 0.96
L 72 AMD Turin 9965 2 x 192 ydintä (x86) @ 2.25 GHz 1536 0.96
XL 4 AMD Turin 9555 2 x 64 ydintä (x86) @ 3.20 GHz 6144 15.36
V 4 AMD Turin 9335
Nvidia L40
2 x 32 ydintä (x86) @ 3.40 GHz
2 x GPU:ta
384
2 x 48
15.36
GPU 132 Nvidia GH200 4 x 72 ydintä (ARM)
4 x GPU:ta
4 x 120
4 x 96
0.96

Roihun käyttöjärjestelmä on Red Hat Enterprise Linux 9 (RHEL9).

Tallennus

Rinnakkainen tiedostojärjestelmä

Roihussa on kaksi toisistaan riippumatonta flash-pohjaista DDN EXAScaler Lustre -tiedostojärjestelmää – 6,0 PiB:n Scratch-tila ja 0,5 PiB:n tallennusjärjestelmä projektien sovelluksille sekä käyttäjien henkilökohtaisille Home-hakemistoille. Erilliset tiedostojärjestelmät varmistavat Home- ja ProjAppl-alueiden hyvän vasteajan myös silloin, kun Scratch on kovassa käytössä.

Roihun Scratch-levy on yli kymmenen kertaa suorituskykyisempi kuin Puhdin Scratch. Tarkemmin sanottuna Roihu Scratchin huippu-I/O-suorituskyvyn odotetaan olevan noin 560 GB/s lukunopeudessa ja 280 GB/s kirjoitusnopeudessa. Home- ja ProjAppl-alueiden luku- ja kirjoituskaistat ovat vastaavasti 120 GB/s ja 100 GB/s.

Puhdin tapaan myös Roihun Scratch-levyltä poistetaan säännöllisesti tiedostoja, joita ei ole käytetty viimeisen 180 päivän aikana, jotta järjestelmään ei kerry käyttämätöntä dataa. Aineistojen pidempiaikaista säilytystä ja jakamista varten otamme käyttöön uuden levyalueen nimeltä ProjData. ProjDatan käyttöoikeutta ja kiintiötä haetaan ja hallitaan MyCSC:ssä, ja levyalueella on oma laskutusmallinsa.

Paikallisen tallennuksen kapasiteetti

Jokaisessa Roihun CPU- ja GPU-solmussa on pieni 960 GB:n paikallinen levy, joka soveltuu väliaikaisten tiedostojen tallentamiseen ajon aikana. Suuren suorituskyvyn paikallista tallennustilaa on saatavilla suuren muistin ja visualisoinnin solmuissa, joista jokaisessa on 2 x 7.68 TB nopeaa NVMe-levyä.

Uutena ominaisuutena käyttäjät voivat myös pyytää paikallisia levyasennuksia keskitetystä nopeiden tallennusresurssien poolista. Tämä nopea tallennuskapasiteetti tarjotaan verkon yli, ja se näkyy paikallisena scratch-tilana Slurm-ajon sisällä. Hajautetun NVMe-resurssin kokonaiskapasiteetti on 307.2 TB.

Verkko

Roihun verkko perustuu Infiniband NDR -yhteenliitäntäverkkoon. Jokainen CPU-solmu liitetään verkkoon yhdellä 200 Gb/s yhteydellä, kun taas GPU-osiossa solmua kohden on neljä 200 Gb/s yhteyttä, yksi jokaiselle GPU:lle.

Ohjelmistot ja ohjelmointiympäristö

Tavoitteemme on tarjota Roihussa kattava valikoima valmiiksi asennettuja HPC-kirjastoja ja tieteellisiä ohjelmistoja samaan tapaan kuin Puhdissa ja Mahdissa. Osa vanhemmista ja vähemmän käytetyistä ohjelmistoista ja ohjelmistoversioista voidaan kuitenkin poistaa käytöstä. Huomaa myös, että Puhdissa ja Mahdissa käännetyt ohjelmistot täytyy todennäköisesti kääntää uudelleen Roihussa. Lisätietoa sisällytetään siirtymäoppaaseen.

Roihun ohjelmointiympäristö on muilta osin samankaltainen kuin Mahdissa, mukaan lukien esimerkiksi

  • GNU-kääntäjäkokonaisuus
  • AOCC-kääntäjäkokonaisuus
  • CUDA ja Nvidia HPC Software Development Kit (SDK)
  • OpenMPI pääasiallisena MPI-kirjastona

Puhdin ja Mahdin tavoin Roihussa on myös selainkäyttöliittymä helppokäyttöistä interaktiivista käyttöä ja graafisten käyttöliittymien ajamista varten.

Lisätietoja

Roihu-supertietokone – tulossa keväällä 2026!

Suomenkielinen tekoälykäännös

Sisällössä voi esiintyä virheellistä tietoa tekoälykäännöksestä johtuen.

Klikkaa tästä antaaksesi palautetta