-
PyTorch
PyTorch
Koneoppimiskehys Pythonille.
Uutiset
23.1.2026 LUMIn huoltokatkon 21.1.2026 jälkeen CSC:n PyTorch-asennukset eivät enää toimi nopean Slingshot-verkon kanssa binaariyhteensopimattomuuksien vuoksi uusien ajureiden kanssa. Tämä tarkoittaa, että usean solmun työt ovat odotettavasti 10–20 % hitaampia kuin aiemmin. Katso lisätietoja alla olevista LUMI-asennushuomioista.
9.1.2026 PyTorch 2.9.1 asennettiin Puhtiin ja Mahtiin, ja siitä tehtiin oletusversio. Apex poistettiin, koska kirjasto on ollut vanhentunut jo pitkään. Myöskään SGLang ei sisälly tähän versioon, koska se ei ole yhteensopiva vLLM:n edellyttämien kirjastojen kanssa. Lisättiin litgpt, ultralytics, sahi ja torchgeo.
Uusia PyTorch-versioita LUMIin valmistelee uusi LUMI AI Factory, ja niiden odotetaan julkaistavan alkukevään aikana.
8.7.2025 PyTorch 2.7.1 asennettiin Puhtiin ja Mahtiin, ja siitä tehtiin oletusversio. Tämä versio sisältää SGLangin, mutta huomaa, että SGLang tukee vain Mahtia Puhtin vanhemman GPU-arkkitehtuurin vuoksi.
26.6.2025 PyTorch 2.7.1 asennettiin LUMIin, ja siitä tehtiin oletusversio.
Vanhemmat uutiset (näytä napsauttamalla)
10.4.2025 PyTorch 2.6.0 asennettiin Puhtiin ja Mahtiin, ja siitä tehtiin oletusversio. Sisältää uusimmat versiot suosituista paketeista, kuten Hugging Face transformers, vLLM ja FAISS. PyTorch geometric ja siihen liittyvät paketit eivät enää sisälly asennukseen, koska ne eivät tue PyTorchin uudempia versioita.
20.1.2025 PyTorch 2.5.1 asetettiin oletusversioksi kaikilla supertietokoneilla.
20.12.2024 PyTorch 2.5.1 ROCm 6.2:lla lisättiin LUMIin. Sisältää kaikki tavalliset paketit sekä kokeellisen tuen FAISSille.
17.12.2024 PyTorch 2.5.1 lisättiin Puhtiin ja Mahtiin. Sisältää vLLM:n ja FAISSin monien muiden päivitysten joukossa.
19.9.2024 PyTorch 2.4.1 ROCm 6.1:llä lisättiin LUMIin. LUMIn PyTorch-moduuli sisältää nyt vLLM-version 0.5.5 sekä FlashAttention-2:n, bitsandbytesin ja monia muita usein pyydettyjä paketteja, jotka sisältyivät jo aiempiin asennuksiin. LUMIn moduuli käyttää edelleen vanhan tyylin wrappereita (ei tykky-pohjaisia wrappereita kuten Puhtissa ja Mahdissa).
21.8.2024 PyTorch 2.4 lisättiin Puhtiin ja Mahtiin. LUMIn asennus viivästyy nykyisen huoltokatkon jälkeiseen aikaan. torchtext-paketti ei enää sisälly asennukseen, koska se on vanhentunut eikä enää toimi PyTorch 2.4:n kanssa.
13.6.2024 PyTorch 2.3 lisättiin Puhtiin ja Mahtiin. LUMIn
asennus viivästyy alkusyksyyn yhteensopimattoman
ROCm-ajuriversion vuoksi. Tässä versiossa on myös päivitetty tapa, jolla Python-komennot
wrapataan, koska tämä ratkaisee useita ongelmia virtuaaliympäristöjen
ja Jupyter Notebookien käytössä. Tämän vuoksi apptainer- ja
apptainer_wrapper-komennot eivät enää toimi, mutta muuten muutoksen
pitäisi olla käyttäjille näkymätön.
1.3.2024 PyTorch 2.2 lisättiin Puhtiin, Mahtiin ja LUMIin. LUMIn moduuli sisältää ROCm-versiot FlashAttention-2:sta ja bitsandbytesista, koska näitä on käyttäjien vaikea lisätä itse. xFormers lisättiin kaikkiin kolmeen järjestelmään.
17.11.2023 PyTorch 2.1 lisättiin Puhtiin, Mahtiin ja LUMIin. Horovod on poistettu, ja suosittelemme käyttämään sen sijaan PyTorch DDP:tä. PyTorch Geometric lisättiin Puhtin ja Mahtin versioon.
5.10.2022 Puhtin Red Hat Enterprise Linux 8 -päivityksen (RHEL8) vuoksi täysin tuettujen PyTorch-versioiden määrää on vähennetty. Aiemmin vanhentuneet conda-pohjaiset versiot on poistettu. Ole hyvä ja ota yhteyttä asiakastukeemme, jos todella tarvitset pääsyn vanhempiin versioihin.
5.5.2022 Mahtin Red Hat Enterprise Linux 8 -päivityksen (RHEL8) vuoksi täysin tuettujen PyTorch-versioiden määrää on vähennetty. Ole hyvä ja ota yhteyttä asiakastukeemme, jos todella tarvitset pääsyn muihin versioihin.
4.2.2022 Kaikki vanhat PyTorch-versiot, jotka perustuivat suoriin Conda- asennuksiin, on merkitty vanhentuneiksi, ja kannustamme käyttäjiä siirtymään uudempiin versioihin. Lue lisää erilliseltä Condan vanhentumissivultamme.
Saatavilla
Tällä hetkellä tuetut PyTorch-versiot:
| Version | Module | Puhti | Mahti | (LUMI) see notes below |
Notes |
|---|---|---|---|---|---|
| 2.9.1 | pytorch/2.9 |
X | X | - | Oletus Puhtissa, Mahdissa |
| 2.7.1 | pytorch/2.7 |
X | X | (X) | Ei Slingshotia (katso alta) |
| 2.6.0 | pytorch/2.6 |
X | X | - | |
| 2.5.1 | pytorch/2.5 |
X | X | (X) | |
| 2.4.1 | pytorch/2.4 |
- | - | (X) | |
| 2.4.0 | pytorch/2.4 |
X | X | - | Uudet tykky-pohjaiset wrapperit |
| 2.3.1 | pytorch/2.3 |
X | X | - | Uudet tykky-pohjaiset wrapperit |
| 2.2.2 | pytorch/2.2 |
- | - | (X) | |
| 2.2.1 | pytorch/2.2 |
X | X | - | |
| 2.1.2 | pytorch/2.1 |
- | - | (X) | |
| 2.1.0 | pytorch/2.1 |
X | X | - | |
| 2.0.1 | pytorch/2.0 |
- | - | (X) | |
| 2.0.0 | pytorch/2.0 |
X | X | - | |
| 1.13.1 | pytorch/1.13 |
- | - | (X) | |
| 1.13.0 | pytorch/1.13 |
X | X | - | |
| 1.12.0 | pytorch/1.12 |
X | X | - | |
| 1.11.0 | pytorch/1.11 |
X | X | - |
Sisältää PyTorchin ja siihen liittyvät kirjastot GPU-tuella CUDA:n/ROCm:n kautta.
LUMI-asennukset
LUMI-asennukset – merkitty yllä olevassa taulukossa merkinnällä "(X)" – eivät enää tue nopeaa Slingshot-verkkoa binaariyhteensopimattomuuksien vuoksi LUMIn huoltokatkossa 21.1.2026 asennettujen uusien ajureiden kanssa. Tämä tarkoittaa, että usean solmun työt ovat odotettavasti 10–20 % hitaampia kuin aiemmin. Yhden solmun töissä eroa ei ole. CSC:n PyTorchia LUMIssa voidaan pitää vanhentuneena, ja suosittelemme käyttämään sen sijaan LUMI AI Factoryn tarjoamia kontteja .
Jos huomaat, että jokin paketti puuttuu, voit usein asentaa sen
itse käyttämällä komentoa pip install. On suositeltavaa käyttää Pythonin virtuaali-
ympäristöjä. Katso Python-dokumentaatiostamme lisätietoja siitä,
kuinka asentaa paketteja
itse.
Jos mielestäsi jokin tärkeä paketti pitäisi sisällyttää CSC:n tarjoamaan
moduuliin, ole hyvä ja ota yhteyttä
asiakastukeemme.
Kaikki moduulit perustuvat Apptaineria käyttäviin kontteihin (aiemmin
tunnettu nimellä Singularity). Wrapper-skriptit on tarjottu niin, että yleiset
komennot kuten python, python3, pip ja pip3 toimivat
normaalisti.
PyTorch-versiossa 2.2 ja sitä aiemmissa muut komennot pitää
etuliittää komennolla apptainer_wrapper exec, esimerkiksi apptainer_wrapper
exec huggingface-cli. Lisätietoja on CSC:n yleisissä ohjeissa siitä, miten Apptainer-
kontteja ajetaan.
PyTorch-versiossa 2.3 ja sitä uudemmissa Puhtissa tai Mahdissa olemme käyttäneet
tykky-työkalulla luotuja wrappereita, ja kaikki
esiasennettujen Python-pakettien tarjoamat komennot on wrapattu ja niitä voidaan käyttää suoraan. Jos
sinun todella täytyy ajaa jotain kontin sisällä, voit
etuliittää komennolla _debug_exec tai ajaa _debug_shell avataksesi shell-
istunnon.
Uusille käyttäjille
Jos olet uusi koneoppimisen käyttäjä CSC:n supertietokoneilla, lue uusi opastuksemme Koneoppimisen käytön aloittaminen CSC:llä , jossa kerrotaan, miten yksinkertainen PyTorch-projekti ajetaan Puhtissa selainkäyttöliittymän avulla.
Lisenssi
PyTorch on lisensoitu BSD-tyylisellä lisenssillä, kuten LICENSE- tiedostossa on kuvattu.
Käyttö
Jos haluat käyttää PyTorchin oletusversiota Puhtissa tai Mahdissa, ota se käyttöön komennolla:
Jos haluat käyttää PyTorchia LUMIssa, katso yllä olevat huomautukset LUMI-asennuksesta.
Jos haluat käyttää tiettyä versiota (katso yllä saatavilla olevat versiot), käytä:
Huomaa, että moduuli sisältää jo CUDA- ja cuDNN-kirjastot, joten cuda- ja cudnn-moduuleja ei tarvitse ladata erikseen!
Tämä komento näyttää myös kaikki saatavilla olevat versiot:
Voit tarkistaa ladattuun moduuliin sisältyvät tarkat paketit ja versiot ajamalla:
Warning
Huomaa, että kirjautumissolmuja ei ole tarkoitettu raskaaseen laskentaan, käytä sen sijaan slurm- eräajotöitä. Katso ohjeemme eräajojärjestelmän käytöstä.
Esimerkkieräajokomentosarja
Esimerkkieräajokomentosarja yhden GPU:n ja sitä vastaavan osuuden varaamiseen käytettävissä olevista CPU-ytimistä yhdellä solmulla:
Lue osio GPU:n tehokas hyödyntäminen koneoppimisen oppaassamme , jotta opit käyttämään GPU:ta tehokkaasti.
Suuret aineistot, usean GPU:n ja usean solmun työt
Jos työskentelet suurten aineistojen kanssa tai aineistojen, jotka sisältävät paljon tiedostoja, lue koneoppimisen oppaamme data-osio . Erityisesti älä lue valtavaa määrää tiedostoja jaetusta tiedostojärjestelmästä, vaan käytä nopeaa paikallislevyä tai paketoi data suurempiin tiedostoihin!
Usean GPU:n ja usean solmun töihin suosittelemme käyttämään PyTorchin Distributed Data-Parallel -kehystä. Voit lukea tästä lisää ja löytää esimerkkejä PyTorch DDP:n käytöstä CSC:n supertietokoneilla koneoppimisen oppaamme usean GPU:n ja usean solmun osiosta
PyTorch-profiler
Jos PyTorch-ohjelmasi on hidas tai huomaat, että sillä on alhainen GPU:n käyttöaste, voit käyttää PyTorch- profileria ohjelmasi ajan- ja muistinkulutuksen analysointiin.
PyTorch-profilerin voi ottaa käyttöön lisäämällä muutaman rivin koodia olemassa olevaan PyTorch-ohjelmaasi:
from torch.profiler import profile, ProfilerActivity
prof = profile(
schedule=torch.profiler.schedule(
skip_first=10,
wait=5,
warmup=1,
active=3,
repeat=1)
on_trace_ready=torch.profiler.tensorboard_trace_handler('./logs/profiler'),
activities=[ProfilerActivity.CPU, ProfilerActivity.CUDA],
record_shapes=True, # record shapes of operator inputs
profile_memory=True, # track tensor memory allocation/deallocation
with_stack=True # record source code information
)
Tässä esimerkissä päätämme ohittaa ensimmäiset 10 erää ja tallentaa profilointia varten
vain muutaman erän. Profilointijälki tallennetaan
TensorBoard-muotoon hakemistoon logs/profiler. Jos haluat nähdä kaikki
vaihtoehdot, katso PyTorchin profilerin API-dokumentaatio
.
Seuraavaksi profiler pitää käynnistää ja pysäyttää sekä tallentaa yksittäiset vaiheet (tyypillisesti erät). Tämä tehtäisiin yleensä opetussilmukan ympärillä:
prof.start()
for batch in train_loader:
# normal forward and backprop stuff here
prof.step()
prof.stop()
GitHub-
repositoriossamme olemme antaneet
täyden esimerkin profiloinnista:
mnist_ddp_profiler.py
sekä sitä vastaavan Slurm-eräajotyö-
komentosarjan.
Työn ajamisen jälkeen voit tarkastella profilerin tulostetta TensorBoardilla. Käynnistä TensorBoard-istunto käyttämäsi supertietokoneen selainkäyttöliittymässä . Jos PyTorch-profiler ei avaudu automaattisesti, saatat löytää sen välilehtipalkista nimellä PYTORCH_PROFILER. Jos välilehti ei ole oletuksena näkyvissä, se löytyy käyttöliittymän oikeasta reunasta avattavasta valikosta.
Erityisen hyödyllinen näkymä on Trace-näkymä (valitse "Trace" "Views"- pudotusvalikosta). Alla on esimerkkikuvakaappaus yllä linkitetyn esimerkin ajosta.

Trace-näkymää voi zoomata ja siirtää pienellä työkalupalkilla yläoikealla tai käyttämällä näppäimiä 'a' ja 'd' siirtämiseen sekä 'w' ja 's' sisään- ja uloszoomaamiseen.
Kuvakaappauksessa näemme:
- Alue 1, merkitty punaisella, näyttää datan lataamisen (tämä näkyy zoomaamalla sisään ja lukemalla näytetyt funktionimet. Tämä ajetaan kokonaan CPU:lla, koska se on väritetty vain näytön yläosassa tavallisten Pythonin CPU-säikeiden alla.
- Alue 2, merkitty sinisellä, näyttää eteenpäinlaskennan ja takaisinlevityksen vaiheet. Osa tästä tehdään GPU:lla, mikä näkyy värityksestä alaosassa "GPU 0" -alueella.
On selvää, että tämä työ ei hyödynnä GPU:ta hyvin, koska suurin osa ajasta kuluu CPU-käsittelyyn. Yleisesti voisi kokeilla lisätä enemmän CPU-ytimiä datan lataamisen tehokkaampaan käsittelyyn ja kasvattaa eräkokoa GPU-käsittelykuorman lisäämiseksi. Tässä tapauksessa ongelma on kuitenkin se, että verkko on niin pieni, ettei se pysty todella hyödyntämään GPU:ta täysimääräisesti.