Hyppää sisältöön

Docs CSC now features an automatic Finnish translation. Click here for more information.

Warning!

Puhti and Mahti will be decommissioned after Roihu becomes available. Users should clean up unnecessary files and move any required data by the end of August 2026. See the Roihu data preparation instructions for details.

Puhti scratch is very full: keep only active data there and move or delete everything else. No new Puhti scratch quota will be granted.

ncu: GPU:n CUDA-ytimien profilointityökalu

Saatavuus

Puhti: 2022.2.0.0
Mahti: 2021.3.0.0

Lisenssi

Käyttö on mahdollista sekä akateemisiin että kaupallisiin tarkoituksiin.

Käyttö

NVIDIA Nsight Compute on CUDA-ytimien profilointityökalu, joka tarjoaa yksityiskohtaista suorituskykydataa ja ohjeita CUDA-ytimien optimointiin. ncu-profilointi- ja virheenkorjaustyökalu kerää ja näyttää profilointidataa komentoriviltä. Se on matalan tason CUDA-ytimien profilointityökalu. Sen avulla voidaan kerätä aikajana CPU:n ja GPU:n CUDAan liittyvistä toiminnoista, mukaan lukien ytimien suoritus, muistosiirrot, muistin asetus sekä CUDA API -kutsut ja CUDA-ytimien tapahtumat tai metriikat. Profiloinnin tulokset näytetään konsolissa profilointidatan keräämisen jälkeen, ja ne voidaan myös tallentaa myöhempää tarkastelua varten ncu-ui-työkalulla.

Jotta ncu:ta voidaan käyttää, on ensin ladattava CUDA-moduuli:

module load cuda

CUDA-koodin profilointia varten lisätään sitten komento ncu ennen tavallista komentoa, jolla koodi suoritetaan. Muutoin suorittaminen on samanlaista kuin mikä tahansa muu CUDA-ajo Puhdissa tai Mahdissa.

Esimerkki ncu:n käytöstä:

ncu --set full -o myreport ./a.out
Seuraavaksi syntynyt raportti analysoidaan ncu-ui:lla CSC:n supertietokoneilla tai käyttäjän omalla koneella. Ohjelman suorituskykyä voidaan verrata teoreettiseen huippusuorituskykyyn (speed-of-light) tai käyttää mukautettua vertailutasoa (esimerkiksi aiempaa versiota, johon verrataan).

ncu tukee monia hyödyllisiä ajoasetuksia, ja se on täysin mukautettavissa. Käytä komentoriviargumentteja --list metrics ja --query-metrics tarkistaaksesi saatavilla olevat metriikat ja selvittääksesi, mitkä metriikat ovat käytettävissä nykyisellä alustalla. Lisätietoja on NVIDIAn dokumentaatiossa.

Suomenkielinen tekoälykäännös

Sisällössä voi esiintyä virheellistä tietoa tekoälykäännöksestä johtuen.

Klikkaa tästä antaaksesi palautetta