Hyppää sisältöön

Welcome to our weekly research support coffee hour on Zoom! Click here for more information.

Warning!

Puhti scratch disk is becoming very full (80+ % ) resulting in performance degradation. Everybody is advised to only keep actively processed data on scratch, all other data should be deleted, transferred to host institute or stored in Lumi-O. No new quota will be granted. Click here for a tool for examining your disk usage.

ncu: GPU:n CUDA-ydinprofilointityökalu

Saatavuus

Puhti: 2022.2.0.0
Mahti: 2021.3.0.0

Lisenssi

Käyttö on mahdollista sekä akateemisiin että kaupallisiin tarkoituksiin.

Käyttö

NVIDIA Nsight Compute on CUDA-ydinprofilointityökalu, joka tarjoaa yksityiskohtaista suorituskykydataa ja ohjeita CUDA-ytimien optimointiin. Profilointi- ja virheenjäljitystyökalu ncu kerää ja näyttää profilointidataa komentorivikäyttöliittymästä. Se on matalan tason CUDA-ydinprofilointityökalu. Sen avulla voidaan kerätä aikajana CUDAan liittyvistä toiminnoista sekä CPU:lla että GPU:lla, mukaan lukien ytimen suoritus, muistosiirrot, muistin asetus sekä CUDA API -kutsut ja CUDA-ytimien tapahtumat tai metriikat. Profiloinnin tulokset näytetään konsolissa sen jälkeen, kun profilointidata on kerätty, ja ne voidaan myös tallentaa myöhempää tarkastelua varten ncu-ui-työkalulla.

ncu:n käyttämiseksi pitää ensin ladata CUDA-moduuli:

module load cuda

CUDA-koodin profiloimiseksi lisätään sitten komento ncu ennen tavallista komentoa, jolla koodi suoritetaan. Muutoin suorittaminen on samanlaista kuin mikä tahansa muu CUDA-ajo Puhdissa tai Mahdissa.

Esimerkki ncu:n käytöstä:

ncu --set full -o myreport ./a.out
Seuraavaksi syntynyt raportti analysoidaan ncu-ui:lla CSC:n supertietokoneilla tai käyttäjän omalla koneella. Ohjelman suorituskykyä voidaan verrata teoreettiseen huippusuorituskykyyn (speed-of-light), tai voidaan käyttää mukautettua vertailutasoa (esimerkiksi aiempaa julkaisua, johon verrataan).

ncu tukee monia hyödyllisiä ajoasetuksia, ja se on täysin mukautettavissa. Käytä komentoriviargumentteja --list metrics ja --query-metrics tarkistaaksesi saatavilla olevat metriikat ja selvittääksesi, mitkä metriikat ovat käytettävissä nykyisellä alustalla. Lisätietoja on NVIDIAn dokumentaatiossa.

Suomenkielinen tekoälykäännös

Sisällössä voi esiintyä virheellistä tietoa tekoälykäännöksestä johtuen.

Klikkaa tästä antaaksesi palautetta