-
ncu: GPU:n CUDA-ydinprofilointityökalu
ncu: GPU:n CUDA-ydinprofilointityökalu
Saatavuus
Puhti: 2022.2.0.0
Mahti: 2021.3.0.0
Lisenssi
Käyttö on mahdollista sekä akateemisiin että kaupallisiin tarkoituksiin.
Käyttö
NVIDIA Nsight Compute on CUDA-ydinprofilointityökalu, joka tarjoaa yksityiskohtaista suorituskykydataa ja ohjeita CUDA-ytimien optimointiin. Profilointi- ja virheenjäljitystyökalu ncu kerää ja näyttää profilointidataa komentorivikäyttöliittymästä. Se on matalan tason CUDA-ydinprofilointityökalu. Sen avulla voidaan kerätä aikajana CUDAan liittyvistä toiminnoista sekä CPU:lla että GPU:lla, mukaan lukien ytimen suoritus, muistosiirrot, muistin asetus sekä CUDA API -kutsut ja CUDA-ytimien tapahtumat tai metriikat. Profiloinnin tulokset näytetään konsolissa sen jälkeen, kun profilointidata on kerätty, ja ne voidaan myös tallentaa myöhempää tarkastelua varten ncu-ui-työkalulla.
ncu:n käyttämiseksi pitää ensin ladata CUDA-moduuli:
CUDA-koodin profiloimiseksi lisätään sitten komento ncu ennen tavallista
komentoa, jolla koodi suoritetaan. Muutoin suorittaminen on samanlaista kuin mikä tahansa muu
CUDA-ajo Puhdissa tai Mahdissa.
Esimerkki ncu:n käytöstä:
ncu-ui:lla CSC:n supertietokoneilla tai käyttäjän omalla koneella. Ohjelman suorituskykyä voidaan verrata teoreettiseen huippusuorituskykyyn (speed-of-light), tai voidaan käyttää mukautettua vertailutasoa (esimerkiksi aiempaa julkaisua, johon verrataan).
ncu tukee monia hyödyllisiä ajoasetuksia, ja se on täysin mukautettavissa. Käytä komentoriviargumentteja --list metrics ja --query-metrics tarkistaaksesi saatavilla olevat metriikat ja selvittääksesi, mitkä metriikat ovat käytettävissä nykyisellä alustalla. Lisätietoja on NVIDIAn dokumentaatiossa.