r-env

r-env tarjoaa R:n ja RStudio Serverin sekä useita muita ominaisuuksia niiden käytön helpottamiseksi. Se toimii Apptainer-kontissa.

R on avoimen lähdekoodin kieli ja ympäristö data-analytiikkaan, tilastolliseen laskentaan ja grafiikkaan. Lisätietoa R:stä löytyy R Projectin verkkosivuilta. Monet hyödylliset R-oppaat löytyvät myös CRANista.
RStudio Server on integroitu kehitysympäristö (IDE) R:lle. Lisätietoa RStudiosta löytyy RStudion verkkosivuilta.

Uutiset

29.4.2026 r-env-dokumentaatio on päivitetty ja järjestelty uudelleen. Malliskriptit rinnakkaisille R-eräajoille löytyvät nyt erilliseltä ohjesivulta Esimerkkejä rinnakkaisista R-eräajoista.
17.2.2026 R-versio 4.5.2 on nyt saatavilla r-env:ssä Puhdissa ja Mahdissa, ja se on asetettu oletusversioksi.

Vanhemmat uutiset (näytä klikkaamalla)

22.7.2025 R-versio 4.5.1 on nyt saatavilla r-env:ssä Puhdissa ja Mahdissa, ja se on asetettu oletusversioksi.

7.4.2025 r-env on nyt saatavilla myös Mahdissa, mukaan lukien RStudio Mahdin selainkäyttöliittymässä. Moduuli toimii yleisesti ottaen samalla tavalla kuin r-env Puhdissa, mutta huomaa, että alla olevaa dokumentaatiota ei ole vielä päivitetty Mahdille. Mahdin uusi small-osio soveltuu monenlaiseen R- ja RStudio-työskentelyyn, pois lukien kaikkein muistisyöpimmät tehtävät. Puhtiin tottuneiden käyttäjien kannattaa huomata, että Mahdissa ei ole erillistä muistivarausta, ja ainoa tapa saada lisää muistia on varata enemmän ytimiä. Jos sinulla on kysyttävää R:n käytöstä Mahdissa, ota yhteyttä CSC:n asiakastukeen.

Saatavilla

r-env sisältää yli 1500 esiasennettua R-pakettia, mukaan lukien tuki paikkatietoanalyyseille ja rinnakkaislaskennalle. Suorituskyvyn parantamiseksi r-env on käännetty käyttäen Intel® oneAPI Math Kernel Librarya (oneMKL) (entinen Intel® MKL).

Muutamaa poikkeusta lukuun ottamatta r-env:n R-pakettiversiot ovat päivämäärälukittuja (CRAN-paketit) tai sidottuja tiettyyn Bioconductor -versioon.

Nykyiset moduulit ja CSC:n supertietokoneilla tuetut versiot:

PuhtiMahti

Moduulin nimi (R-versio)	CRAN-pakettien päiväys	Bioconductor-versio	RStudio Server -versio	oneMKL-versio	Cmdstan-versio
r-env/452 (oletus)	7.1.2026	3.22	2026.01.0-392	2025.3.0	2.38.0
r-env/451	7.7.2025	3.21	2025.05.1-513	2025.2.0	2.36.0
r-env/442	12.2.2025	3.20	2024.12.0-467	2025.0.1	2.36.0
r-env/440	15.5.2024	3.19	2024.04.0-735	2024.1.0	2.35.0
r-env/432	15.1.2024	3.18	2023.12.0-369	2024.0.0	2.34.1
r-env/430	07.6.2023	3.17	2023.06.0-421	2023.1.0	2.32.2
r-env/422	06.3.2023	3.16	2023.03.0-386	2023.1.0	2.32.1
r-env/421	29.6.2022	3.15	2022.02.3-492	2022.1.0	2.30.1

Moduulin nimi (R-versio)	CRAN-pakettien päiväys	Bioconductor-versio	RStudio Server -versio	oneMKL-versio	Cmdstan-versio
r-env/452 (oletus)	7.1.2026	3.22	2026.01.0-392	2025.3.0	2.38.0
r-env/451	7.7.2025	3.21	2025.05.1-513	2025.2.0	2.36.0
r-env/442	12.2.2025	3.20	2024.12.0-467	2025.0.1	2.36.0

Muut ohjelmistot ja kirjastot:

Open MPI (Mellanox OFED™ -ohjelmistolla) 4.1.7 (r-env/451, r-env/452), 4.1.2 (r-env/421:stä r-env 442:een)
TensorFlow 2.20.0 (r-env/452), 2.19.0 (r-env/451), 2.18.0 (r-env/442), 2.9.1 (r-env/421:stä r-env/440:een)
cget 0.2.0

Lisenssit

Tietoa R:n ja siihen liittyvien ohjelmistojen (mukaan lukien paketit) käytössä olevista lisensseistä löytyy R Projectin verkkosivuilta. Paketin tarkan lisenssin voi tarkistaa myös R:n sisällä: packageDescription("package", fields="License"). Lisätietoa R:n ja eri R-pakettien siteeraamisesta (sivun alareunassa).
RStudio Server -asennus perustuu Open Source Editioniin (saatavilla AGPL v3 -lisenssillä). Tutustu myös RStudio End User License Agreementiin.
Open MPI:tä jaellaan 3-lausekkeen BSD-lisenssillä (lisätietoja Open MPI:n verkkosivuilla).
Mellanox OFED™ perustuu OFED™:iin (saatavilla kaksoislisenssillä BSD tai GPL 2.0) sekä suljettuihin komponentteihin (katso Mellanox OFED™ End-User Agreement).
Intel® MKL:ää jaellaan Intel Simplified Software License -lisenssillä.
NVIDIA NCCL:ää jaellaan 3-lausekkeen BSD-lisenssillä.
NVIDIA cuDNN:ää jaellaan Software License Agreement for NVIDIA software development kits -lisenssillä.
cget on saatavilla Boost Software License -lisenssillä.
CmdStania jaellaan 3-lausekkeen BSD-lisenssillä.

Lisenssitiedot r-env-kontin sisältä löytyvät tiedostosta /usr/licensing.txt.

Käyttö

R:ää voi käyttää r-env-moduulilla useilla tavoilla:

Interaktiivinen käyttö

RStudio Server, joka toimii interaktiivisissa ajoissa laskentasolmulla
R-konsoli komentorivillä interaktiivisessa komentotulkki-istunnossa laskentasolmulla
Kirjautumissolmulla R-konsolia käyttäen. Käytä tätä vaihtoehtoa vain datan siirtämiseen, pakettien saatavuuden tarkistamiseen ja pakettien asentamiseen. Puhtin kirjautumissolmut eivät ole tarkoitettu raskasta laskentaa varten.

interactive-osiossa ajettavilla interaktiivisilla ajoilla on tietyt resurssirajat (aika, muisti, CPU-ytimet). Katso saatavilla olevat resurssit Puhdissa ja saatavilla olevat resurssit Mahdissa.

Ei-interaktiivinen käyttö

Ei-interaktiiviset eräajot ilman varattuihin laskentaresursseihin kohdistuvia rajoituksia (muiden kuin kyseiseen CSC:n supertietokoneeseen yleisesti sovellettavien rajoitusten osalta)

Miten minun kannattaa käyttää R:ää r-env:n kanssa?

Interaktiivinen käyttö on tarkoitettu koodin valmisteluun ja pienempiin analyyseihin, jotka kestävät enintään muutamia tunteja, ja siinä voi olla rajalliset resurssit.
Ei-interaktiiviset eräajot tarjoavat enemmän resursseja, ja niitä tulisi käyttää erityisesti pitkiin tai paljon resursseja vaativiin tehtäviin.

Interaktiivinen käyttö laskentasolmulla

1. RStudio

r-env-moduulia voidaan käyttää RStudio Serverin käynnistämiseen etänä verkkoselaimessa.

Suositeltu tapa käynnistää RStudio on käyttää supertietokoneen selainkäyttöliittymää. Katso myös erillinen dokumentaatio selainkäyttöliittymän RStudiosta.

RStudio Serverin voi käynnistää myös SSH-tunneloinnin kautta. Tämä vaihtoehto vaatii tunnistautumisen Secure Shell (SSH) -avaimella. Yksityiskohtaiset ohjeet löytyvät erillisestä RStudio Serverin käyttöohjeesta.

RStudio on tarkoitettu interaktiiviseen työskentelyyn, joka käyttää kohtuullisen määrän laskentaresursseja. Pitkät, paljon muistia vaativat tai muuten raskaat tehtävät kannattaa tehdä ei-interaktiivisina eräajoina.

2. R-konsoli interaktiivisessa komentotulkki-istunnossa

Jos haluat käyttää R:ää interaktiivisesti komentoriviltä laskentasolmulla, käynnistä ensin interaktiivinen komentotulkki-istunto.

Interaktiivisen komentotulkki-istunnon käynnistäminen (näytä ohjeet klikkaamalla)

Vaihtoehto 1. Avaa supertietokoneen selainkäyttöliittymissä komentotulkki-istunto työkalulla Compute node shell. Resursseja valitessasi varmista, että varaat paikallista levytilaa väliaikaistiedostoille.

Vaihtoehto 2. Kun yhdistät supertietokoneeseen omalta työasemaltasi SSH-asiakasohjelmalla, avaa komentotulkki-istunto käyttäen sinteractive-komentoa. Esimerkiksi alla oleva komento käynnistäisi istunnon, jossa on 4 Gt muistia ja 8 Gt paikallista levytilaa. Paikallista levytilaa tulee aina varata väliaikaistiedostoille valinnalla --tmp, kun R:ää käytetään interaktiivisesti.

PuhtiMahti

sinteractive --account <project> --mem 4000 --tmp 8

# On Mahti, each core gives 1.875 GB of memory
sinteractive --account <project> --cores 2 --tmp 8

On mahdollista määrittää myös muita valintoja, mukaan lukien ajoaika (katso sinteractive-dokumentaatio).

Kun olet avannut interaktiivisen komentotulkki-istunnon, voit käynnistää R:n komentoriviversion seuraavasti (huomaa, että komento täytyy suorittaa laskentasolmulla):

module load r-env
start-r

R-konsolia on mahdollista käyttää myös kirjautumissolmulla kevyisiin tehtäviin. Käytä tätä vaihtoehtoa vain datan siirtämiseen, pakettien saatavuuden tarkistamiseen ja pakettien asentamiseen. Puhtin kirjautumissolmut eivät ole tarkoitettu raskasta laskentaa varten.

Käynnistä R-konsoli kirjautumissolmulla suorittamalla seuraavat komennot:

module load r-env
apptainer_wrapper exec R --no-save

Ei-interaktiiviset eräajot

R-skriptien ajaminen ei-interaktiivisesti eräajotiedostojen avulla antaa käyttöön enemmän resursseja ja painottaa tehokkuutta interaktiivisuuden sijaan. Eräajoja suositellaan erityisesti kaikkiin pitkiin ja paljon resursseja vaativiin tehtäviin.

Seuraavien esimerkkien lisäksi katso yleinen eräajodokumentaatio saadaksesi lisätietoa. Jos eräajot ovat sinulle uusia, tutustu CSC Computing Environment -kurssin eräajoaineistoihin ja tähän ohjeeseen interaktiivisten R-ajojen ja R-eräajojen suorittamisesta.

Perus-R-eräajoskripti

Alla on esimerkki sarjallisesta R-eräajosta, joka käyttää yhtä ydintä. Huomaa, että käytössä on test-osio, jonka aikaraja on 15 minuuttia ja jota käytetään vain testaustarkoituksiin. Varsinaiset R-eräajot tulisi useimmissa tapauksissa ajaa small-osiossa. Katso lisätiedot saatavilla olevista eräajo-osioista Puhdissa ja Mahdissa.

Enemmän kuin yksi CPU-ydin?

Oletuksena R käyttää yhtä CPU-ydintä. Kun työskentelet R-skriptin tai -paketin kanssa, joka voi hyödyntää useita ytimiä ja rinnakkaisprosessointia, tutustu rinnakkaisten R-eräajoskriptien esimerkkeihin.

Määrittelemme eräajoskriptin suorittamaan R-skriptin (tässä myscript.R) käyttäen apptainer_wrapper-komentoa, joka varmistaa, että projektihakemistot näkyvät siinä Apptainer-kontissa, jossa r-env toimii.

PuhtiMahti

#!/bin/bash -l
#SBATCH --job-name=r_serial     # Job name
#SBATCH --account=<project>     # Define the billing project, e.g. project_2001234
#SBATCH --output=output_%j.txt  # File for storing output (%j will be replaced by job id)
#SBATCH --error=errors_%j.txt   # File for storing errors
#SBATCH --partition=test        # Job queue (partition): in general use 'small'
#SBATCH --time=00:05:00         # Max. duration of the job (hh:mm:ss)
#SBATCH --cpus-per-task=1       # Number of cores
#SBATCH --ntasks=1              # Number of tasks (only change this for multi-node/MPI jobs)
#SBATCH --nodes=1               # Number of nodes (only change this for multi-node/MPI jobs)
#SBATCH --mem-per-cpu=2000      # Memory to reserve per core

# Load the r-env module
module load r-env

# Clean up .Renviron file in home directory
if test -f ~/.Renviron; then
    sed -i '/TMPDIR/d' ~/.Renviron
fi

# Specify a temporary directory path (replace <project> with your project)
echo "TMPDIR=/scratch/<project>" >> ~/.Renviron

# Run the R script
srun apptainer_wrapper exec Rscript --no-save myscript.R

#!/bin/bash -l
#SBATCH --job-name=r_serial     # Job name
#SBATCH --account=<project>     # Define the billing project, e.g. project_2001234
#SBATCH --output=output_%j.txt  # File for storing output (%j replaced by job id)
#SBATCH --error=errors_%j.txt   # File for storing errors (%j replaced by job id)
#SBATCH --partition=test        # Job queue (partition), in general use 'small'
#SBATCH --time=00:05:00         # Max. duration of the job (hh:mm:ss)
#SBATCH --cpus-per-task=1       # Number of cores (1.875 GB of memory each)
#SBATCH --ntasks=1              # Number of tasks (only change this for multi-node/MPI jobs)
#SBATCH --nodes=1               # Number of nodes (only change this for multi-node/MPI jobs)

# Load the r-env module
module load r-env

# Clean up .Renviron file in home directory
if test -f ~/.Renviron; then
    sed -i '/TMPDIR/d' ~/.Renviron
fi

# Specify a temporary directory path (replace <project> with your project)
echo "TMPDIR=/scratch/<project>" >> ~/.Renviron

# Run the R script
srun apptainer_wrapper exec Rscript --no-save myscript.R

Yllä olevassa esimerkissä yksi tehtävä (--ntasks=1) suoritetaan yhdellä CPU-ytimellä (--cpus-per-task=1), 2 Gt muistilla (--mem-per-cpu=2000) ja viiden minuutin ajoajalla (--time=00:05:00), jotka on varattu työlle.

Komento module load r-env lataa uusimman saatavilla olevan r-env-version. Jos haluat määrittää ladattavan moduuliversion, käytä komentoa module load r-env/<version>, esimerkiksi module load r-env/452.

Tärkeää

R-eräajoissa varmista, että määrität väliaikaishakemiston polun projektisi scratch-hakemistoon /scratch/<project> kuten yllä olevassa esimerkissä. Tai jos työsi lukee ja kirjoittaa paljon tiedostoja, käytä sen sijaan nopeaa paikallista levytilaa.

Muuten väliaikaistiedostot menevät hakemistoon /tmp, jossa on rajallisesti tilaa ja joka täyttyy helposti, mikä haittaa sinun ja muiden käyttäjien töitä.

Kun eräajotiedosto on valmis, se lähetetään eräajojärjestelmään kirjautumissolmulla:

sbatch batch_job_file.sh

Rinnakkaiset eräajot

r-env-moduulia voidaan käyttää rinnakkaislaskentaan useilla tavoilla. Näihin kuuluvat moniydin- ja taulukkotyöt sekä MPI (Message Passing Interface) -pohjaiset ja usean solmun ajot. Moduulin mukana tulee useita paketteja, jotka tukevat monisolmuviestintää MPI:n kautta: future, snow, doMPI (käytettynä foreach-paketin kanssa) ja pbdMPI.

Katso erillinen dokumentaatio seuraavista:

Lisäneuvoja rinnakkaisista R-ajoista ja niiden tehokkaasta suorittamisesta CSC:n supertietokoneilla saat ottamalla yhteyttä CSC:n asiakastukeen.

R-pakettien asennukset

r-env sisältää yli 1500 esiasennettua R-pakettia. Jos haluat tarkistaa, onko tietty paketti jo asennettu, helpoin tapa on yrittää ladata se:

library(packagename)

Jos et halua ladata pakettia, voit myös hakea sitä listasta:

installed_packages <- library()$results[,1]
"packagename" %in% installed_packages

Lisä-R-paketteja voidaan asentaa kahta reittiä:

Asenna paketti itse projektillesi erilliseen pakettihakemistoon /projappl/<project>-hakemistossa (ohjeet alla)
Pyydä yleistä asennusta (tarjotaan kaikille käyttäjille osana moduulia): ota yhteyttä CSC:n asiakastukeen

Jos haluat asentaa paketin itse projektillesi:

Luo ensin uusi kansio projektisi projappl -hakemistoon. Huomaa, että kansion tulee olla käytössäsi olevalle R-versiolle oma. Eri r-env- ja R-versio vaativat uuden asennuksen. Komentokehotteessa:

cd /projappl/<project>
mkdir project_rpackages_<rversion>

Tämän jälkeen voit lisätä kansion R:n kirjastopolkuihin suorittamalla R:ssä:

.libPaths(c("/projappl/<project>/project_rpackages_<rversion>", .libPaths()))

Jos haluat käyttää /projappl:iin asennettuja R-paketteja, lisää yllä oleva komento R-skriptisi alkuun. Se muokkaa kirjastopolkuja vain kyseisen R-istunnon aikana. Toisin sanoen sinun täytyy suorittaa se joka kerta, kun käynnistät R:n.

Yllä olevien ohjeiden jälkeen pakettiasennusten pitäisi nyt oletuksena kohdistua projektikansioon. Seuraavaa komentoa voidaan käyttää tarkistamaan, että kansio näkyy R:lle. Sen pitäisi olla listan ensimmäisenä.

.libPaths()

Voit tarvittaessa määrittää polun myös asennuskomennossa:

libpath <- .libPaths()[1]
install.packages("package", lib = libpath)

R-version voi hakea myös automaattisesti käyttäen getRversion()-funktiota. Esimerkiksi:

.libPaths(paste0("/projappl/<project>/project_rpackages_", gsub("\\.", "", getRversion())))

Jotta .libPaths-asetusta ei tarvitsisi määrittää joka kerta R:ää käynnistettäessä, voit lisätä halutut muutokset .Renviron-tiedostoon alla olevan esimerkin mukaisesti. Tätä lähestymistapaa suositellaan erityisesti, jos asentamaasi pakettia käytetään rinnakkaisprosessoinnissa, jotta kaikki prosessit näkevät paketin.

echo "R_LIBS=/projappl/<project>/project_rpackages_<rversion>" >> ~/.Renviron

Kun käytät r-env:iä, käyttäjän määrittämät muutokset R:n kirjastopolkuihin täytyy määrittää R-istunnon sisällä tai .Renviron-tiedostoon liittyen. Muut muutokset (esim. ympäristömuuttujien muokkaaminen export-komennolla) eivät toimi, koska R-asennus toimii Apptainer-kontin sisällä. Jos analyysisi vaatisi muutoksia, joita ei voi toteuttaa yllä kuvatuilla tavoilla, ota yhteyttä meihin moduulitasoisen pakettiasennuksen saamiseksi.

Nopean paikallisen levytilan käyttö

Töissä, jotka lukevat ja kirjoittavat suuria määriä tiedostoja (I/O-intensiiviset analyysit), voidaan käyttää nopeaa paikallista levytilaa ei-interaktiivisissa eräajoissa pienin muutoksin eräajotiedostoon. Interaktiiviset R-ajot käyttävät nopeaa paikallista levytilaa oletuksena.

Alla on esimerkki sarjallisesta eräajosta, joka käyttää 10 Gt nopeaa paikallista levytilaa (--gres=nvme:10). Tässä väliaikaishakemisto määritetään ympäristömuuttujalla TMPDIR, toisin kuin aiemmassa esimerkissä, jossa se asetettiin muotoon /scratch/<project>.

PuhtiMahti

#!/bin/bash -l
#SBATCH --job-name=r_serial_fastlocal
#SBATCH --account=<project>
#SBATCH --output=output_%j.txt
#SBATCH --error=errors_%j.txt
#SBATCH --partition=test
#SBATCH --time=00:05:00
#SBATCH --ntasks=1
#SBATCH --nodes=1
#SBATCH --cpus-per-task=1
#SBATCH --mem-per-cpu=1000
#SBATCH --gres=nvme:10

# Load the module
module load r-env

# Clean up .Renviron file in home directory
if test -f ~/.Renviron; then
    sed -i '/TMPDIR/d' ~/.Renviron
fi

# Specify temporary directory to the fast local storage
echo "TMPDIR=$TMPDIR" >> ~/.Renviron

# Run the R script
srun apptainer_wrapper exec Rscript --no-save myscript.R

#!/bin/bash -l
#SBATCH --job-name=r_serial_fastlocal
#SBATCH --account=<project>
#SBATCH --output=output_%j.txt
#SBATCH --error=errors_%j.txt
#SBATCH --partition=test
#SBATCH --time=00:05:00
#SBATCH --ntasks=1
#SBATCH --nodes=1
#SBATCH --cpus-per-task=1 # Each core gives 1.875 GB of memory
#SBATCH --gres=nvme:10

# Load the module
module load r-env

# Clean up .Renviron file in home directory
if test -f ~/.Renviron; then
    sed -i '/TMPDIR/d' ~/.Renviron
fi

# Specify temporary directory to the fast local storage
echo "TMPDIR=$TMPDIR" >> ~/.Renviron

# Run the R script
srun apptainer_wrapper exec Rscript --no-save myscript.R

Väliaikaistiedostojen tallennuksen lisäksi analysoitavat aineistot voidaan tallentaa nopealle paikalliselle levylle sijaintiin, jonka muuttuja LOCAL_SCRATCH määrittää. Jotta R löytää datasi, sinun täytyy ilmoittaa tämä sijainti R-skriptissäsi. Kun olet käynnistänyt R:n, voit tulostaa sijainnin seuraavalla komennolla:

Sys.getenv("LOCAL_SCRATCH")

`r-env`:n käyttö Stanin kanssa

r-env-moduuli sisältää useita paketteja, jotka tarjoavat rajapinnan Staniin bayesiläiseen päättelyyn perustuvaa tilastollista mallinnusta varten, kuten rstan ja cmdstanr.

R:n käyttö CmdStan-taustaosan kanssa

r-env-moduulin mukana tulee erillinen CmdStan -asennus, joka on sidottu jokaiseen moduuliversioon. Sen käyttämiseksi täytyy asettaa oikea polku CmdStaniin käyttäen cmdstanr:ää. Esimerkiksi r-env/452:lle tämä tehdään seuraavasti:

cmdstanr::set_cmdstan_path("/appl/soft/math/r-env/452-stan/cmdstan-2.38.0")

Jos käytät CmdStania interaktiivisessa istunnossa, yllä oleva komento toimii suoraan. Ei-interaktiivisissa eräajoissa polku CmdStaniin täytyy asettaa erikseen eräajotiedostossa. Tämä tehdään lisäämällä seuraavat komennot muun eräajotiedoston sisällön lisäksi:

# Set R version
export RVER=452

# Launch R after binding CmdStan
SING_FLAGS="$SING_FLAGS -B /appl/soft/math/r-env/${RVER}-stan:/appl/soft/math/r-env/${RVER}-stan"
srun apptainer_wrapper exec Rscript --no-save script.R

Muut CmdStan-taustaosan käyttöön liittyvät yksityiskohdat ovat pakettikohtaisia. Yhtenä esimerkkinä sitä voisi käyttää brms -paketin kanssa:

library(brms)

fit_serial <- brm(
  count ~ zAge + zBase * Trt + (1|patient),
  data = epilepsy, family = poisson(),
  chains = 4, cores = 4, backend = "cmdstanr"
)

Huomaa, että brms:n ketjunsisäinen rinnakkaistus vaatii projektikohtaisen CmdStan-asennuksen. Ota yhteyttä CSC:n asiakastukeen saadaksesi ohjeet.

Säieaffiniteettimuuttujan APPTAINERENV_OMP_PLACES=cores on havaittu häiritsevän rstan-pakettia käyttäviä rinnakkaisajoja. Suosittelemme tällä hetkellä, että tätä muuttujaa ei käytetä Stania hyödyntävissä rinnakkaisissa R-ajoissa.

Profilointityökalut R:ssä

Yleisimmät profilointityökalut R:ssä ovat utils::Rprof() ja profvis. Kun yrität nopeuttaa R-ajoa, voit käyttää näitä työkaluja tunnistaaksesi skriptisi hitaimmat osat ja muokataksesi niitä sitten. Esimerkiksi eri pakettien funktiot voivat käyttää eri määrän aikaa samankaltaiseen laskennalliseen tehtävään. Lisätietoa saat aloittamalla lukemalla profiloinnista profvisillä RStudiossa ja profiloinnista R:ssä yleisesti.

Käytännössä yleensä paras tapa nopeuttaa R-ajoa supertietokoneella on muokata se käyttämään useita ytimiä ja ajamaan rinnakkain. Katso esimerkkejä rinnakkaisista R-eräajoskripteistä ja johdanto rinnakkaisiin R-ajoihin, ja ota yhteyttä CSC:n asiakastukeen saadaksesi neuvoja.

Työskentely Allaksen kanssa

r-env-moduulin mukana tulee aws.s3 -paketti S3-tallennuksen käyttöön, mikä mahdollistaa Allas-tallennusjärjestelmän käytön suoraan R-skriptistä. Katso tästä linkistä käytännön esimerkki rasteridataan liittyen.

Allakseen pääsee käsiksi r-env-moduulin kautta seuraavasti. Määritä ensin Allas suorittamalla nämä komennot terminaalissa:

module load allas
allas-conf --mode s3cmd

Voit nyt hakea ämpärilistasi seuraavasti. Huomaa, että jotta tämä toimisi, bucketlist()-funktioon täytyy lisätä argumentti region='':

Sys.setenv(AWS_S3_ENDPOINT="a3s.fi")
library(aws.s3)
bucketlist(region='')

Viittaaminen

Jos haluat selvittää oikeat viittaukset R:lle ja eri R-paketeille, voit kirjoittaa:

citation() # for citing R
citation("package") # for citing R packages

Lisätietoa

Johdanto rinnakkaisiin töihin R:llä
Rinnakkaisten R-eräajojen skriptit
r-env-kontin reseptit (linkki julkiseen GitHub-repositorioon)
R UKK (CRANin ylläpitämä)
Aiheeseen liittyvät projektit (lista R-aiheisista projekteista R Projectin verkkosivuilla)
R-pakettien cheatsheetit (ylläpidetty RStudion verkkosivuilla)
tidyverse (esiasennettu r-env-moduuliin)

r-env

Saatavilla

Lisenssit

Käyttö

Interaktiivinen käyttö laskentasolmulla

Interaktiivinen käyttö kirjautumissolmulla

Ei-interaktiiviset eräajot

Perus-R-eräajoskripti

Rinnakkaiset eräajot

R-pakettien asennukset

Nopean paikallisen levytilan käyttö

r-env:n käyttö Stanin kanssa

Profilointityökalut R:ssä

Työskentely Allaksen kanssa

Viittaaminen

Lisätietoa

`r-env`:n käyttö Stanin kanssa