Hyppää sisältöön

Docs CSC now features an automatic Finnish translation. Click here for more information.

Warning!

Puhti and Mahti will be decommissioned after Roihu becomes available. Users should clean up unnecessary files and move any required data by the end of August 2026. See the Roihu data preparation instructions for details.

Puhti scratch is very full: keep only active data there and move or delete everything else. No new Puhti scratch quota will be granted.

STAR

STAR (Spliced Transcripts Alignment to a Reference) on nopea NGS-lukujen kohdistin RNA-seq-datalle.

Lisenssi

Vapaasti käytettävissä ja avointa lähdekoodia GNU GPLv3 -lisenssillä.

Saatavuus

Puhti: 2.7.10a, 2.7.11a

Käyttö

Alla luetellut STAR-komennot aktivoidaan lataamalla biokit-moduuli.

module load biokit

Ennen kuin voit suorittaa varsinaisen kohdistustyön, fasta-muotoinen viitegenomi täytyy indeksoida. Puhdissa viitegenomi-indeksien työkopiot sekä muut suuret tiedostot tulee tallentaa /scratch-hakemistoon.

Käytön helpottamiseksi aseta ympäristömuuttuja osoittamaan /scratch-hakemistoosi. (Korvaa esimerkissä käytetty polku oikealla polulla.)

export SCRATCH=/scratch/project_12345/$USER

Luo hakemisto viitegenomin indeksille:

mkdir $SCRATCH/star-genome

Tämän jälkeen indeksointi voidaan tehdä komennolla:

STAR --runMode genomeGenerate --genomeDir $SCRATCH/star-genome --genomeFastaFiles /path/to/genome/genome.fasta --runThreadN 2

Kun indeksointi on valmis, varsinainen kohdistustehtävä voidaan käynnistää. STAR tuottaa kohdistuksen tulosteen kiinteillä tiedostonimillä. Siksi on suositeltavaa, että jokainen STAR-ajo suoritetaan uudessa, tyhjässä hakemistossa. Puhdissa tämä uusi työhakemisto kannattaa luoda projektisi /scratch-hakemistoon. Uusi hakemisto nimeltä starjob1 voidaan luoda komennolla:

mkdir $SCRATCH/starjob1

tämän jälkeen varsinainen kohdistustyö voidaan käynnistää komennoilla:

cd $SCRATCH/starjob1
STAR --genomeDir $SCRATCH/star-genomes --readFilesIn my_reads.fastq

STARin oletusparametrit ovat tyypillisiä 2x76- tai 2x101-Illumina-lukujen kohdistamiseen ihmisen genomiin.

Puhdissa kaikki laskentatehtävät tulee suorittaa eräajoina. Eräajoissa voit hyödyntää myös säiepohjaista rinnakkaistamista. Alla on esimerkki STARin eräajotiedostosta. Työ käyttää kuutta laskentaydintä yhdeltä laskentasolmulta. Muistivaraus on 24 Gt. Huomaa, että sinun täytyy muuttaa --account-asetus projektiasi vastaavaksi.

#!/bin/bash -l
#SBATCH --job-name=STAR
#SBATCH --output=STAR.stdout
#SBATCH --error=STAR.stderr
#SBATCH --partition=small
#SBATCH --ntasks=1
#SBATCH --nodes=1
#SBATCH --cpus-per-task=6
#SBATCH --account=project_1234567
#SBATCH --mem=24000

export SCRATCH=/scratch/project_12345/$USER

# calculate indexes. You don't need to recalculte the indexes if they already exist.
mkdir $SCRATCH/star-genome
STAR --runMode genomeGenerate --genomeDir $SCRATCH/star-genome --genomeFastaFiles /path/to/genome/genome.fasta --runThreadN $SLURM_CPUS_PER_TASK

# Run the mapping task
STAR --genomeDir $SCRATCH/star-genome --readFilesIn my-reads.fastq --runThreadN $SLURM_CPUS_PER_TASK

Eräajokomentosarja käynnistetään sbatch-komennolla. Esimerkiksi:

sbatch starjob1.sh

Lisätietoja

Suomenkielinen tekoälykäännös

Sisällössä voi esiintyä virheellistä tietoa tekoälykäännöksestä johtuen.

Klikkaa tästä antaaksesi palautetta