-
TopHat
TopHat
TopHat on nopea silmukointiliitoskohtien kartoittaja RNA-Seq-lukemille. Se kohdistaa RNA-Seq-lukemat nisäkäskokoisiin genomeihin käyttäen erittäin suuren läpimenon lyhyiden lukemien kohdistusohjelmaa Bowtie'ta ja analysoi sitten kohdistustulokset tunnistaakseen eksonien väliset silmukointiliitoskohdat.
Lisenssi
Vapaasti käytettävissä ja avointa lähdekoodia Boost Software License 1.0 -lisenssillä.
Saatavuus
- Puhti: 2.1.1
- Chipster -graafinen käyttöliittymä
Käyttö
Puhdissa TopHat otetaan käyttöön komennolla:
Biokit-moduuli ottaa käyttöön joukon yleisesti käytettyjä bioinformatiikan työkaluja, mukaan lukien Bowtie2:n, TopHat2:n ja Cufflinksin.
TopHat-ajot tulee suorittaa eräajoina. Alla on esimerkkieräajotiedosto TopHat-ajon suorittamiseen Puhdissa:
!/bin/bash
#SBATCH --job-name=tophat
#SBATCH --output=out_%j.txt
#SBATCH --error=err_%j.txt
#SBATCH --ntasks=1
#SBATCH --cpus-per-task=4
#SBATCH --mem=16G
#SBATCH --time=24:00:00
#SBATCH --partition=small
#SBATCH --account=project_1234567
module load biokit
tophat -p $SLURM_CPUS_PER_TASK -o tophat_results Homo.sapiens_bwt2_index reads1.fq reads2.fq
Yllä olevassa eräajoesimerkissä suoritetaan yksi tehtävä (--ntasks=1). Ajo käyttää 4 ydintä (--cpus-per-task=4) ja 16 Gt muistia (--mem=16G). Ajon enimmäiskesto on 24 tuntia (--time=24:00:00). Muuta --account vastaamaan omaa projektisi nimeä.
Huomaa, että meidän täytyy myös kertoa TopHatille, kuinka monta varaamaamme ydintä sen tulee käyttää. TopHatissa tämä tehdään -p-komentoriviparametrilla. Voimme käyttää järjestelmämuuttujaa $SLURM_CPUS_PER_TASK, jotta se vastaa automaattisesti --cpus-per-task-asetuksella tehtyä varausta. Näin komentoriviä ei tarvitse muuttaa, jos muutamme varausta.
Katso lisätietoja eräajojen suorittamisesta Puhdin käyttöoppaasta.