Hyppää sisältöön

Welcome to our weekly research support coffee hour on Zoom! Click here for more information.

Warning!

Puhti scratch disk is becoming very full (80+ % ) resulting in performance degradation. Everybody is advised to only keep actively processed data on scratch, all other data should be deleted, transferred to host institute or stored in Lumi-O. No new quota will be granted. Click here for a tool for examining your disk usage.

BRAKER

BRAKER on työkalu eukaryoottigenomien annotointiin. Se käyttää genomi- ja RNA-Seq-dataa tuottaakseen automaattisesti täydelliset geenirakenneannotaatiot uudelle genomille. BRAKER perustuu GeneMark-ET R2- ja AUGUSTUS-putkiin.

Lisenssi

Vapaasti käytettävä ja avointa lähdekoodia [Artistic License] (https://opensource.org/licenses/artistic-license-1.0) -lisenssillä

Saatavuus

Puhti: 2.1.6, 3.0.7, 3.0.8

BRAKERin käyttöönotto

BRAKER vaatii joitakin lisäasetuksia ennen ensimmäistä käyttökertaa.

CSC:n BRAKER-asennukset eivät sisällä GeneMark- tai ProtHint-ohjelmistopaketteja. Vaikka ne ovat ilmaisia yksityiskäyttöön, niiden lisenssiehdot eivät salli CSC:n tehdä niistä julkista asennusta. Jokaisen käyttäjän täytyy lisensoida ja asentaa ne omaan käyttöönsä.

GeneMark

Siirry GeneMarkin lataussivulle ja täytä lomake. Tarvitsemasi versio on "GeneMark-ES/ET/EP+" alustalle "LINUX 64 kernel 3.10 - 5". Lataa ohjelmatiedosto ja lisenssiavain. Pakettien purkaminen:

tar xf gmes_linux_64_4.tar.gz
gunzip gm_key_64.gz

Kopioi purettu avaintiedosto kotihakemistoosi nimellä .gm_key.

cp gm_key_64 $HOME/.gm_key

Kerro BRAKERille, mistä GeneMark löytyy, käyttämällä komentorivivalitsinta --GENEMARK_PATH, joka osoittaa asennussijaintiin.

--GENEMARK_PATH=/path/to/gmes_linux_64_4

BRAKER-moduuli sisältää kaikki tarvittavat riippuvuudet.

ProtHint

Lataa ja pura ProtHint.

wget https://github.com/gatech-genemark/ProtHint/releases/download/v2.6.0/ProtHint-2.6.0.tar.gz
tar xf ProtHint-2.6.0.tar.gz

Käytä komentorivivalitsinta --PROTHINT_PATH, joka osoittaa asennussijaintiin.

--PROTHINT_PATH=/path/to/ProtHint-2.6.0/bin

BRAKER-moduuli sisältää kaikki tarvittavat riippuvuudet.

AUGUSTUS

AUGUSTUS sisältyy asennukseen, mutta tarvitset oman kopion AUGUSTUSin config-hakemistosta, koska käyttäjällä täytyy olla siihen kirjoitusoikeus. Voit luoda tämän suorittamalla komennon:

copy_config

Se luo hakemiston config nykyiseen hakemistoosi.

Käytä komentorivivalitsinta --AUGUSTUS_CONFIG_PATH, joka osoittaa config-hakemistoon

Käyttö

Puhdissa BRAKERia tulee käyttää vain eräajoissa, joko tavallisissa eräajoissa tai interaktiivisissa eräajoissa.

Interaktiivinen käyttö

Voit käynnistää interaktiivisen eräajon komennolla:

sinteractive -i

BRAKER voi hyödyntää useita laskentaytimiä ja vaatia huomattavan määrän muistia, joten interaktiiviselle eräajollesi kannattaa varata enemmän kuin oletusresurssit. Esimerkiksi 4 ydintä ja 32 Gt muistia.

Eräajossa voit alustaa BRAKER-ympäristön komennolla

module load braker

Sen jälkeen voit käynnistää BRAKER-ajon komennolla:

braker.pl

Näet valitsimet suorittamalla komennon:

braker.pl --help

Esimerkkikomento BRAKERille Puhdissa:

braker.pl --species=sp1 --genome=genome.fa --prot_seq=proteins.fa --AUGUSTUS_ab_initio --threads=$SLURM_CPUS_PER_TASK --GENEMARK_PATH=/path/to/gmes_linux_64_4 --PROTHINT_PATH=/path/to/ProtHint-2.6.0/bin --AUGUSTUS_CONFIG_PATH /path/to/config

Eräajot

Esimerkki BRAKERin eräajoskriptistä:

#!/bin/bash
#SBATCH --job-name=BRAKER_Job
#SBATCH --account=project_2012345
#SBATCH --time=24:00:00
#SBATCH --mem=32000
#SBATCH --nodes=1
#SBATCH --ntasks=1
#SBATCH --cpus-per-task=8
#SBATCH --partition=small

# load braker
module load braker

# Use correct paths instead of "/path/to"
braker.pl --species=sp1 --genome=genome.fa --prot_seq=proteins.fa \
--AUGUSTUS_ab_initio --threads=$SLURM_CPUS_PER_TASK \
--GENEMARK_PATH=/path/to/gmes_linux_64_4 \
--PROTHINT_PATH=/path/to/ProtHint-2.6.0/bin \
--AUGUSTUS_CONFIG_PATH /path/to/config

Yllä olevassa eräajoesimerkissä suoritetaan yksi tehtävä (--ntasks 1). BRAKER-ajo käyttää 8 ydintä (--cpus-per-task=8) ja yhteensä 32 Gt muistia (--mem=32000). Ajolle sallittu enimmäiskesto on kymmenen tuntia (--time 10:00:00). Kaikki ytimet varataan yhdeltä laskentasolmulta (--nodes=1). Esimerkissä käytettävä projekti on project_2012345. Tämä arvo tulee korvata oman laskentaprojektisi nimellä.

Voit lähettää eräajotiedoston eräajojärjestelmään komennolla:

sbatch batch_job_file.bash

Katso lisätietoja eräajojen suorittamisesta Puhdin käyttöoppaasta.

Lisätietoja

Suomenkielinen tekoälykäännös

Sisällössä voi esiintyä virheellistä tietoa tekoälykäännöksestä johtuen.

Klikkaa tästä antaaksesi palautetta