Hyppää sisältöön

Docs CSC now features an automatic Finnish translation. Click here for more information.

Warning!

Puhti and Mahti will be decommissioned after Roihu becomes available. Users should clean up unnecessary files and move any required data by the end of August 2026. See the Roihu data preparation instructions for details.

Puhti scratch is very full: keep only active data there and move or delete everything else. No new Puhti scratch quota will be granted.

BRAKER

BRAKER on työkalu eukaryoottigenomien annotointiin. Se käyttää genomi- ja RNA-Seq-dataa tuottaakseen automaattisesti täydelliset geenirakenneannotaatiot uudelle genomille. BRAKER perustuu GeneMark-ET R2- ja AUGUSTUS-putkiin.

Lisenssi

Vapaasti käytettävä ja avointa lähdekoodia [Artistic License] (https://opensource.org/licenses/artistic-license-1.0) -lisenssillä

Saatavuus

Puhdissa: 2.1.6, 3.0.7, 3.0.8

BRAKERin käyttöönotto

BRAKER vaatii joitakin lisäkäyttöönottovaiheita ennen ensimmäistä käyttökertaa.

CSC:n BRAKER-asennukset eivät sisällä GeneMark- tai ProtHint-ohjelmistopaketteja. Vaikka ne ovat ilmaisia henkilökohtaiseen käyttöön, niiden lisenssiehdot eivät salli CSC:n tehdä niistä julkista asennusta. Jokaisen käyttäjän täytyy lisensoida ja asentaa ne omaan käyttöönsä.

GeneMark

Siirry GeneMarkin lataussivulle ja täytä lomake. Tarvitsemasi versio on "GeneMark-ES/ET/EP+" alustalle "LINUX 64 kernel 3.10 - 5". Lataa ohjelmatiedosto ja lisenssiavain. Pakettien purkaminen:

tar xf gmes_linux_64_4.tar.gz
gunzip gm_key_64.gz

Kopioi purettu avaintiedosto kotihakemistoosi nimellä .gm_key.

cp gm_key_64 $HOME/.gm_key

Jotta BRAKER tietää, mistä GeneMark löytyy, käytä komentorivivalitsinta --GENEMARK_PATH osoittamaan asennussijaintiin.

--GENEMARK_PATH=/path/to/gmes_linux_64_4

BRAKER-moduuli sisältää kaikki tarvittavat riippuvuudet.

ProtHint

Lataa ja pura ProtHint.

wget https://github.com/gatech-genemark/ProtHint/releases/download/v2.6.0/ProtHint-2.6.0.tar.gz
tar xf ProtHint-2.6.0.tar.gz

Käytä komentorivivalitsinta --PROTHINT_PATH osoittamaan asennussijaintiin.

--PROTHINT_PATH=/path/to/ProtHint-2.6.0/bin

BRAKER-moduuli sisältää kaikki tarvittavat riippuvuudet.

AUGUSTUS

AUGUSTUS sisältyy asennukseen, mutta tarvitset oman kopion AUGUSTUSin config-hakemistosta, koska sen on oltava käyttäjän kirjoitettavissa. Voit luoda tämän suorittamalla komennon:

copy_config

Se luo hakemiston config nykyiseen hakemistoosi.

Käytä komentorivivalitsinta --AUGUSTUS_CONFIG_PATH osoittamaan config-hakemistoon

Käyttö

Puhdissa BRAKERia tulee käyttää vain eräajoissa, joko tavallisissa eräajoissa tai interaktiivisissa eräajoissa.

Interaktiivinen käyttö

Voit käynnistää interaktiivisen eräajon komennolla:

sinteractive -i

BRAKER voi hyödyntää useita laskentaytimiä ja vaatia merkittävän määrän muistia, joten interaktiiviselle eräajollesi kannattaa varata enemmän kuin oletusresurssit. Esimerkiksi 4 ydintä ja 32 Gt muistia.

Eräajossa voit alustaa BRAKER-ympäristön komennolla

module load braker

Sen jälkeen voit käynnistää BRAKER-ajon komennolla:

braker.pl

Näet valitsimet suorittamalla komennon:

braker.pl --help

Esimerkkikomento BRAKERille Puhdissa:

braker.pl --species=sp1 --genome=genome.fa --prot_seq=proteins.fa --AUGUSTUS_ab_initio --threads=$SLURM_CPUS_PER_TASK --GENEMARK_PATH=/path/to/gmes_linux_64_4 --PROTHINT_PATH=/path/to/ProtHint-2.6.0/bin --AUGUSTUS_CONFIG_PATH /path/to/config

Eräajot

Esimerkki BRAKERin eräajokomentosarjasta:

#!/bin/bash
#SBATCH --job-name=BRAKER_Job
#SBATCH --account=project_2012345
#SBATCH --time=24:00:00
#SBATCH --mem=32000
#SBATCH --nodes=1
#SBATCH --ntasks=1
#SBATCH --cpus-per-task=8
#SBATCH --partition=small

# load braker
module load braker

# Use correct paths instead of "/path/to"
braker.pl --species=sp1 --genome=genome.fa --prot_seq=proteins.fa \
--AUGUSTUS_ab_initio --threads=$SLURM_CPUS_PER_TASK \
--GENEMARK_PATH=/path/to/gmes_linux_64_4 \
--PROTHINT_PATH=/path/to/ProtHint-2.6.0/bin \
--AUGUSTUS_CONFIG_PATH /path/to/config

Yllä olevassa eräajoesimerkissä suoritetaan yksi tehtävä (--ntasks 1). BRAKER-ajo käyttää 8 ydintä (--cpus-per-task=8 ) ja yhteensä 32 Gt muistia (--mem=32000). Ajon enimmäiskesto on kymmenen tuntia (--time 10:00:00 ). Kaikki ytimet varataan yhdeltä laskentasolmulta (--nodes=1 ). Esimerkissä käytettävä projekti on project_2012345. Tämä arvo tulee korvata oman laskentaprojektisi nimellä.

Voit lähettää eräajotiedoston eräajojärjestelmään komennolla:

sbatch batch_job_file.bash

Katso lisätietoja eräajojen suorittamisesta Puhdin käyttöoppaasta.

Lisätietoja

Suomenkielinen tekoälykäännös

Sisällössä voi esiintyä virheellistä tietoa tekoälykäännöksestä johtuen.

Klikkaa tästä antaaksesi palautetta