-
BRAKER
BRAKER
BRAKER on työkalu eukaryoottigenomien annotointiin. Se käyttää genomi- ja RNA-Seq-dataa tuottaakseen automaattisesti täydelliset geenirakenneannotaatiot uudelle genomille. BRAKER perustuu GeneMark-ET R2- ja AUGUSTUS-putkiin.
Lisenssi
Vapaasti käytettävä ja avointa lähdekoodia [Artistic License] (https://opensource.org/licenses/artistic-license-1.0) -lisenssillä
Saatavuus
Puhti: 2.1.6, 3.0.7, 3.0.8
BRAKERin käyttöönotto
BRAKER vaatii joitakin lisäasetuksia ennen ensimmäistä käyttökertaa.
CSC:n BRAKER-asennukset eivät sisällä GeneMark- tai ProtHint-ohjelmistopaketteja. Vaikka ne ovat ilmaisia yksityiskäyttöön, niiden lisenssiehdot eivät salli CSC:n tehdä niistä julkista asennusta. Jokaisen käyttäjän täytyy lisensoida ja asentaa ne omaan käyttöönsä.
GeneMark
Siirry GeneMarkin lataussivulle ja täytä lomake. Tarvitsemasi versio on "GeneMark-ES/ET/EP+" alustalle "LINUX 64 kernel 3.10 - 5". Lataa ohjelmatiedosto ja lisenssiavain. Pakettien purkaminen:
Kopioi purettu avaintiedosto kotihakemistoosi nimellä .gm_key.
Kerro BRAKERille, mistä GeneMark löytyy, käyttämällä komentorivivalitsinta --GENEMARK_PATH, joka osoittaa asennussijaintiin.
BRAKER-moduuli sisältää kaikki tarvittavat riippuvuudet.
ProtHint
Lataa ja pura ProtHint.
wget https://github.com/gatech-genemark/ProtHint/releases/download/v2.6.0/ProtHint-2.6.0.tar.gz
tar xf ProtHint-2.6.0.tar.gz
Käytä komentorivivalitsinta --PROTHINT_PATH, joka osoittaa asennussijaintiin.
BRAKER-moduuli sisältää kaikki tarvittavat riippuvuudet.
AUGUSTUS
AUGUSTUS sisältyy asennukseen, mutta tarvitset oman kopion AUGUSTUSin config-hakemistosta, koska käyttäjällä täytyy olla siihen kirjoitusoikeus. Voit luoda tämän suorittamalla komennon:
Se luo hakemiston config nykyiseen hakemistoosi.
Käytä komentorivivalitsinta --AUGUSTUS_CONFIG_PATH, joka osoittaa config-hakemistoon
Käyttö
Puhdissa BRAKERia tulee käyttää vain eräajoissa, joko tavallisissa eräajoissa tai interaktiivisissa eräajoissa.
Interaktiivinen käyttö
Voit käynnistää interaktiivisen eräajon komennolla:
BRAKER voi hyödyntää useita laskentaytimiä ja vaatia huomattavan määrän muistia, joten interaktiiviselle eräajollesi kannattaa varata enemmän kuin oletusresurssit. Esimerkiksi 4 ydintä ja 32 Gt muistia.
Eräajossa voit alustaa BRAKER-ympäristön komennolla
Sen jälkeen voit käynnistää BRAKER-ajon komennolla:
Näet valitsimet suorittamalla komennon:
Esimerkkikomento BRAKERille Puhdissa:
braker.pl --species=sp1 --genome=genome.fa --prot_seq=proteins.fa --AUGUSTUS_ab_initio --threads=$SLURM_CPUS_PER_TASK --GENEMARK_PATH=/path/to/gmes_linux_64_4 --PROTHINT_PATH=/path/to/ProtHint-2.6.0/bin --AUGUSTUS_CONFIG_PATH /path/to/config
Eräajot
Esimerkki BRAKERin eräajoskriptistä:
#!/bin/bash
#SBATCH --job-name=BRAKER_Job
#SBATCH --account=project_2012345
#SBATCH --time=24:00:00
#SBATCH --mem=32000
#SBATCH --nodes=1
#SBATCH --ntasks=1
#SBATCH --cpus-per-task=8
#SBATCH --partition=small
# load braker
module load braker
# Use correct paths instead of "/path/to"
braker.pl --species=sp1 --genome=genome.fa --prot_seq=proteins.fa \
--AUGUSTUS_ab_initio --threads=$SLURM_CPUS_PER_TASK \
--GENEMARK_PATH=/path/to/gmes_linux_64_4 \
--PROTHINT_PATH=/path/to/ProtHint-2.6.0/bin \
--AUGUSTUS_CONFIG_PATH /path/to/config
Yllä olevassa eräajoesimerkissä suoritetaan yksi tehtävä (--ntasks 1). BRAKER-ajo käyttää 8 ydintä (--cpus-per-task=8) ja yhteensä 32 Gt muistia (--mem=32000).
Ajolle sallittu enimmäiskesto on kymmenen tuntia (--time 10:00:00).
Kaikki ytimet varataan yhdeltä laskentasolmulta (--nodes=1).
Esimerkissä käytettävä projekti on project_2012345.
Tämä arvo tulee korvata oman laskentaprojektisi nimellä.
Voit lähettää eräajotiedoston eräajojärjestelmään komennolla:
Katso lisätietoja eräajojen suorittamisesta Puhdin käyttöoppaasta.