-
MaxQuant-ohjelmiston ajaminen Puhti-supertietokoneella
MaxQuant-ohjelmiston ajaminen Puhti-supertietokoneella
MaxQuant on kvantitatiivisen proteomiikan ohjelmistopaketti, joka on suunniteltu suurten massaspektrometristen datajoukkojen analysointiin. Suorituskykyinen laskentaympäristö, kuten Puhti, on sopiva paikka laskennallisesti vaativien MaxQuant-ajojen suorittamiseen proteomiikan tutkimuksessa.
MaxQuant on maksutta käytettävissä, mutta jokaisen käyttäjän täytyy rekisteröityä ja ladata MaxQuant itse kehittäjän sivustolta.
Tämä ohje antaa ohjeet MaxQuant-ohjelmiston ajamiseen Puhdissa.
Parametritiedoston määrittäminen
Vaikka aiot ajaa MaxQuant-putken Puhdissa,
sinun täytyy ensin määrittää MaxQuant-ajosi eri parametrit paikallisella Windows-koneellasi. Sen jälkeen lataa parametritiedosto
(ts. mqpar.xml), raakadata-aineistot (ts. .raw-tiedostot) ja sekvenssitiedosto
(ts. .fasta-tiedosto) Puhtin laskentaympäristöön.
XML-määritystiedoston muokkaaminen
Sinun täytyy tehdä joitakin muutoksia parametritiedostoon (mqpar.xml), joka on esimerkiksi luotu paikallisella Windows-koneella, jotta se toimii HPC-ympäristössä.
Näihin muutoksiin kuuluvat muutokset seuraaviin kohtiin:
- Windows-polut Linux-poluiksi näytetiedostoille (vinkki: etsi XML-tiedostosta
<filePaths>) - Windows-polku Linux-poluksi fasta-sekvenssitiedostolle (vinkki: etsi XML-tiedostosta
<fastaFilePath>) - Säikeiden määrä näytteiden lukumäärän mukaan (vinkki: etsi XML-tiedostosta
<numThreads>)
Eräajon lähettäminen Puhti-klusteriin
-
Kirjaudu ensin Puhti-tietokoneelle (katso ohjeet täältä)
-
Siirry projektihakemistoosi Puhdissa ja kopioi syötetiedostosi sinne (vinkkejä tiedostojen siirtämiseen).
Tämä on projektihakemistosi (scratch-alueella), jossa .xml-tiedostosi, .fasta-tiedosto ja raakadatatiedostot sijaitsevat.
- Opi ottamaan MaxQuant-ympäristö käyttöön
MaxQuant-ohjelmisto tarvitsee itse asiassa myös mono-ohjelmiston voidakseen toimia.
Mono-ohjelmiston avulla voit valita käyttämäsi MaxQuantin version.
CSC tarjoaa moduulin monolle.
Lataa Linux-yhteensopiva MaxQuant-versiosi (esim. v2.0.3.0)
Puhtin scratch-hakemistoosi ja suorita seuraava komento varmistaaksesi, että MaxQuant on asennettu oikein:
Huomaa, että hakemiston nimessä on välilyönti, joten sinun täytyy joko käyttää kenoviivaa (\) sen escape-merkin lisäämiseen tai ympäröidä polku lainausmerkeillä. Käytön helpottamiseksi voit halutessasi nimetä hakemiston uudelleen niin, että siinä on esimerkiksi alaviiva välilyönnin sijasta.
Note
Huomaa, että .xml-parametrimääritystiedoston luomiseen käyttämäsi MaxQuant-versio täytyy olla sama kuin Linux-ympäristössä käyttämäsi versio, jotta ajo toimii sujuvasti klusteriympäristössä. Muut uusimmat versiot saattavat myös toimia.
- Lähetä lopuksi skriptisi
Luo eräajoskripti jaetun muistin töiden ohjeiden mukaisesti
ja varmista, että skripti päätyy samaan hakemistoon kuin mqpar.xml-tiedostosi
ja muut datatiedostot sijaitsevat.
Eräajoskriptin kirjoittamisen helpottamiseksi voit käyttää seuraavaa
minimaalista esimerkkiskriptiä (nimeltään esimerkiksi maxquant.sh) lähtökohtana:
#!/bin/bash
#SBATCH --job-name=maxquant
#SBATCH --output=output_%j.txt
#SBATCH --error=errors_%j.txt
#SBATCH --account=project_xxx
#SBATCH --time=01:20:00
#SBATCH --ntasks=1
#SBATCH --partition=small
#SBATCH --cpus-per-task=6
#SBATCH --mem=16000
# load maxquant environment
module load mono/5.14
# adjust file paths here
mono /path_of_MaxQuant/bin/MaxQuantCmd.exe /path/MaxQuant/mqpar.xml
ja muokkaa sitten resurssivarauksia näytteiden määrän mukaan. Lähetä skriptisi seuraavasti:
Kun maxquant-ajo on valmis, tulostiedostosi ovat samassa hakemistossa.
Ohje-esimerkki
Voit ladata esimerkkiaineiston MaxQuantin ajamiseen seuraavasti:
ja pura sitten ladattu arkistotiedosto seuraavasti:
Ohje sisältää esimerkkiraakatiedostoja ja muita tarvittavia tiedostoja MaxQuantin testiajoa varten.
Käytettyjen resurssien tarkastelu ajon päätyttyä
Kun maxquant-ajo on valmis, voit tarkistaa laskentaresurssien käytön, kuten muistin ja CPU-käytön tehokkuuden.
Tämä auttaa sinua säätämään parempia parametreja laskentaresurssien tehokasta käyttöä varten.
Voit käyttää seuraavia komentoja työn tunnisteella: