Hyppää sisältöön

Welcome to our weekly research support coffee hour on Zoom! Click here for more information.

Warning!

Puhti scratch disk is becoming very full (80+ % ) resulting in performance degradation. Everybody is advised to only keep actively processed data on scratch, all other data should be deleted, transferred to host institute or stored in Lumi-O. No new quota will be granted. Click here for a tool for examining your disk usage.

MaxQuant-ohjelmiston ajaminen Puhti-supertietokoneella

MaxQuant on kvantitatiivisen proteomiikan ohjelmistopaketti, joka on suunniteltu suurten massaspektrometristen datajoukkojen analysointiin. Suorituskykyinen laskentaympäristö, kuten Puhti, on sopiva paikka laskennallisesti vaativien MaxQuant-ajojen suorittamiseen proteomiikan tutkimuksessa.

MaxQuant on maksutta käytettävissä, mutta jokaisen käyttäjän täytyy rekisteröityä ja ladata MaxQuant itse kehittäjän sivustolta.

Tämä ohje antaa ohjeet MaxQuant-ohjelmiston ajamiseen Puhdissa.

Parametritiedoston määrittäminen

Vaikka aiot ajaa MaxQuant-putken Puhdissa,
sinun täytyy ensin määrittää MaxQuant-ajosi eri parametrit paikallisella Windows-koneellasi. Sen jälkeen lataa parametritiedosto
(ts. mqpar.xml), raakadata-aineistot (ts. .raw-tiedostot) ja sekvenssitiedosto
(ts. .fasta-tiedosto) Puhtin laskentaympäristöön.

XML-määritystiedoston muokkaaminen

Sinun täytyy tehdä joitakin muutoksia parametritiedostoon (mqpar.xml), joka on esimerkiksi luotu paikallisella Windows-koneella, jotta se toimii HPC-ympäristössä.

Näihin muutoksiin kuuluvat muutokset seuraaviin kohtiin:

  • Windows-polut Linux-poluiksi näytetiedostoille (vinkki: etsi XML-tiedostosta <filePaths>)
  • Windows-polku Linux-poluksi fasta-sekvenssitiedostolle (vinkki: etsi XML-tiedostosta <fastaFilePath>)
  • Säikeiden määrä näytteiden lukumäärän mukaan (vinkki: etsi XML-tiedostosta <numThreads>)

Eräajon lähettäminen Puhti-klusteriin

Tämä on projektihakemistosi (scratch-alueella), jossa .xml-tiedostosi, .fasta-tiedosto ja raakadatatiedostot sijaitsevat.

  • Opi ottamaan MaxQuant-ympäristö käyttöön

MaxQuant-ohjelmisto tarvitsee itse asiassa myös mono-ohjelmiston voidakseen toimia.
Mono-ohjelmiston avulla voit valita käyttämäsi MaxQuantin version.
CSC tarjoaa moduulin monolle.

module load mono/5.14

Lataa Linux-yhteensopiva MaxQuant-versiosi (esim. v2.0.3.0)
Puhtin scratch-hakemistoosi ja suorita seuraava komento varmistaaksesi, että MaxQuant on asennettu oikein:

mono MaxQuant\ 2.0.3.0/bin/MaxQuantCmd.exe --help

Huomaa, että hakemiston nimessä on välilyönti, joten sinun täytyy joko käyttää kenoviivaa (\) sen escape-merkin lisäämiseen tai ympäröidä polku lainausmerkeillä. Käytön helpottamiseksi voit halutessasi nimetä hakemiston uudelleen niin, että siinä on esimerkiksi alaviiva välilyönnin sijasta.

Note

Huomaa, että .xml-parametrimääritystiedoston luomiseen käyttämäsi MaxQuant-versio täytyy olla sama kuin Linux-ympäristössä käyttämäsi versio, jotta ajo toimii sujuvasti klusteriympäristössä. Muut uusimmat versiot saattavat myös toimia.

  • Lähetä lopuksi skriptisi

Luo eräajoskripti jaetun muistin töiden ohjeiden mukaisesti
ja varmista, että skripti päätyy samaan hakemistoon kuin mqpar.xml-tiedostosi
ja muut datatiedostot sijaitsevat.

Eräajoskriptin kirjoittamisen helpottamiseksi voit käyttää seuraavaa
minimaalista esimerkkiskriptiä (nimeltään esimerkiksi maxquant.sh) lähtökohtana:

#!/bin/bash
#SBATCH --job-name=maxquant
#SBATCH --output=output_%j.txt
#SBATCH --error=errors_%j.txt
#SBATCH --account=project_xxx
#SBATCH --time=01:20:00
#SBATCH --ntasks=1
#SBATCH --partition=small
#SBATCH --cpus-per-task=6
#SBATCH --mem=16000

# load maxquant environment

module load mono/5.14

# adjust file paths here

mono /path_of_MaxQuant/bin/MaxQuantCmd.exe /path/MaxQuant/mqpar.xml

ja muokkaa sitten resurssivarauksia näytteiden määrän mukaan. Lähetä skriptisi seuraavasti:

sbatch maxquant.sh

Kun maxquant-ajo on valmis, tulostiedostosi ovat samassa hakemistossa.

Ohje-esimerkki

Voit ladata esimerkkiaineiston MaxQuantin ajamiseen seuraavasti:

wget https://a3s.fi/proteomics/MaxQuant_tutorial.tar.gz

ja pura sitten ladattu arkistotiedosto seuraavasti:

tar -xavf  MaxQuant_tutorial.tar.gz

Ohje sisältää esimerkkiraakatiedostoja ja muita tarvittavia tiedostoja MaxQuantin testiajoa varten.

Käytettyjen resurssien tarkastelu ajon päätyttyä

Kun maxquant-ajo on valmis, voit tarkistaa laskentaresurssien käytön, kuten muistin ja CPU-käytön tehokkuuden. Tämä auttaa sinua säätämään parempia parametreja laskentaresurssien tehokasta käyttöä varten.

Voit käyttää seuraavia komentoja työn tunnisteella:

seff <jobid>
sacct –l –j <jobid>
sacct -o jobid,jobname,maxrss,maxvmsize,state,elapsed -j <jobid>

Suomenkielinen tekoälykäännös

Sisällössä voi esiintyä virheellistä tietoa tekoälykäännöksestä johtuen.

Klikkaa tästä antaaksesi palautetta