Hyppää sisältöön

Docs CSC now features an automatic Finnish translation. Click here for more information.

Warning!

Puhti and Mahti will be decommissioned after Roihu becomes available. Users should clean up unnecessary files and move any required data by the end of August 2026. See the Roihu data preparation instructions for details.

Puhti scratch is very full: keep only active data there and move or delete everything else. No new Puhti scratch quota will be granted.

MaxQuant-ohjelmiston ajaminen Puhti-supertietokoneella

MaxQuant on kvantitatiivisen proteomiikan ohjelmistopaketti, joka on suunniteltu suurten massaspektrometristen datajoukkojen analysointiin. Suorituskykyinen laskentaympäristö, kuten Puhti, on sopiva paikka laskennallisesti vaativien MaxQuant-ajojen suorittamiseen proteomiikan tutkimuksessa.

MaxQuant on maksutta käytettävissä, mutta jokaisen käyttäjän täytyy rekisteröityä ja ladata MaxQuant itse kehittäjän sivustolta.

Tämä ohje antaa ohjeet MaxQuant-ohjelmiston ajamiseen Puhdissa.

Parametritiedoston määrittäminen

Vaikka aiot ajaa MaxQuant-putken Puhdissa,
sinun täytyy ensin määrittää MaxQuant-ajosi eri parametrit paikallisella Windows-koneellasi. Sen jälkeen lataa parametritiedosto
(ts. mqpar.xml), raakadata-aineistot (ts. .raw-tiedostot) ja sekvenssitiedosto
(ts. .fasta-tiedosto) Puhtin laskentaympäristöön.

XML-määritystiedoston muokkaaminen

Sinun täytyy tehdä joitakin muutoksia parametritiedostoon (mqpar.xml), joka on esimerkiksi luotu paikallisella Windows-koneella, jotta se toimii HPC-ympäristössä.

Näihin muutoksiin kuuluvat muutokset seuraaviin kohtiin:

  • Windows-polut Linux-poluiksi näytetiedostoille (vinkki: etsi XML-tiedostosta <filePaths>)
  • Windows-polku Linux-poluksi fasta-sekvenssitiedostolle (vinkki: etsi XML-tiedostosta <fastaFilePath>)
  • Säikeiden määrä näytteiden lukumäärän mukaan (vinkki: etsi XML-tiedostosta <numThreads>)

Eräajon lähettäminen Puhti-klusteriin

Tämä on projektihakemistosi (scratch-alueella), jossa .xml-tiedostosi, .fasta-tiedosto ja raakadatatiedostot sijaitsevat.

  • Opi ottamaan MaxQuant-ympäristö käyttöön

MaxQuant-ohjelmisto tarvitsee itse asiassa myös mono-ohjelmiston voidakseen toimia.
Mono-ohjelmiston avulla voit valita käyttämäsi MaxQuantin version.
CSC tarjoaa moduulin monolle.

module load mono/5.14

Lataa Linux-yhteensopiva MaxQuant-versiosi (esim. v2.0.3.0)
Puhtin scratch-hakemistoosi ja suorita seuraava komento varmistaaksesi, että MaxQuant on asennettu oikein:

mono MaxQuant\ 2.0.3.0/bin/MaxQuantCmd.exe --help

Huomaa, että hakemiston nimessä on välilyönti, joten sinun täytyy joko käyttää kenoviivaa (\) sen escape-merkin lisäämiseen tai ympäröidä polku lainausmerkeillä. Käytön helpottamiseksi voit halutessasi nimetä hakemiston uudelleen niin, että siinä on esimerkiksi alaviiva välilyönnin sijasta.

Note

Huomaa, että .xml-parametrimääritystiedoston luomiseen käyttämäsi MaxQuant-versio täytyy olla sama kuin Linux-ympäristössä käyttämäsi versio, jotta ajo toimii sujuvasti klusteriympäristössä. Muut uusimmat versiot saattavat myös toimia.

  • Lähetä lopuksi skriptisi

Luo eräajoskripti jaetun muistin töiden ohjeiden mukaisesti
ja varmista, että skripti päätyy samaan hakemistoon kuin mqpar.xml-tiedostosi
ja muut datatiedostot sijaitsevat.

Eräajoskriptin kirjoittamisen helpottamiseksi voit käyttää seuraavaa
minimaalista esimerkkiskriptiä (nimeltään esimerkiksi maxquant.sh) lähtökohtana:

#!/bin/bash
#SBATCH --job-name=maxquant
#SBATCH --output=output_%j.txt
#SBATCH --error=errors_%j.txt
#SBATCH --account=project_xxx
#SBATCH --time=01:20:00
#SBATCH --ntasks=1
#SBATCH --partition=small
#SBATCH --cpus-per-task=6
#SBATCH --mem=16000

# load maxquant environment

module load mono/5.14

# adjust file paths here

mono /path_of_MaxQuant/bin/MaxQuantCmd.exe /path/MaxQuant/mqpar.xml

ja muokkaa sitten resurssivarauksia näytteiden määrän mukaan. Lähetä skriptisi seuraavasti:

sbatch maxquant.sh

Kun maxquant-ajo on valmis, tulostiedostosi ovat samassa hakemistossa.

Ohje-esimerkki

Voit ladata esimerkkiaineiston MaxQuantin ajamiseen seuraavasti:

wget https://a3s.fi/proteomics/MaxQuant_tutorial.tar.gz

ja pura sitten ladattu arkistotiedosto seuraavasti:

tar -xavf  MaxQuant_tutorial.tar.gz

Ohje sisältää esimerkkiraakatiedostoja ja muita tarvittavia tiedostoja MaxQuantin testiajoa varten.

Käytettyjen resurssien tarkastelu ajon päätyttyä

Kun maxquant-ajo on valmis, voit tarkistaa laskentaresurssien käytön, kuten muistin ja CPU-käytön tehokkuuden. Tämä auttaa sinua säätämään parempia parametreja laskentaresurssien tehokasta käyttöä varten.

Voit käyttää seuraavia komentoja työn tunnisteella:

seff <jobid>
sacct –l –j <jobid>
sacct -o jobid,jobname,maxrss,maxvmsize,state,elapsed -j <jobid>

Suomenkielinen tekoälykäännös

Sisällössä voi esiintyä virheellistä tietoa tekoälykäännöksestä johtuen.

Klikkaa tästä antaaksesi palautetta