Hyppää sisältöön

Docs CSC now features an automatic Finnish translation. Click here for more information.

Warning!

Puhti and Mahti will be decommissioned after Roihu becomes available. Users should clean up unnecessary files and move any required data by the end of August 2026. See the Roihu data preparation instructions for details.

Puhti scratch is very full: keep only active data there and move or delete everything else. No new Puhti scratch quota will be granted.

Diamond

Diamond on nopea sekvenssien samankaltaisuushakutyökalu nukleotidi- tai proteiinisekvenssien vertaamiseen proteiinitietokantoja vasten. Diamondin keskeiset ominaisuudet ovat:

  • Proteiinien ja käännetyn DNA:n parittainen kohdistus 500x–20 000x BLASTia nopeammin.
  • Kehyssiirtymäkohdistukset pitkien lukujen analyysiin.
  • Vähäiset resurssivaatimukset, ja soveltuu käytettäväksi tavallisilla pöytäkoneilla tai kannettavilla tietokoneilla.
  • Useita tiedostomuotoja, mukaan lukien BLASTin parittainen muoto, taulukkomuoto ja XML, sekä taksonominen luokittelu.

Lisenssi

Vapaasti käytettävissä ja avointa lähdekoodia GNU AGPLv3 -lisenssillä.

Saatavuus

  • Puhti: 2.0.15, 2.1.6, 2.1.10

Käyttö

Diamondin käyttö aloitetaan komennolla:

module load biokit

tai:

module load diamond

Tietyn version voi ladata esimerkiksi näin:

module load diamond/2.0.15

Tämän jälkeen voit tarkistaa Diamondin ohjeen komennolla:

diamond help

CSC tarjoaa Diamond-indeksit SwissProt- (swiss), Uniprot- (uniprot) ja NCBI:n non-redundant -tietokannoille (nr). Näiden tietokantojen sijainti on määritelty ympäristömuuttujassa $DIAMONDDB. Esimerkiksi osumien hakeminen nukleotidisekvenssijoukolle SwissProt-tietokannasta voidaan tehdä komennolla:

diamond blastx --query nuc.fasta -d $DIAMONDDB/swiss --out diamond_results.txt -p 4 --max-target-seqs 500

Voit tehdä hakuja myös omaa proteiinisekvenssitietokantaasi vasten. Tässä tapauksessa sinun täytyy ensin laskea Diamond-indeksit viiteproteiinijoukollesi komennolla diamond makedb. Esimerkiksi:

diamond makedb --in refrerence_proteins.fasta -d my_ref -p 4

Yllä oleva komento luo Diamond-indeksitiedoston (my_ref.dmnd), jota voidaan käyttää kyselytietokantana:

diamond blastx --query nuc.fasta -d my_ref --out diamond_results2.txt -p 4 --max-target-seqs 500

Lisätietoja

Suomenkielinen tekoälykäännös

Sisällössä voi esiintyä virheellistä tietoa tekoälykäännöksestä johtuen.

Klikkaa tästä antaaksesi palautetta