Hyppää sisältöön

Welcome to our weekly research support coffee hour on Zoom! Click here for more information.

Warning!

Puhti scratch disk is becoming very full (80+ % ) resulting in performance degradation. Everybody is advised to only keep actively processed data on scratch, all other data should be deleted, transferred to host institute or stored in Lumi-O. No new quota will be granted. Click here for a tool for examining your disk usage.

Diamond

Diamond on nopea sekvenssien samankaltaisuushakutyökalu nukleotidi- tai proteiinisekvenssien vertaamiseen proteiinitietokantoja vasten. Diamondin keskeiset ominaisuudet ovat:

  • Proteiinien ja käännetyn DNA:n parittainen kohdistus 500x–20 000x BLASTia nopeammin.
  • Kehyssiirtymäkohdistukset pitkien lukujen analyysiin.
  • Vähäiset resurssivaatimukset, ja soveltuu käytettäväksi tavallisilla pöytäkoneilla tai kannettavilla tietokoneilla.
  • Useita tiedostomuotoja tulosteelle, mukaan lukien BLASTin parittainen muoto, taulukkomuoto ja XML sekä taksonominen luokittelu.

Lisenssi

Vapaasti käytettävissä ja avointa lähdekoodia GNU AGPLv3 -lisenssillä.

Saatavuus

  • Puhti: 2.0.15, 2.1.6, 2.1.10

Käyttö

Diamondin käyttö aloitetaan komennolla:

module load biokit

tai:

module load diamond

Tietyn version lataamiseksi, esimerkiksi:

module load diamond/2.0.15

Tämän jälkeen voit tarkistaa Diamondin ohjeen komennolla:

diamond help

CSC tarjoaa Diamond-indeksit SwissProt- (swiss), Uniprot- (uniprot) ja NCBI:n ei-redundanteille tietokannoille (nr). Näiden tietokantojen sijainti on määritelty ympäristömuuttujassa $DIAMONDDB. Esimerkiksi osumien hakeminen nukleotidisekvenssijoukolle SwissProt-tietokannasta voidaan tehdä komennolla:

diamond blastx --query nuc.fasta -d $DIAMONDDB/swiss --out diamond_results.txt -p 4 --max-target-seqs 500

Voit tehdä hakuja myös omaa proteiinisekvenssitietokantaasi vasten. Tässä tapauksessa sinun on ensin laskettava Diamond-indeksit viiteproteiinijoukollesi komennolla diamond makedb. Esimerkiksi:

diamond makedb --in refrerence_proteins.fasta -d my_ref -p 4

Yllä oleva komento luo Diamond-indeksitiedoston (my_ref.dmnd), jota voidaan käyttää kyselytietokantana:

diamond blastx --query nuc.fasta -d my_ref --out diamond_results2.txt -p 4 --max-target-seqs 500

Lisätietoja

Suomenkielinen tekoälykäännös

Sisällössä voi esiintyä virheellistä tietoa tekoälykäännöksestä johtuen.

Klikkaa tästä antaaksesi palautetta