-
Diamond
Diamond
Diamond on nopea sekvenssien samankaltaisuushakutyökalu nukleotidi- tai proteiinisekvenssien vertaamiseen proteiinitietokantoja vasten. Diamondin keskeiset ominaisuudet ovat:
- Proteiinien ja käännetyn DNA:n parittainen kohdistus 500x–20 000x BLASTia nopeammin.
- Kehyssiirtymäkohdistukset pitkien lukujen analyysiin.
- Vähäiset resurssivaatimukset, ja soveltuu käytettäväksi tavallisilla pöytäkoneilla tai kannettavilla tietokoneilla.
- Useita tiedostomuotoja tulosteelle, mukaan lukien BLASTin parittainen muoto, taulukkomuoto ja XML sekä taksonominen luokittelu.
Lisenssi
Vapaasti käytettävissä ja avointa lähdekoodia GNU AGPLv3 -lisenssillä.
Saatavuus
- Puhti: 2.0.15, 2.1.6, 2.1.10
Käyttö
Diamondin käyttö aloitetaan komennolla:
tai:
Tietyn version lataamiseksi, esimerkiksi:
Tämän jälkeen voit tarkistaa Diamondin ohjeen komennolla:
CSC tarjoaa Diamond-indeksit SwissProt- (swiss), Uniprot- (uniprot) ja NCBI:n ei-redundanteille tietokannoille (nr). Näiden tietokantojen sijainti on määritelty ympäristömuuttujassa $DIAMONDDB. Esimerkiksi osumien hakeminen nukleotidisekvenssijoukolle SwissProt-tietokannasta voidaan tehdä komennolla:
diamond blastx --query nuc.fasta -d $DIAMONDDB/swiss --out diamond_results.txt -p 4 --max-target-seqs 500
Voit tehdä hakuja myös omaa proteiinisekvenssitietokantaasi vasten. Tässä tapauksessa sinun on ensin laskettava Diamond-indeksit viiteproteiinijoukollesi komennolla diamond makedb. Esimerkiksi:
Yllä oleva komento luo Diamond-indeksitiedoston (my_ref.dmnd), jota voidaan käyttää kyselytietokantana: