-
Freebayes
Freebayes
FreeBayes on geneettisten varianttien tunnistustyökalu, joka on suunniteltu pienten polymorfismien (SNP:t, indelit, MNP:t ja kompleksiset tapahtumat) löytämiseen.
FreeBayes on haplotyyppipohjainen siinä mielessä, että se tunnistaa variantit tiettyyn kohteeseen kohdistettujen lukujen kirjaimellisten sekvenssien perusteella, ei niiden tarkan kohdistuksen perusteella. Tämä malli on suoraviivainen yleistys aiemmista malleista (esim. PolyBayes, samtools, GATK), jotka tunnistavat tai raportoivat variantteja kohdistusten perusteella. Tämä menetelmä välttää yhden kohdistuspohjaisen variantintunnistuksen keskeisistä ongelmista: identtisillä sekvensseillä voi olla useita mahdollisia kohdistuksia.
FreeBayes käyttää lyhyiden lukujen kohdistuksia (BAM-tiedostoja) mistä tahansa määrästä populaation yksilöitä sekä viitegenomia määrittääkseen populaation todennäköisimmän genotyyppiyhdistelmän viitteen jokaisessa kohdassa. Se raportoi kohdat, jotka se arvioi oletettavasti polymorfisiksi, varianttikutsutiedoston (VCF) muodossa. Se voi myös käyttää syötteenä annettua varianttijoukkoa (VCF) aiempana tietona sekä kopiolukuvaihtelukarttaa (BED) määrittämään ei-yhtenäistä ploidiavaihtelua analysoitavien näytteiden välillä.
Lisenssi
Vapaasti käytettävissä ja avointa lähdekoodia MIT-lisenssin alaisena.
Saatavuus
- Puhti: 1.3.6, 1.3.7
Käyttö
Lataa ensin FreeBayes-moduuli.
Tämän jälkeen voit käynnistää Freebayesin. Esimerkiksi:
Huomaa, että FreeBayes vaatii indeksoidun BAM-tiedoston. BAM-tiedoston voi indeksoida komennolla:
FreeBayes-analyysiajot voivat olla laskennallisesti raskaita, ja ne tulisi ajaa eräajoina Puhdissa.
Puhdissa voit käyttää freebayes-puhti-työkalua lähettääksesi Freebayes-ajon automaattisesti eräajojärjestelmään.
Tämä työkalu myös nopeuttaa analyysiä ajamalla sen rinnakkain useina samanaikaisina tehtävinä.
Jotta voit käyttää freebayes-puhti-työkalua, sinun on ensin määritettävä alueita sisältävä tiedosto viite-fasta-tiedostollesi.
Tämä voidaan tehdä komennolla:
Pienille aineistoille voit pienentää yllä olevan komennon aluekokoa, jotta saat alueita sisältävään tiedostoon yli 100 aluetta.
Kun alueita sisältävä tiedosto on luotu, voit käynnistää analyysitehtäväsi komennolla:
freebayes-puhti suorittaa FreeBayes-analyysisi automaattisesti luotuna taulukkomuotoisena eräajona. Tulokset myös yhdistetään ja lajitellaan automaattisesti, kun eräajot ovat valmistuneet. Oletuksena freebayes-puhti sallii kunkin alitehtävän käyttää 16 Gt muistia ja suorittaa enintään 24 tuntia. Erittäin suurissa FreeBayes-ajoissa tämä ei välttämättä riitä. Tällöin voit yrittää käyttää valitsimia -mem ja -time rajojen kasvattamiseen. Valitsin -mem
määrittää muistivarauksen gigatavuina, kun taas valitsin -time määrittää aikavarauksen tunteina. Esimerkiksi tehtävän laajentaminen 64 Gt:n muistiin ja 48 tunnin ajoaikaan voidaan tehdä komennolla:
Käynnistyksen jälkeen FreeBayes alkaa seurata työn etenemistä. Koska työ voi kestää useita päiviä, yhteys
saattaa katketa tai sinun voi olla tarpeen sulkea yhteys. Tämä ei vahingoita varsinaista laskentatehtävää. Kun kaikki alitehtävät ovat valmistuneet, voit käyttää komentoa freebayes-puhti-recover tulosten keräämiseen. Esimerkiksi:
Missä freebayes_jobnum_tmp on väliaikainen FreeBayes-hakemisto, jonka freebayes-puhti-komento loi samaan hakemistoon, jossa komento käynnistettiin.