Hyppää sisältöön

Welcome to our weekly research support coffee hour on Zoom! Click here for more information.

Warning!

Puhti scratch disk is becoming very full (80+ % ) resulting in performance degradation. Everybody is advised to only keep actively processed data on scratch, all other data should be deleted, transferred to host institute or stored in Lumi-O. No new quota will be granted. Click here for a tool for examining your disk usage.

Seqtk

Seqtk on nopea ja kevyt työkalu sekvenssien käsittelyyn FASTA- tai FASTQ-muodossa. Se jäsentää saumattomasti sekä FASTA- että FASTQ-tiedostoja, jotka voivat olla myös gzip-pakattuja.

Lisenssi

Vapaasti käytettävä ja avointa lähdekoodia MIT-lisenssillä.

Saatavuus

  • Puhti: 1.3-r106, 1.4

Käyttö

Seqtk sisältyy biokit-moduuliin:

module load biokit

Vaihtoehtoisesti Seqtk voidaan ladata erillisenä moduulina:

module load seqtk/<version>

seqtk-komennon syntaksi on:

seqtk <command> <arguments>

Saatavilla olevat Seqtk-komennot ovat:

Command Function
seq FASTA/Q:n yleiset muunnokset
comp hae FASTA/Q:n nukleotidikoostumus
sample poimi sekvensseistä osaotos
subseq poimi alasekvenssejä FASTA/Q:sta
fqchk fastq-laadunvalvonta (emäs-/laatuyhteenveto)
mergepe lomita kaksi PE FASTA/Q -tiedostoa
trimfq trimmaa FASTQ Phred-algoritmilla
hety alueellinen heterotsygotia
gc tunnista korkean tai matalan GC-pitoisuuden alueet
mutfa tee pistemutaatioita FASTA:an määritetyissä kohdissa
mergefa yhdistä kaksi FASTA/Q-tiedostoa
famask käytä X-koodattua FASTA:aa lähde-FASTA:an
dropse poista parittomat sekvenssit lomitetusta PE FASTA/Q:sta
rename nimeä sekvenssien nimet uudelleen
randbase valitse satunnainen emäs heterotsygoottisista kohdista
cutN katkaise sekvenssi pitkän N:n kohdalta
listhet poimi jokaisen heterotsygoottisen kohdan sijainti

Esimerkkejä

Muunna FASTQ FASTA-muotoon:

seqtk seq -a in.fq.gz > out.fa

Poimi sekvenssit, joiden nimet ovat tiedostossa name.lst, yksi sekvenssin nimi per rivi:

seqtk subseq in.fq name.lst > out.fq

Poimi sekvenssit tiedostossa reg.bed määritellyiltä alueilta:

seqtk subseq in.fa reg.bed > out.fa

Lisätietoja

Suomenkielinen tekoälykäännös

Sisällössä voi esiintyä virheellistä tietoa tekoälykäännöksestä johtuen.

Klikkaa tästä antaaksesi palautetta