Hyppää sisältöön

Docs CSC now features an automatic Finnish translation. Click here for more information.

Warning!

Puhti and Mahti will be decommissioned after Roihu becomes available. Users should clean up unnecessary files and move any required data by the end of August 2026. See the Roihu data preparation instructions for details.

Puhti scratch is very full: keep only active data there and move or delete everything else. No new Puhti scratch quota will be granted.

Seqtk

Seqtk on nopea ja kevyt työkalu sekvenssien käsittelyyn FASTA- tai FASTQ-muodossa. Se jäsentää saumattomasti sekä FASTA- että FASTQ-tiedostoja, jotka voivat olla myös gzip-pakattuja.

Lisenssi

Vapaasti käytettävä ja avointa lähdekoodia MIT-lisenssillä.

Saatavuus

  • Puhti: 1.3-r106, 1.4

Käyttö

Seqtk sisältyy biokit-moduuliin:

module load biokit

Vaihtoehtoisesti Seqtk voidaan ladata erillisenä moduulina:

module load seqtk/<version>

seqtk-komennon syntaksi on:

seqtk <command> <arguments>

Saatavilla olevat Seqtk-komennot ovat:

Command Function
seq FASTA/Q:n yleiset muunnokset
comp hae FASTA/Q:n nukleotidikoostumus
sample poimi sekvensseistä osaotos
subseq poimi alasekvenssejä FASTA/Q:sta
fqchk fastq-laadunvalvonta (emäs-/laatuyhteenveto)
mergepe lomita kaksi PE FASTA/Q -tiedostoa
trimfq trimmaa FASTQ Phred-algoritmilla
hety alueellinen heterotsygotia
gc tunnista korkean tai matalan GC-pitoisuuden alueet
mutfa tee pistemutaatioita FASTA:an määritetyissä kohdissa
mergefa yhdistä kaksi FASTA/Q-tiedostoa
famask käytä X-koodattua FASTA:aa lähde-FASTA:an
dropse poista parittomat sekvenssit lomitetusta PE FASTA/Q:sta
rename nimeä sekvenssien nimet uudelleen
randbase valitse satunnainen emäs heterotsygoottisista kohdista
cutN katkaise sekvenssi pitkän N:n kohdalta
listhet poimi jokaisen heterotsygoottisen kohdan sijainti

Esimerkkejä

Muunna FASTQ FASTA-muotoon:

seqtk seq -a in.fq.gz > out.fa

Poimi sekvenssit, joiden nimet ovat tiedostossa name.lst, yksi sekvenssin nimi per rivi:

seqtk subseq in.fq name.lst > out.fq

Poimi sekvenssit tiedostossa reg.bed määritellyiltä alueilta:

seqtk subseq in.fa reg.bed > out.fa

Lisätietoja

Suomenkielinen tekoälykäännös

Sisällössä voi esiintyä virheellistä tietoa tekoälykäännöksestä johtuen.

Klikkaa tästä antaaksesi palautetta