-
Seqtk
Seqtk
Seqtk on nopea ja kevyt työkalu sekvenssien käsittelyyn FASTA- tai FASTQ-muodossa. Se jäsentää saumattomasti sekä FASTA- että FASTQ-tiedostoja, jotka voivat olla myös gzip-pakattuja.
Lisenssi
Vapaasti käytettävä ja avointa lähdekoodia MIT-lisenssillä.
Saatavuus
- Puhti: 1.3-r106, 1.4
Käyttö
Seqtk sisältyy biokit-moduuliin:
Vaihtoehtoisesti Seqtk voidaan ladata erillisenä moduulina:
seqtk-komennon syntaksi on:
Saatavilla olevat Seqtk-komennot ovat:
| Command | Function |
|---|---|
seq |
FASTA/Q:n yleiset muunnokset |
comp |
hae FASTA/Q:n nukleotidikoostumus |
sample |
poimi sekvensseistä osaotos |
subseq |
poimi alasekvenssejä FASTA/Q:sta |
fqchk |
fastq-laadunvalvonta (emäs-/laatuyhteenveto) |
mergepe |
lomita kaksi PE FASTA/Q -tiedostoa |
trimfq |
trimmaa FASTQ Phred-algoritmilla |
hety |
alueellinen heterotsygotia |
gc |
tunnista korkean tai matalan GC-pitoisuuden alueet |
mutfa |
tee pistemutaatioita FASTA:an määritetyissä kohdissa |
mergefa |
yhdistä kaksi FASTA/Q-tiedostoa |
famask |
käytä X-koodattua FASTA:aa lähde-FASTA:an |
dropse |
poista parittomat sekvenssit lomitetusta PE FASTA/Q:sta |
rename |
nimeä sekvenssien nimet uudelleen |
randbase |
valitse satunnainen emäs heterotsygoottisista kohdista |
cutN |
katkaise sekvenssi pitkän N:n kohdalta |
listhet |
poimi jokaisen heterotsygoottisen kohdan sijainti |
Esimerkkejä
Muunna FASTQ FASTA-muotoon:
Poimi sekvenssit, joiden nimet ovat tiedostossa name.lst, yksi sekvenssin nimi per rivi:
Poimi sekvenssit tiedostossa reg.bed määritellyiltä alueilta: