Hyppää sisältöön

Welcome to our weekly research support coffee hour on Zoom! Click here for more information.

Warning!

Puhti scratch disk is becoming very full (80+ % ) resulting in performance degradation. Everybody is advised to only keep actively processed data on scratch, all other data should be deleted, transferred to host institute or stored in Lumi-O. No new quota will be granted. Click here for a tool for examining your disk usage.

InterProScan

InterProScan on työkalu, joka vertaa proteiini- tai nukleotidisekvenssiä proteiinisignatuuritietokantojen joukkoon. Eri tietokannoista saadut tulokset esitetään yhtenäisessä muodossa. CSC:n InterProScan5-asennusta voidaan käyttää proteiinisignatuurien hakemiseen seuraavista tietokannoista:

  • TIGRFAM (15.0)
  • SFLD (4)
  • SUPERFAMILY (1.75)
  • PANTHER (15.0)
  • Gene3D (4.3.0)
  • Hamap (2020_05)
  • Coils (2.2.1)
  • ProSiteProfiles (2021_01)
  • SMART (7.1)
  • CDD (3.18)
  • PRINTS (42.0)
  • PIRSR (2021_05)
  • ProSitePatterns (2021_01)
  • AntiFam (7.0)
  • Pfam (34.0)
  • MobiDBLite (2.0)
  • PIRSF (3.10)

Lisenssi

Vapaasti käytettävissä ja avointa lähdekoodia Apache License 2.0 -lisenssillä.

Saatavuus

  • Puhti: 5.55-88.0, 5.67-90.0

Käyttö

Puhdissa lataa ensin interproscan-moduuli komennoilla:

module load biokit
module load interproscan

Tämän jälkeen voit lähettää InterProScan-ajot komennolla cluster_interproscan. Cluster_interproscan on aputyökalu, joka suorittaa InterProScan-tehtäväsi automaattisesti Puhdin eräajojärjestelmässä. Jos kyselytiedostosi sisältää useita sekvenssejä, cluster_interproscan-työkalu jakaa myös automaattisesti InterProScan-ajot useisiin osatehtäviin, jotka suoritetaan samanaikaisesti Puhdissa.

cluster_interproscan hyväksyy kaikki tavalliset InterProScan-valinnat. Tarkista käytettävissä olevat valinnat komennolla:

cluster_interproscan -h

Alla on kaksi esimerkkiä InterProScan-komennoista

  1. InterProScan-haun suorittaminen nukleotidisekvenssijoukolle kaikkia InterProScan-tietokantoja vastaan. Tulokset raportoidaan XML-muodossa.
cluster_interproscan -i nucleotides.fasta -o results.xml -f XML -t n
  1. InterProScan-haun suorittaminen proteiinisekvenssijoukolle PfamA-tietokantaa vastaan. Tulokset raportoidaan GFF3-muodossa. GFF3-muunnos tarvitsee enemmän muistia kuin mitä Puhdin kirjautumissolmuissa on saatavilla. Tämän vuoksi interproscan-tehtävä kannattaa lähettää interaktiivisesta eräajosta, jossa on varattu vähintään 4 GiB muistia.
sinteractive -m 4000
cluster_interproscan -i proteins.fasta -o results.gff3 -f GFF3 -appl PfamA

Lisätietoja

Suomenkielinen tekoälykäännös

Sisällössä voi esiintyä virheellistä tietoa tekoälykäännöksestä johtuen.

Klikkaa tästä antaaksesi palautetta