Hyppää sisältöön

Docs CSC now features an automatic Finnish translation. Click here for more information.

Warning!

Puhti and Mahti will be decommissioned after Roihu becomes available. Users should clean up unnecessary files and move any required data by the end of August 2026. See the Roihu data preparation instructions for details.

Puhti scratch is very full: keep only active data there and move or delete everything else. No new Puhti scratch quota will be granted.

InterProScan

InterProScan on työkalu, joka vertaa proteiini- tai nukleotidisekvenssiä proteiinisignatuuritietokantojen joukkoon. Eri tietokannoista saadut tulokset esitetään yhtenäisessä muodossa. CSC:n InterProScan5-asennusta voidaan käyttää proteiinisignatuurien hakemiseen seuraavista tietokannoista:

  • TIGRFAM (15.0)
  • SFLD (4)
  • SUPERFAMILY (1.75)
  • PANTHER (15.0)
  • Gene3D (4.3.0)
  • Hamap (2020_05)
  • Coils (2.2.1)
  • ProSiteProfiles (2021_01)
  • SMART (7.1)
  • CDD (3.18)
  • PRINTS (42.0)
  • PIRSR (2021_05)
  • ProSitePatterns (2021_01)
  • AntiFam (7.0)
  • Pfam (34.0)
  • MobiDBLite (2.0)
  • PIRSF (3.10)

Lisenssi

Vapaasti käytettävissä ja avointa lähdekoodia Apache License 2.0 -lisenssillä.

Saatavuus

  • Puhti: 5.55-88.0, 5.67-90.0

Käyttö

Puhdissa lataa ensin interproscan-moduuli komennoilla:

module load biokit
module load interproscan

Tämän jälkeen voit lähettää InterProScan-ajot komennolla cluster_interproscan. Cluster_interproscan on aputyökalu, joka suorittaa InterProScan-tehtäväsi automaattisesti Puhdin eräajojärjestelmässä. Jos kyselytiedostosi sisältää useita sekvenssejä, cluster_interproscan-työkalu jakaa myös automaattisesti InterProScan-ajot useisiin osatehtäviin, jotka suoritetaan samanaikaisesti Puhdissa.

cluster_interproscan hyväksyy kaikki tavalliset InterProScan-valinnat. Tarkista käytettävissä olevat valinnat komennolla:

cluster_interproscan -h

Alla on kaksi esimerkkiä InterProScan-komennoista

  1. InterProScan-haun suorittaminen nukleotidisekvenssijoukolle kaikkia InterProScan-tietokantoja vastaan. Tulokset raportoidaan XML-muodossa.
cluster_interproscan -i nucleotides.fasta -o results.xml -f XML -t n
  1. InterProScan-haun suorittaminen proteiinisekvenssijoukolle PfamA-tietokantaa vastaan. Tulokset raportoidaan GFF3-muodossa. GFF3-muunnos tarvitsee enemmän muistia kuin mitä Puhdin kirjautumissolmuissa on saatavilla. Tämän vuoksi interproscan-tehtävä kannattaa lähettää interaktiivisesta eräajosta, jossa on varattu vähintään 4 GiB muistia.
sinteractive -m 4000
cluster_interproscan -i proteins.fasta -o results.gff3 -f GFF3 -appl PfamA

Lisätietoja

Suomenkielinen tekoälykäännös

Sisällössä voi esiintyä virheellistä tietoa tekoälykäännöksestä johtuen.

Klikkaa tästä antaaksesi palautetta