-
InterProScan
InterProScan
InterProScan on työkalu, joka vertaa proteiini- tai nukleotidisekvenssiä proteiinisignatuuritietokantojen joukkoon. Eri tietokannoista saadut tulokset esitetään yhtenäisessä muodossa. CSC:n InterProScan5-asennusta voidaan käyttää proteiinisignatuurien hakemiseen seuraavista tietokannoista:
- TIGRFAM (15.0)
- SFLD (4)
- SUPERFAMILY (1.75)
- PANTHER (15.0)
- Gene3D (4.3.0)
- Hamap (2020_05)
- Coils (2.2.1)
- ProSiteProfiles (2021_01)
- SMART (7.1)
- CDD (3.18)
- PRINTS (42.0)
- PIRSR (2021_05)
- ProSitePatterns (2021_01)
- AntiFam (7.0)
- Pfam (34.0)
- MobiDBLite (2.0)
- PIRSF (3.10)
Lisenssi
Vapaasti käytettävissä ja avointa lähdekoodia Apache License 2.0 -lisenssillä.
Saatavuus
- Puhti: 5.55-88.0, 5.67-90.0
Käyttö
Puhdissa lataa ensin interproscan-moduuli komennoilla:
Tämän jälkeen voit lähettää InterProScan-ajot komennolla cluster_interproscan. Cluster_interproscan
on aputyökalu, joka suorittaa InterProScan-tehtäväsi automaattisesti Puhdin eräajojärjestelmässä.
Jos kyselytiedostosi sisältää useita sekvenssejä, cluster_interproscan-työkalu jakaa myös automaattisesti
InterProScan-ajot useisiin osatehtäviin, jotka suoritetaan samanaikaisesti Puhdissa.
cluster_interproscan hyväksyy kaikki tavalliset InterProScan-valinnat. Tarkista käytettävissä olevat valinnat komennolla:
Alla on kaksi esimerkkiä InterProScan-komennoista
- InterProScan-haun suorittaminen nukleotidisekvenssijoukolle kaikkia InterProScan-tietokantoja vastaan. Tulokset raportoidaan XML-muodossa.
- InterProScan-haun suorittaminen proteiinisekvenssijoukolle PfamA-tietokantaa vastaan. Tulokset raportoidaan GFF3-muodossa. GFF3-muunnos tarvitsee enemmän muistia kuin mitä Puhdin kirjautumissolmuissa on saatavilla. Tämän vuoksi interproscan-tehtävä kannattaa lähettää interaktiivisesta eräajosta, jossa on varattu vähintään 4 GiB muistia.