| MAGIIC-PRO : Experiments and Examples | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
We provide a lot of experiments and examples to demonstrate the capability of WildSpan in identifying flexible and long patterns. All the experiments were conducted on a machine with a 3.4GHz Intel Pentium 4 CPU and memory of 2GBs, running Linux Fedora 4 Server. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| To view the mining results of a dataset, click one of the following result page link or large image link. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
P36507(MP2K2_HUMAN) | Protein kinases ATP-binding region signature Query Protein : P36507 (MP2K2_HUMAN) Dual specificity mitogen-activated protein kinase kinase 2 (EC 2.7.1.-) (MAP kinase kinase 2) (MAPKK 2) (ERK activator kinase 2) (MAPK/ERK kinase 2) (MEK2).
Training Dataset :
1910 entries are found to match the cross-reference PS00107,
out of 196277 entries in the release 48.3 of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold
30%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
Q01698(EFTU_THEAQ) | GTP-binding elongation factors signature Query Protein : Q01698 (EFTU_THEAQ) Elongation factor Tu (EF-Tu).
Training Dataset :
932 entries are found to match the cross-reference PS00107,
out of 196277 entries in the release 48.3 of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold 80%):
[GO TOP] |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
P19120 (HSP7C_BOVIN) | Heat shock protein Hsp70 Query Protein : P19120 (HSP7C_BOVIN) Heat shock cognate 71 kDa protein.
Training Dataset : 932 entries are found to match
the cross-reference IPR001023, out of 196277 entries in the release 48.3
of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold 83%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
P51656 (DHB1_MOUSE) | Short-chain dehydrogenases/reductases
Query Protein :
P51656 (DHB1_MOUSE) Estradiol
17-beta-dehydrogenase 1 (EC 1.1.1.62) (17-beta-HSD 1) (17- beta-hydroxysteroid
dehydrogenase 1). Selected Pattern (support threshold 20%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
P00962 (SYQ_ECOLI)
| tRNA synthetases class I (E and Q),
catalytic domain Query Protein : P00962 (SYQ_ECOLI) Glutaminyl-tRNA synthetase. Training Dataset :
346 entries are found to match the cross-reference PF00749 out of 196277
entries in the release 48.3 of UniProtKB/Swiss-Prot. Selected Pattern (support threshold 40%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
Q01574 (ACS1_YEAST) | Putative AMP-binding domain signature Query Protein : Q01574 (ACS1_YEAST) ACS1_YEAST Acetyl-coenzyme A synthetase 1 (EC 6.2.1.1) (Acetate--CoA ligase 1) (Acyl-activating enzyme 1). Training Dataset :
282 entries are found to match the cross-reference PF00455 out of 196277
entries in the release 48.3 of UniProtKB/Swiss-Prot. Selected Pattern (support threshold 40%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
P10933 (FENR1_PEA)|Oxidoreductase
FAD/NAD(P)-binding Query Protein : P10933 (FENR1_PEA) Ferredoxin--NADP reductase, leaf isozyme, chloroplast precursor (EC 1.18.1.2) (FNR).
Training Dataset :
280 entries are found to match the cross-reference IPR001433 out of 196277
entries in the release 48.3 of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold 20%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
P08622 (DNAJ_ECOLI)|CXXCXGXG
DnaJ Central Domain Query Protein : P08622 (DNAJ_ECOLI) Chaperone protein dnaJ (Heat shock protein J) (HSP40). Training Dataset :
275 entries are found to match the cross-reference
PF00684,PS00637, out of 196277 entries in the release 48.3 of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold 80%):
[GO TOP] |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
P25910
(BLAB_BACFR)|Metallo-beta-lactamase superfamily Query Protein : P25910 (BLAB_BACFR) Beta-lactamase type II precursor (EC 3.5.2.6) (Penicillinase) (Cephalosporinase) (Imipenem-cefoxitin hydrolyzing enzyme).
Training Dataset :
267 entries are found to match
the cross-reference PF00753, out of 196277 entries in the release 48.3
of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold 90%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
P36204
(PGKT_THEMA)|Phosphoglycerate kinase signature Query Protein : P36204 (PGKT_THEMA) Bifunctional PGK/TIM [Includes: Phosphoglycerate kinase (EC 2.7.2.3); Triosephosphate isomerase (EC 5.3.1.1) (TIM) (Triose-phosphate isomerase)].
Training Dataset :
251 entries are found to match
the cross-reference PS00111, out of 196277 entries in the release 48.3
of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold 90%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
P27142
(KAD_BACST)|Adenylate kinase signature Query Protein : P27142 (KAD_BACST) KAD_BACST Adenylate kinase (EC 2.7.4.3) (ATP-AMP transphosphorylase) (AK).
Training Dataset :
243 entries are found to match
the cross-reference PS00113, out of 196277 entries in the release 48.3
of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold 70%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
P22887 (NDKC_DICDI)|Nucleoside
diphosphate kinases active site Query Protein : P22887 (NDKC_DICDI) Nucleoside diphosphate kinase, cytosolic (EC 2.7.4.6) (NDK) (NDP kinase).
Training Dataset :
237 entries are found to match
the cross-reference PS00469, out of 196277 entries in the release 48.3
of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold 70%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
P09372 (GRPE_ECOLI)|grpE Protein Signature Query Protein : P09372 (GRPE_ECOLI) Protein grpE (HSP-70 cofactor) (Heat shock protein B25.3) (HSP24).
Training Dataset :
195 entries are found to match the cross-reference PS01071, out of
196277 entries in the release 48.3 of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold 30%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
Q58504
(KHSE_METJA)|GHMP kinases putative ATP-binding domain Query Protein : Q58504 (KHSE_METJA) Homoserine kinase (EC 2.7.1.39) (HSK) (HK).
Training Dataset :
191 entries are found to match the cross-reference PS00627, out of
196277 entries in the release 48.3 of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold 30%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
Q58487 (KIME_METJA)|GHMP
kinases putative ATP-binding domain Query Protein : Q58487 (KIME_METJA) Mevalonate kinase (EC 2.7.1.36) (MK).
Training Dataset :
191 entries are found to match the cross-reference PS00627, out of
196277 entries in the release 48.3 of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold 10%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
P37744 (RMLA1_ECOLI)|NTP_transferase Query Protein : P37744 (RMLA1_ECOLI) Glucose-1-phosphate thymidylyltransferase 1 (EC 2.7.7.24) (dTDP- glucose synthase 1) (dTDP-glucose pyrophosphorylase 1) (G1P-TT 1).
Training Dataset :
188 entries are found to match the cross-reference PF00483, out of
196277 entries in the release 48.3 of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold 40%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
P00817
(IPYR_YEAST)|Inorganic pyrophosphatase signature Query Protein : P00817 (IPYR_YEAST) Inorganic pyrophosphatase (EC 3.6.1.1) (Pyrophosphate phospho- hydrolase) (PPase).
Training Dataset :
181 entries are found to match the cross-reference PS00387, out of
196277 entries in the release 48.3 of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold 70%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
P25971 (PYRF_BACSU) | Orotidine 5'-phosphate decarboxylase Query Protein : P25971 (PYRF_BACSU) PYRF_BACSU Orotidine 5'-phosphate decarboxylase (EC 4.1.1.23) (OMP decarboxylase) (OMPDCase) (OMPdecase).
Training Dataset :
178 entries are found to match the cross-reference PF00215, out of
196277 entries in the release 48.3 of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold 40%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
Q64520 (KGUA_MOUSE)|Guanylate kinase Query Protein : Q64520 (KGUA_MOUSE) Guanylate kinase (EC 2.7.4.8) (GMP kinase).
Training Dataset :
141 entries are found to match the cross-reference PF00625, out of
196277 entries in the release 48.3 of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold 40%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
P51541
(KARG_LIMPO)|ATP:guanido phosphotransferases active site Query Protein : P51541 (KARG_LIMPO) Arginine kinase (EC 2.7.3.3) (AK).
Training Dataset :
81 entries are found to match the cross-reference PS00112, out of
196277 entries in the release 48.3 of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold
90%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
P03958
(ADA_MOUSE)|Adenosine and AMP deaminase signature Query Protein : P03958 (KARG_LIMPO) Adenosine deaminase (EC 3.5.4.4) (Adenosine aminohydrolase).
Training Dataset :
59 entries are found to match the cross-reference PS00485, out of
196277 entries in the release 48.3 of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold
90%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
P23368 (MAOM_HUMAN)|Malic enzymes
signature Query Protein : P23368 (MAOM_HUMAN) NAD-dependent malic enzyme, mitochondrial precursor (EC 1.1.1.38) (NAD-ME) (Malic enzyme 2).
Training Dataset :
43 entries are found to match the cross-reference PS00331, out of
196277 entries in the release 48.3 of UniProtKB/Swiss-Prot.
Selected Pattern (support threshold
80%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
1arg:A | Complex of ALF4-ACTIVATED GI-ALPHA-1 with RGS4
![]() Query Protein : larg:A sequence |COMPLEX OF ALF4-ACTIVATED GI-ALPHA-1 WITH RGS4 | P10824 Guanine nucleotide-binding protein G(i). Training Dataset : PSI-BLAST found 241 hits. The mining process will be executed on the following unique 100 protein sequences under the E-value [0.01] and identity [10%~99%] constraints with 48% average identity.
Selected Pattern (support threshold
100%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
1wql:G | Cumene dioxygenas from Pseudomonas fluorescens IP01
![]() Query Protein : lwql:G sequence | Cumene dioxygenase (cumA1A2) from Pseudomonas fluorescens IP01 | P20936 Ras GTPase-activating protein 1. Training Dataset : PSI-BLAST found 30 hits. The mining process will be executed on the following unique 29 protein sequences under the E-value [0.01] and identity [10%~99%] constraints with 31% average identity.
Selected Pattern (support threshold
40%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
1ds6:A |A RAC-RHOGDI complex Query Protein : lds6:A sequence | CRYSTAL STRUCTURE OF A RAC-RHOGDI COMPLEX | P15153 Ras-related C3 botulinum toxin substrate 2. Training Dataset : PSI-BLAST found 250 hits. The mining process will be executed on the following unique 100 protein sequences under the E-value [0.01] and identity [10%~99%] constraints with 42% average identity.
Selected Pattern
(support threshold 90%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
1dtd:
A | The leech and human carboxypeptidase complex Query Protein : 1dtd:A Sequence | CRYSTAL STRUCTURE OF THE COMPLEX BETWEEN THE LEECH CARBOXYPEPTIDASE INHIBITOR AND THE HUMAN CARBOXYPEPTIDASE A2 (LCI-CPA2) | P48052 Carboxypeptidase A2 precursor. Training Dataset : PSI-BLAST found 53 hits. The mining process will be executed on the following unique 47 protein sequences under the E-value [0.01] and identity [10%~99%] constraints with 39% average identity.
Selected Pattern (support threshold
60%):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
1wql:R | GAPETTE Query Protein : lwql:R sequence | GAPETTE. Training Dataset : PSI-BLAST found 30 hits. The mining process will be executed on the following unique 100 protein sequences under the E-value [0.01] and identity [10%~99%] constraints with 46% average identity.
Selected Pattern (support threshold
85%):
[GO TOP] |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
1jtp:L|
The degenerate interfaces in antigen-antibody complexes Query Protein : 1JTP:L | Lysozyme C. Training Dataset : PSI-BLAST found 123 hits. The mining process executed on the unique 122 protein sequences under the E-value [0.01] and identity [10%~99%] constraints with 55% average identity.
Resultant Link (support
threshold 70%):
Selected Pattern
(Maximum Size Pattern):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Image Under Construction Large Image(2pcc:A) | PDB View |
2pcc:A|
Yeast cytochrome C peroxidase (CCP) complex with compnd yeast
ISO-1-cytochrome C. Query Protein : 2PCC:A | Yeast cytochrome C peroxidase (CCP) Training Dataset : PSI-BLAST found 96 hits. The mining process executed on the unique 35 protein sequences under the E-value [0.01] and identity [30%~99%] constraints with 43% average identity.
Resultant Link (support
threshold 80%):
Selected Pattern
(Maximum Size Pattern):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Image Under Construction Large Image(2pcc:B) | PDB View |
2pcc:B|
Yeast cytochrome C peroxidase (CCP) complex with compnd yeast
ISO-1-cytochrome C. Query Protein : 2PCC:B | Yeast ISO-1-cytochrome C. Training Dataset : PSI-BLAST found 149 hits. The mining process executed on the unique 146 protein sequences under the E-value [0.01] and identity [30%~99%] constraints with 58% average identity.
Resultant Link (support
threshold 79%):
Selected Pattern
(Maximum Size Pattern):
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Image Under Construction Large Image(1gla:F) | PDB View |
1qla:F| Phosphotransferase, glycerol kinase complex
with glycerol and the (escherichia coli) glucose-specific factor III
(III-GLC) Query Protein : 1gla:F Training Dataset : PSI-BLAST found 39 hits. The mining process executed on the unique 37 protein sequences under the E-value [0.01] and identity [10%~99%] constraints with 45% average identity.
Resultant Link (support
threshold 67%):
Selected Pattern
(Maximum Size Pattern): |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Image Under Construction Large Image(1gla:G) | PDB View |
1qla:G| Phosphotransferase, glycerol kinase complex
with glycerol and the (escherichia coli) glucose-specific factor III
(III-GLC) Query Protein : 1gla:G Training Dataset : PSI-BLAST found 141 hits. The mining process executed on the unique 107 protein sequences under the E-value [0.01] and identity [10%~99%] constraints with 58% average identity.
Resultant Link (support
threshold 98%):
Selected Pattern
(Maximum Size Pattern): |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Image Under Construction Large Image(1tx4:A) | PDB View |
1tx4:A| RHO/RHOGAP/GDP(DOT)ALF4 complex Query Protein : 1tx4:A | P50-RHOGAP. Training Dataset : PSI-BLAST found 93 hits. The mining process executed on the unique 42 protein sequences under the E-value [0.01] and identity [10%~99%] constraints with 31% average identity.
Resultant Link (support
threshold 41%):
Selected Pattern
(Maximum Size Pattern): |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Image Under Construction Large Image(1tx4:B) | PDB View |
1tx4:B |
RHO/RHOGAP/GDP(DOT)ALF4
complex Query Protein : 1tx4:B | Transforming protein RHOA. Training Dataset : PSI-BLAST found 250 hits. The mining process executed on the unique 150 protein sequences under the E-value [0.01] and identity [10%~99%] constraints with 43% average identity.
Resultant Link (support
threshold 66%):
Selected Pattern
(Maximum Size Pattern): |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Any comments can be referred to Chien-Yu Chen or Chen-Ming Hsu. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||