DRSC/TRiP Functional Genomics Resources

powered by:
logo

back to: DIOPT - Ortholog Prediction Tool / DIOPT for Diseases and Traits


Protein Alignment Usp47 and Usp47

DIOPT Version :10

Sequence 1:NP_523937.2 Gene:Usp47 / 38644 FlyBaseID:FBgn0016756 Length:1556 Species:Drosophila melanogaster
Sequence 2:XP_006230106.1 Gene:Usp47 / 308896 RGDID:1310411 Length:1395 Species:Rattus norvegicus


Alignment Length:1475 Identity:483/1475 - (32%)
Similarity:696/1475 - (47%) Gaps:278/1475 - (18%)


- Green bases have known domain annotations that are detailed below.


  Fly   207 STEINSK---NTSSESPVAKKTAKVTSK-----PTLELLSPIKPSSPIKELDCEPVDTLSKQQLS 263
            |..:|.:   |..:.:||.|....|.:|     .|.:|..    .:.|...|..|:|..|.:.|.
  Rat    53 SKTVNERITVNLPASTPVRKLFEDVANKVGYINGTFDLTW----GNGINTADLAPLDHTSDKSLL 113

  Fly   264 EQLQLYPQGRNLISPVDDAPSDLFISDAEQ---LSDDDLALGASASPTMLGPGYDYGAPTGDSDV 325
            : ....|..:|.:...|        .|.||   |.||...:..|.....:||     .|.     
  Rat   114 D-ANFEPGKKNFLHLTD--------KDGEQPQMLLDDSSHVDDSVHDRFIGP-----LPR----- 159

  Fly   326 EGVTGVTDPSTIGTDDGTYPALSNFYRRKYGGDELRAWQRVNTTGADFVSSATTETEAEARQASL 390
                           :|:..:.|::..:.|.                 .||...::|.       
  Rat   160 ---------------EGSVASTSDYVSQSYS-----------------YSSILNKSET------- 185

  Fly   391 GPRGYVGLVNQAMTCYLNSLLQALFMTPEFRNALYRWEFDNDNE--AKNIPYQLQKLFLNLQTSP 453
               |||||||||||||||||||.||||||||||||:|||:...|  ..:||||||:||:.||||.
  Rat   186 ---GYVGLVNQAMTCYLNSLLQTLFMTPEFRNALYKWEFEESEEDPVTSIPYQLQRLFVLLQTSK 247

  Fly   454 KAAVETTDLTRSFGWDSTEAWQQHDIQELCRVMFDALEHKFKNTKQANLISNLYEGKMNDYVKCL 518
            |.|:||||:||||||||:|||||||:||||||||||||.|:|.|:||:||:.||:||:.|||:||
  Rat   248 KRAIETTDVTRSFGWDSSEAWQQHDVQELCRVMFDALEQKWKQTEQADLINELYQGKLKDYVRCL 312

  Fly   519 ECNTEKTREDTFLDIPLPVRPFGSSSAYGSIEEALRAFVQPETLDGNNQYLCEKCKKKCDAHKGL 583
            ||..|..|.||:|||||.:||:|||.|:.|:||||.||:|||.|||.|||.||:|||||||.|||
  Rat   313 ECGYEGWRIDTYLDIPLVIRPYGSSQAFASVEEALHAFIQPEILDGPNQYFCERCKKKCDARKGL 377

  Fly   584 HFKSFPYILTLHLKRFDFDYQTMHRIKLNDRVTFPQTLNLNTFINRSGNSGEQNSQLNGTVDDCS 648
            .|..|||:|||.||||||||.||||||||||::||:.|:::|||:.......|..         |
  Rat   378 RFLHFPYLLTLQLKRFDFDYTTMHRIKLNDRMSFPEELDMSTFIDIEDEKSPQTE---------S 433

  Fly   649 TADSGSAMEDDNLSSGVVTTASSSQHENDLNDE---DEGIDMSSST--SKSAKQG---------- 698
            ..|||:..|.         :..|.|..||.:.:   ||||.:.|||  .|.:|.|          
  Rat   434 CTDSGAENEG---------SCHSDQMSNDFSTDDAVDEGICLESSTGSEKISKPGLEKVEMAETD 489

  Fly   699 ------------SGPYLYELFAIMIHSGSASGGHYYAYIKDFDNNEWFCFNDQNVTSITQEDIQR 751
                        ....:||||::|:|||||:||||||.||.|.:::|:.||||:|:.||||||::
  Rat   490 QRKDSIQFQLGEPNSLMYELFSVMVHSGSAAGGHYYACIKSFSDDQWYSFNDQHVSRITQEDIKK 554

  Fly   752 SFGGPNGS--YYSSAYTSSTNAYMLMYRQVDAKRNELVAKVADFPEHIKTLLPKLH--SEEETRV 812
            :.||.:||  |||||:.||||||||:||..|..||....:|.::|||||.|:.|..  .|:|.|.
  Rat   555 THGGSSGSRGYYSSAFASSTNAYMLIYRLKDPTRNAKFLEVDEYPEHIKNLVQKERELEEQEKRQ 619

  Fly   813 SRLGRHITVTDLALPDLYKPRVYFYNPSLKKMKITRVYVSQSFNINLVLMSAYEMLNVEQFAPLS 877
            ..:.|:..          |.:::..:|..:.|...::.|.:...:...:..||:|:::|...||.
  Rat   620 REIERNTC----------KIKLFCLHPVKQVMMENKLEVHKDKTLKEAVEMAYKMMDLEDVIPLD 674

  Fly   878 RCRLVAYNSSMDTIIQSLESCTDPALTELRAA--QNYSLDFLLEYRAEDQEFEVYPPNGITWYVF 940
            .||||.|:...|.:.:|.|...|..:..|...  ..|..|.|||.|..||.|:.|.|..:...|.
  Rat   675 CCRLVKYDEFHDYLERSYEGEEDTPMGLLLGGVKSTYMFDLLLETRKPDQIFQSYKPGEVMVKVH 739

  Fly   941 KVDLSTMAMDGPFLVYSAAREREASDVLRRSIALRLHISEQQFLLATVRA-------TVP----- 993
            .|||....:..|..|.:...:....  .::.|:...|:..:...:...|.       ::|     
  Rat   740 VVDLKAETVAAPVTVRAYLNQTVLE--FKQLISKATHLPAEPMRIVLERCYNDLRLLSMPSKTLK 802

  Fly   994 --------KAFVSYD---PHPTPEALQHLQNMANTQFKSITYFYLNVP----------------- 1030
                    |.||...   .|.......||..:.:....:|..|.| :|                 
  Rat   803 AEGFFRSNKVFVESSETVDHQAAFTDSHLWKLLDRHANTIRLFVL-LPEQSPGSYSKRTAYQKAG 866

  Fly  1031 ----NTD---------AATLEMLGVPTVESVECASG--------GDVVDAAMMNGVAPGHMSSSN 1074
                |.|         |.:|:.:.....||.|....        ||..|::          .|:.
  Rat   867 GDSGNVDDDCERAKGPAGSLKSVDAILEESTEKLKSLSLQQQQDGDNGDSS----------KSTE 921

  Fly  1075 DYDWRRYKRDLVEPMSQPSPSH----GHESNSEDSSLSDGDRTLVETDNMAHRGGGDSQVSSTSH 1135
            ..|:...:..|.|..|..|..:    .|...|:..:....:|:..:.:|.......||.:.|:||
  Rat   922 TSDFENIESPLNERGSSTSVDNRELEQHIQTSDPENFQSEERSDSDVNNDRSTSSVDSDILSSSH 986

  Fly  1136 SPQLSSPEDEAASHDAMMRVHAYCNGNGS-YAAADVVDPLLLPTSTNHFFYATKVECVDVVGTGS 1199
            |..                  ..||.:.: ...|:.:|...:.:|........|.|..|.....|
  Rat   987 SSD------------------TLCNADSAQIPLANGLDSHSITSSRRTKANEGKKETWDTAEEDS 1033

  Fly  1200 SSGHQSDEEAQLR----------KPTRA-------YKLL---VGTHMRMGAFKKHIEQLIQVPAA 1244
            .:..:.||..:.|          .|..|       :|.|   |...:.:.|||:|:|..:.|.::
  Rat  1034 GTDSEYDESGKSRGEMQYMYFKADPYTADEGSGEGHKWLMVHVDKRITLAAFKQHLEPFVGVLSS 1098

  Fly  1245 HFKLQRKHDNNL---SNNQNNSLVHLIEGETLTVELGKTLEPDEFKAKIHFLRLADIDNETSKLP 1306
            |||:.|.:.:|.   :...|.:|....:...:|:.||:.|:..|::.|:..|    :.||.....
  Rat  1099 HFKVFRVYTSNQEFETVRLNETLSSFSDDNKITIRLGRALKKGEYRVKVCQL----LVNEQEPCK 1159

  Fly  1307 CVCEWVYNANTTAEQAKKELVAKLHR---IDAKYATLSVQNCRIWLKGGRIPIKILSDDETLYCD 1368
            .:.:.|:....|..|:|:||:.:|..   :|     ||:...|:..|..:.|..:..|......|
  Rat  1160 FLLDAVFAKGMTVRQSKEELIPQLREQCGLD-----LSIDRFRLRKKTWKNPGTVFLDYHIYEED 1219

  Fly  1369 MRSSIAAEFIVQECEEEVDPQPKDDSLTLFVRRWCPAKLEFGKFQEITLDQDS--EIRLSLSQIS 1431
            :..|...| :..|..:.|:.......|.:..|||.|::::...|||:.|:.:|  |:|..||:||
  Rat  1220 INISSNWE-VFLEVLDGVEKMKSMSQLAILTRRWRPSEMKLDPFQELVLESNSVDELREKLSEIS 1283

  Fly  1432 DIPIDKLSYMKLNSNFPCTSISALSVNESSSWYSVPTTLDKYPLNSTQTGNIYLYKDRTVPAREL 1496
            .||::.:.:.|....||| .||.|.:::...|....:||:.:||.....|.:..|:|||....||
  Rat  1284 GIPLEDIEFAKGRGTFPC-DISVLDIHQDLDWNPKVSTLNVWPLYICDDGAVIFYRDRTEEVMEL 1347

  Fly  1497 TLEERRLMNAREKARLDRVGCVSTTRYAQRRERALKIYLD-SPEK 1540
            |.|:|..:..:|.:||.:.|  ....|:.|:|:||||||| :|.|
  Rat  1348 TDEQRNELMKKESSRLQKTG--HRVTYSPRKEKALKIYLDGAPNK 1390

Known Domains:


Indicated by green bases in alignment.

GeneSequenceDomainRegion External IDIdentity
Usp47NP_523937.2 DUF4045 <122..249 CDD:433066 11/49 (22%)
peptidase_C19C 394..780 CDD:239124 242/416 (58%)
USP47_C 1300..1534 CDD:466158 71/238 (30%)
Usp47XP_006230106.1 peptidase_C19C 186..586 CDD:239124 221/428 (52%)
USP47_C 1144..1383 CDD:466158 75/244 (31%)

Return to query results.
Submit another query.