DRSC/TRiP Functional Genomics Resources

powered by:
logo

back to: DIOPT - Ortholog Prediction Tool / DIOPT for Diseases and Traits


Protein Alignment Mhc and Myh3

DIOPT Version :10

Sequence 1:NP_523587.4 Gene:Mhc / 35007 FlyBaseID:FBgn0264695 Length:1962 Species:Drosophila melanogaster
Sequence 2:NP_036736.1 Gene:Myh3 / 24583 RGDID:3138 Length:1940 Species:Rattus norvegicus


Alignment Length:1918 Identity:1074/1918 - (55%)
Similarity:1431/1918 - (74%) Gaps:14/1918 - (0%)


- Green bases have known domain annotations that are detailed below.


  Fly    15 PYLFVSLEQRRIDQSKPYDSKKSCWIPDEKEGYLLGEIKATKGDIVSVGLQGGETRDLKKDLLQQ 79
            |:|..|.::|...|::|:|:|..|::.|.||.|..|:||:::...|:|..:...|..:|.:.:..
  Rat    15 PFLRKSEKERIEAQNQPFDAKTYCFVVDSKEEYAKGKIKSSQDGKVTVETEDNRTLVVKPEDVYA 79

  Fly    80 VNPPKYEKAEDMSNLTYLNDASVLHNLRQRYYNKLIYTYSGLFCVAINPYKRYPVYTNRCAKMYR 144
            :||||::|.|||:.||:||:.:||:||:.||.:.:||||||||||.:||||..||||......||
  Rat    80 MNPPKFDKIEDMAMLTHLNEPAVLYNLKDRYTSWMIYTYSGLFCVTVNPYKWLPVYTPEVVDGYR 144

  Fly   145 GKRRNEVPPHIFAISDGAYVDMLTNHVNQSMLITGESGAGKTENTKKVIAYFATVGA----SKKT 205
            ||:|.|.|||||:|||.||..|||:..|||:|||||||||||.|||:||.||||:.|    :||.
  Rat   145 GKKRQEAPPHIFSISDNAYQFMLTDRENQSILITGESGAGKTVNTKRVIQYFATIAATGDLAKKK 209

  Fly   206 DEAAKSKGSLEDQVVQTNPVLEAFGNAKTVRNDNSSRFGKFIRIHFGPTGKLAGADIETYLLEKA 270
            |  :|.||:||||::..||:|||||||||||||||||||||||||||.|||||.||||||||||:
  Rat   210 D--SKMKGTLEDQIISANPLLEAFGNAKTVRNDNSSRFGKFIRIHFGTTGKLASADIETYLLEKS 272

  Fly   271 RVISQQSLERSYHIFYQIMSGSVPGVKDICLLTDNIYDYHIVSQGKVTVASIDDAEEFSLTDQAF 335
            ||..|...||||||||||:|...|.:.::.|:|.|.|||..:|||::.||||||.||...||.|.
  Rat   273 RVTFQLKAERSYHIFYQILSNKKPELIELLLITTNPYDYPFISQGEILVASIDDREELLATDSAI 337

  Fly   336 DILGFTKQEKEDVYRITAAVMHMGGMKFKQRGREEQAEQDGEEEGGRVSKLFGCDTAELYKNLLK 400
            ||||||.:||..:|::|.||||.|.|||||:.||||||.||.|...:.:.|.|.::::|.|.|..
  Rat   338 DILGFTPEEKSGLYKLTGAVMHYGNMKFKQKQREEQAEPDGTEVADKTAYLMGLNSSDLLKALCF 402

  Fly   401 PRIKVGNEFVTQGRNVQQVTNSIGALCKGVFDRLFKWLVKKCNETLDTQQKRQHFIGVLDIAGFE 465
            ||:|||||:||:|:.|.||.:::.||.|.|:::||.|:|.:.|:.|||:..||||||||||||||
  Rat   403 PRVKVGNEYVTKGQTVDQVHHAVNALSKSVYEKLFLWMVTRINQQLDTKLPRQHFIGVLDIAGFE 467

  Fly   466 IFEYNGFEQLCINFTNEKLQQFFNHHMFVLEQEEYQREGIEWTFIDFGMDLQLCIDLIEKPMGIL 530
            |||||..||||||||||||||||||||||||||||::||||||||||||||..||:||||||||.
  Rat   468 IFEYNSLEQLCINFTNEKLQQFFNHHMFVLEQEEYKKEGIEWTFIDFGMDLAACIELIEKPMGIF 532

  Fly   531 SILEEESMFPKATDQTFSEKLTNTHLGKSAPFQKPKPPKPGQQAAHFAIAHYAGCVSYNITGWLE 595
            ||||||.|||||||.:|..||.:.|||||..|||||..| |:..|||::.||||.|.|:::||||
  Rat   533 SILEEECMFPKATDTSFKNKLYDQHLGKSNNFQKPKVVK-GKAEAHFSLIHYAGTVDYSVSGWLE 596

  Fly   596 KNKDPLNDTVVDQFKKSQNKLLIEIFADHAGQSGGGEQAKGGRGKKGGGFATVSSAYKEQLNSLM 660
            |||||||:|||..::||.|:||..::|..|.....|.:.|..: |||..|.|||:.::|.||.||
  Rat   597 KNKDPLNETVVGLYQKSSNRLLAHLYATFATTDADGGKKKVAK-KKGSSFQTVSALFRENLNKLM 660

  Fly   661 TTLRSTQPHFVRCIIPNEMKQPGVVDAHLVMHQLTCNGVLEGIRICRKGFPNRMMYPDFKMRYKI 725
            :.||:|.|||||||||||.|.||.::..||:|||.||||||||||||||||||::|.|||.||::
  Rat   661 SNLRTTHPHFVRCIIPNETKTPGAMEHSLVLHQLRCNGVLEGIRICRKGFPNRILYGDFKQRYRV 725

  Fly   726 MCPKLL---QGVEKDKKATEIIIKFIDLPEDQYRLGNTKVFFRAGVLGQMEEFRDERLGKIMSWM 787
            :....:   |.:: .|||.|.::..||:...||:.|:|||||:||:||.:||.|||||.|:::..
  Rat   726 LNASAIPEGQFID-SKKACEKLLASIDIDHTQYKFGHTKVFFKAGLLGTLEEMRDERLAKLITRT 789

  Fly   788 QAWARGYLSRKGFKKLQEQRVALKVVQRNLRKYLQLRTWPWYKLWQKVKPLLNVSRIEDEIARLE 852
            ||..||:|.|..|:|:.::|.::..:|.|:|.::.::.|||.||:.|:||||..:..|.|:|.::
  Rat   790 QAVCRGFLMRVEFQKMMQRRESIFCIQYNIRAFMNVKHWPWMKLFFKIKPLLKSAETEKEMATMK 854

  Fly   853 EKAKKA-EELHAAEVKVRKELEALNAKLLAEKTALLDSLSGEKGALQDYQERNAKLTAQKNDLEN 916
            |:.:|. :||..:|.| |||||.....|:.||..|...:..|...|.|.:||..:|...|..||.
  Rat   855 EEFQKTKDELAKSEAK-RKELEEKLVTLVQEKNDLQLQVQAESENLLDAEERCDQLIKAKFQLEA 918

  Fly   917 QLRDIQERLTQEEDARNQLFQQKKKADQEISGLKKDIEDLELNVQKAEQDKATKDHQIRNLNDEI 981
            :::::.||...||:...:|..:|:|.:.|.|.|||||:||||.:.|.|::|...:::::||.:|:
  Rat   919 KIKEVTERAEDEEEINAELTAKKRKLEDECSELKKDIDDLELTLAKVEKEKHATENKVKNLTEEL 983

  Fly   982 AHQDELINKLNKEKKMQGETNQKTGEELQAAEDKINHLNKVKAKLEQTLDELEDSLEREKKVRGD 1046
            |..||.|.||.:|||...|.:|:|.::|||.|||:|.|:|:|:||||.:|:||.|||:|||:|.|
  Rat   984 AGLDETIAKLTREKKALQEAHQQTLDDLQAEEDKVNSLSKLKSKLEQQVDDLESSLEQEKKLRVD 1048

  Fly  1047 VEKSKRKVEGDLKLTQEAVADLERNKKELEQTIQRKDKELSSITAKLEDEQVVVLKHQRQIKELQ 1111
            :|::|||:||||||.||::.|||.:|::|::.:::||.|.|.:.:|:||||.:.|:.|::|||||
  Rat  1049 LERNKRKLEGDLKLAQESILDLENDKQQLDERLKKKDFEYSQLQSKVEDEQTLSLQLQKKIKELQ 1113

  Fly  1112 ARIEELEEEVEAERQARAKAEKQRADLARELEELGERLEEAGGATSAQIELNKKREAELSKLRRD 1176
            |||||||||:||||..|||.||||:|.|||||||.||||||||.||.|||||||||||..|||||
  Rat  1114 ARIEELEEEIEAERATRAKTEKQRSDYARELEELSERLEEAGGVTSTQIELNKKREAEFLKLRRD 1178

  Fly  1177 LEEANIQHESTLANLRKKHNDAVAEMAEQVDQLNKLKAKAEKEKNEYYGQLNDLRAGVDHITNEK 1241
            ||||.:|||:|:|.|||||.|:.||:|||:|.|.::|.|.||||:|:..:::||.:.|:.::..|
  Rat  1179 LEEATLQHEATVATLRKKHADSAAELAEQIDNLQRVKQKLEKEKSEFKLEIDDLSSSVESVSKSK 1243

  Fly  1242 AAQEKIAKQLQHTLNEVQSKLDETNRTLNDFDASKKKLSIENSDLLRQLEEAESQVSQLSKIKIS 1306
            |..|||.:.|:..|:|.:.|.:||.|:|::....|.:|..|..:|.|||||.||.|||||:.|.:
  Rat  1244 ANLEKICRTLEDQLSEARGKNEETQRSLSELTTQKSRLQTEAGELSRQLEEKESIVSQLSRSKQA 1308

  Fly  1307 LTTQLEDTKRLADEESRERATLLGKFRNLEHDLDNLREQVEEEAEGKADLQRQLSKANAEAQVWR 1371
            .|.|:|:.||..:||::.:..|....::..||.|.||||.|||.||||:|||.|||||:|...||
  Rat  1309 FTQQIEELKRQLEEENKAKNALAHALQSSRHDCDLLREQYEEEQEGKAELQRALSKANSEVAQWR 1373

  Fly  1372 SKYESDGVARSEELEEAKRKLQARLAEAEETIESLNQKCIGLEKTKQRLSTEVEDLQLEVDRANA 1436
            :|||:|.:.|:|||||||:||..||.::||.:|::|.||..||||||||..|||||.::|:|||:
  Rat  1374 TKYETDAIQRTEELEEAKKKLAQRLQDSEEQVEAVNAKCASLEKTKQRLQGEVEDLMVDVERANS 1438

  Fly  1437 IANAAEKKQKAFDKIIGEWKLKVDDLAAELDASQKECRNYSTELFRLKGAYEEGQEQLEAVRREN 1501
            :|.|.:|||:.|||::.|||.|.::..|||:|:.||.|:.|||||:||.||||..:|||.|:|||
  Rat  1439 LAAALDKKQRNFDKVLAEWKTKCEESQAELEAALKESRSLSTELFKLKNAYEEALDQLETVKREN 1503

  Fly  1502 KNLADEVKDLLDQIGEGGRNIHEIEKARKRLEAEKDELQAALEEAEAALEQEENKVLRAQLELSQ 1566
            |||..|:.||.:||.|.|::|||:||:||::|.||.::|.||||||||||.||.|:||.||||:|
  Rat  1504 KNLEQEIADLTEQIAENGKSIHELEKSRKQMELEKADIQMALEEAEAALEHEEAKILRIQLELTQ 1568

  Fly  1567 VRQEIDRRIQEKEEEFENTRKNHQRALDSMQASLEAEAKGKAEALRMKKKLEADINELEIALDHA 1631
            |:.||||:|.||:||.|..::|:||.:::||.:|:||.:.:.||:|:|||:|.|:||:||.|.||
  Rat  1569 VKSEIDRKIAEKDEEIEQLKRNYQRTVETMQGALDAEVRSRNEAIRLKKKMEGDLNEIEIQLSHA 1633

  Fly  1632 NKANAEAQKNIKRYQQQLKDIQTALEEEQRARDDAREQLGISERRANALQNELEESRTLLEQADR 1696
            |:..||..|:::..|.||||.|..|::..|.::|.:|||.|.|||||.||.|:||.|..|||.:|
  Rat  1634 NRQAAETIKHLRSVQGQLKDTQLHLDDALRGQEDLKEQLAIVERRANLLQAEVEELRATLEQTER 1698

  Fly  1697 GRRQAEQELADAHEQLNEVSAQNASISAAKRKLESELQTLHSDLDELLNEAKNSEEKAKKAMVDA 1761
            .|:.|||||.|::|::..:..||.|:...|:|||::|..|.|::::...:|:|:|||||||:.||
  Rat  1699 ARKLAEQELLDSNERVQLLHTQNTSLIHTKKKLETDLTQLQSEVEDASRDARNAEEKAKKAITDA 1763

  Fly  1762 ARLADELRAEQDHAQTQEKLRKALEQQIKELQVRLDEAEANALKGGKKAIQKLEQRVRELENELD 1826
            |.:|:||:.|||.:...|:::|.|||.:|:||.||||||..|||||||.|||||.|:||||.||:
  Rat  1764 AMMAEELKKEQDTSAHLERMKKNLEQTVKDLQHRLDEAEQLALKGGKKQIQKLETRIRELEFELE 1828

  Fly  1827 GEQRRHADAQKNLRKSERRVKELSFQSEEDRKNHERMQDLVDKLQQKIKTYKRQIEEAEEIAALN 1891
            |||:|:.::.|.|||.|||||||::||||||||..|:||||||||.|:|:||||.|||:|.|.::
  Rat  1829 GEQKRNTESVKGLRKYERRVKELTYQSEEDRKNVLRLQDLVDKLQVKVKSYKRQAEEADEQANVH 1893

  Fly  1892 LAKFRKAQQELEEAEERADLAEQAISKFRAKGR 1924
            |.||||||.||||||||||:||..::|.|||.|
  Rat  1894 LTKFRKAQHELEEAEERADIAESQVNKLRAKTR 1926

Known Domains:


Indicated by green bases in alignment.

GeneSequenceDomainRegion External IDIdentity
MhcNP_523587.4 Myosin_N 33..75 CDD:460670 14/41 (34%)
MYSc_Myh1_insects_crustaceans 100..765 CDD:276874 418/671 (62%)
Myosin_tail_1 842..1922 CDD:460256 586/1080 (54%)
Myh3NP_036736.1 Myosin_N 33..77 CDD:460670 14/43 (33%)
MYSc_Myh3 100..767 CDD:276878 418/671 (62%)
Actin-binding 656..678 16/21 (76%)
Actin-binding 758..772 8/13 (62%)
Myosin_tail_1 847..1924 CDD:460256 586/1077 (54%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 1260..1289 8/28 (29%)

Return to query results.
Submit another query.