DRSC/TRiP Functional Genomics Resources

powered by:
logo

back to: DIOPT - Ortholog Prediction Tool / DIOPT for Diseases and Traits


Protein Alignment Mhc and Myh8

DIOPT Version :10

Sequence 1:NP_523587.4 Gene:Mhc / 35007 FlyBaseID:FBgn0264695 Length:1962 Species:Drosophila melanogaster
Sequence 2:XP_036012291.1 Gene:Myh8 / 17885 MGIID:1339712 Length:1966 Species:Mus musculus


Alignment Length:1949 Identity:1066/1949 - (54%)
Similarity:1426/1949 - (73%) Gaps:41/1949 - (2%)


- Green bases have known domain annotations that are detailed below.


  Fly    12 DPTPYLFVSLEQRRIDQSKPYDSKKSCWIPDEKEGYLLGEIKATKGDIVSVGLQGGETRDLKKDL 76
            :..|||..|.::|...|:||:|:|.|.::.:.||.|:...|::..|..|:|..:.|.|..:|:|.
Mouse    14 EAAPYLRKSEKERIEAQNKPFDAKTSVFVAEPKESYVKSVIQSKDGGKVTVKTESGATLTVKEDQ 78

  Fly    77 LQQVNPPKYEKAEDMSNLTYLNDASVLHNLRQRYYNKLIYTYSGLFCVAINPYKRYPVYTNRCAK 141
            :..:|||||:|.|||:.:|:|::..||:||::||...:||||||||||.:||||..|||......
Mouse    79 VFPMNPPKYDKIEDMAMMTHLHEPGVLYNLKERYAAWMIYTYSGLFCVTVNPYKWLPVYNPEVVA 143

  Fly   142 MYRGKRRNEVPPHIFAISDGAYVDMLTNHVNQSMLITGESGAGKTENTKKVIAYFATVGAS--KK 204
            .||||:|.|.|||||:|||.||..|||:..|||:|||||||||||.|||:||.||||:..:  ||
Mouse   144 AYRGKKRQEAPPHIFSISDNAYQFMLTDRENQSILITGESGAGKTVNTKRVIQYFATIAVTGDKK 208

  Fly   205 TDEAAKSKGSLEDQVVQTNPVLEAFGNAKTVRNDNSSRFGKFIRIHFGPTGKLAGADIETYLLEK 269
            .:|:.|.:|:||||::..||:|||||||||||||||||||||||||||.|||||.||||||||||
Mouse   209 KEESGKMQGTLEDQIISANPLLEAFGNAKTVRNDNSSRFGKFIRIHFGTTGKLASADIETYLLEK 273

  Fly   270 ARVISQQSLERSYHIFYQIMSGSVPGVKDICLLTDNIYDYHIVSQGKVTVASIDDAEEFSLTDQA 334
            :||..|...||||||||||.|...|.:.::.|:|.|.|||..||||::||.||||.||...||.|
Mouse   274 SRVTFQLKAERSYHIFYQITSNKKPELIEMLLITTNPYDYAFVSQGEITVPSIDDQEELMATDSA 338

  Fly   335 FDILGFTKQEKEDVYRITAAVMHMGGMKFKQRGREEQAEQDGEEEGGRVSKLFGCDTAELYKNLL 399
            .|||||:.:||..:|::|.||||.|.|||||:.||||||.||.|...:.:.|...::|:|.|.|.
Mouse   339 IDILGFSPEEKVSIYKLTGAVMHYGNMKFKQKQREEQAEPDGTEVADKAAYLQCLNSADLLKALC 403

  Fly   400 KPRIKVGNEFVTQGRNVQQVTNSIGALCKGVFDRLFKWLVKKCNETLDTQQKRQHFIGVLDIAGF 464
            .||:|||||:||:|:.||||.|::|||.|.|::::|.|:|.:.|:.|||:|.||:||||||||||
Mouse   404 YPRVKVGNEYVTKGQTVQQVYNAVGALAKAVYEKMFLWMVTRINQQLDTKQPRQYFIGVLDIAGF 468

  Fly   465 EIFEYNGFEQLCINFTNEKLQQFFNHHMFVLEQEEYQREGIEWTFIDFGMDLQLCIDLIEKPMGI 529
            |||::|..||||||||||||||||||||||||||||::||||||||||||||..||:|||||:||
Mouse   469 EIFDFNSLEQLCINFTNEKLQQFFNHHMFVLEQEEYKKEGIEWTFIDFGMDLAACIELIEKPLGI 533

  Fly   530 LSILEEESMFPKATDQTFSEKLTNTHLGKSAPFQKPKPPKPGQQAAHFAIAHYAGCVSYNITGWL 594
            .||||||.|||||||.:|..||.:.|||||..||||||.| |:..|||::.||||.|.|||||||
Mouse   534 FSILEEECMFPKATDTSFKNKLYDQHLGKSNNFQKPKPTK-GKAEAHFSLVHYAGTVDYNITGWL 597

  Fly   595 EKNKDPLNDTVVDQFKKSQNKLLIEIFADHA-GQSGGGEQAKGGRGKKGGGFATVSSAYKEQLNS 658
            :|||||||||||..::||..|.|..:|:.:| .::.||  ||.|..|||..|.|||:.::|.||.
Mouse   598 DKNKDPLNDTVVGLYQKSAMKTLASLFSTYASAEADGG--AKKGAKKKGSSFQTVSALFRENLNK 660

  Fly   659 LMTTLRSTQPHFVRCIIPNEMKQPGVVDAHLVMHQLTCNGVLEGIRICRKGFPNRMMYPDFKMRY 723
            |||.||||.|||||||||||.|.||.::..||:|||.||||||||||||||||:|::|.|||.||
Mouse   661 LMTNLRSTHPHFVRCIIPNETKTPGAMEHELVLHQLRCNGVLEGIRICRKGFPSRILYGDFKQRY 725

  Fly   724 KIMCPKLL---QGVEKDKKATEIIIKFIDLPEDQYRLGNTKVFFRAGVLGQMEEFRDERLGKIMS 785
            |::....:   |.:: .|||:|.::..||:...||:.|:|||||:||:||.:||.|||:|.:|::
Mouse   726 KVLNASAIPEGQFID-SKKASEKLLGSIDIDHTQYKFGHTKVFFKAGLLGLLEEMRDEKLAQIIT 789

  Fly   786 WMQAWARGYLSRKGFKKLQEQRVALKVVQRNLRKYLQLRTWPWYKLWQKVKPLLNVSRIEDEIAR 850
            ..||..||||.|..::|:..:|.::..:|.|:|.::.::.|||.||:.|:||||..:..|.|:|.
Mouse   790 RTQAVCRGYLMRVEYQKMLLRRESIFCIQYNVRAFMNVKHWPWMKLFFKIKPLLKSAETEKEMAT 854

  Fly   851 LEEKAKKA-EELHAAEVKVRKELEALNAKLLAEKTALLDSLSGEKGALQDYQERNAKLTAQKNDL 914
            ::|:.:|. :||..:|.| |||||.....||.||..|...:..|..:|.|.:||..:|...|..|
Mouse   855 MKEEFQKTKDELAKSEAK-RKELEEKMVTLLKEKNDLQLQVQSEADSLADAEERCEQLIKNKIQL 918

  Fly   915 ENQLRDIQERLTQEEDARNQLFQQKKKADQEISGLKKDIEDLELNVQKAEQDKATKDHQIRNLND 979
            |.:::::.||...||:...:|..:|:|.:.|.|.|||||:||||.:.|.|::|...:::::||.:
Mouse   919 EAKIKEVTERAEDEEEINAELTAKKRKLEDECSELKKDIDDLELTLAKVEKEKHATENKVKNLTE 983

  Fly   980 EIAHQDELINKLNKEKKMQGETNQKTGEELQAAEDKINHLNKVKAKLEQTLDELEDSLEREKKVR 1044
            |:|..||.|.||.||||...|.:|:|.::|||.|||:|.|.|.|.||||.:|:||.|||:|||:|
Mouse   984 EMAGLDENIAKLTKEKKALQEAHQQTLDDLQAEEDKVNTLTKAKTKLEQQVDDLEGSLEQEKKLR 1048

  Fly  1045 GDVEKSKRKVEGDLKLTQEAVADLERNKKELEQTIQRKDKELSSITAKLEDEQVVVLKHQRQIKE 1109
            .|:|::|||:||||||.||:..|:|.:|::|::.:::|:.|:|::.:|:||||.|.::.|::|||
Mouse  1049 MDLERAKRKLEGDLKLAQESTMDIENDKQQLDEKLKKKEFEISNLISKIEDEQAVEIQLQKKIKE 1113

  Fly  1110 LQARIEELEEEVEAERQARAKAEKQRADLARELEELGERLEEAGGATSAQIELNKKREAELSKLR 1174
            |||||||||||:||||.:||||||||:||:|||||:.|||||||||||||:|:|||||.|..|||
Mouse  1114 LQARIEELEEEIEAERASRAKAEKQRSDLSRELEEISERLEEAGGATSAQVEMNKKRETEFQKLR 1178

  Fly  1175 RDLEEANIQHESTLANLRKKHNDAVAEMAEQVDQLNKLKAKAEKEKNEYYGQLNDLRAGVDHITN 1239
            ||||||.:|||:|.|.|||||.|:|||:.||:|.|.::|.|.||||:|...:::||.:..:.|..
Mouse  1179 RDLEEATLQHEATAAALRKKHADSVAELGEQIDNLQRVKQKLEKEKSELKMEIDDLSSNAEAIAK 1243

  Fly  1240 EKAAQEKIAKQLQHTLNEVQSKLDETNRTLNDFDASKKKLSIENSDLLRQLEEAESQVSQLSKIK 1304
            .|...||:.:.|:..::|::||.:|..|.:|:..|.:.:|..|..:..|||:|.::.|||||:.|
Mouse  1244 AKGNLEKMCRTLEDQVSELKSKEEEQQRLINELTAQRARLQTEAGEYSRQLDEKDALVSQLSRSK 1308

  Fly  1305 ISLTTQLEDTKRLADEESRERATLLGKFRNLEHDLDNLREQVEEEAEGKADLQRQLSKANAEAQV 1369
            .:.|.|:|:.||..:||::.:..|....::..||.|.||||.|||.||||:|||.|||||:|...
Mouse  1309 QASTQQIEELKRQLEEETKAKNALAHALQSSRHDCDLLREQYEEEQEGKAELQRALSKANSEVAQ 1373

  Fly  1370 WRSKYESDGVARSEELEEAKRKLQARLAEAEETIESLNQKCIGLEKTKQRLSTEVEDLQLEVDRA 1434
            ||:|||:|.:.|:|||||||:||..||..|||.:|::|.||..||||||||..|||||.::|:|.
Mouse  1374 WRTKYETDAIQRTEELEEAKKKLAQRLQAAEEHVEAVNAKCASLEKTKQRLQNEVEDLMIDVERT 1438

  Fly  1435 NAIANAAEKKQKAFDKIIGEWKLKVDDLAAELDASQKECRNYSTELFRLKGAYEEGQEQLEAVRR 1499
            ||...|.:|||:.|||::.||:.|.::..|||::.|||.|..|||||::|.||||..:.||.:||
Mouse  1439 NAACAALDKKQRNFDKVLSEWRQKYEETQAELESCQKESRTLSTELFKVKNAYEESLDHLETLRR 1503

  Fly  1500 ENKNLADEVKDLLDQIGEGGRNIHEIEKARKRLEAEKDELQAALEEAEAALEQEENKVLRAQLEL 1564
            |||||..|:.||.:||.|||::|||:||.:|::|.||.|:|||||||||:||.||.|:||.||||
Mouse  1504 ENKNLQQEISDLTEQIAEGGKHIHELEKIKKQVEQEKCEIQAALEEAEASLEHEEGKILRIQLEL 1568

  Fly  1565 SQVRQEIDRRIQEKEEEFENTRKNHQRALDSMQASLEAEAKGKAEALRMKKKLEADINELEIALD 1629
            :||:.||||:|.||:||.:..::||.|.:::||::|:||.:.:.:|||:|||:|.|:||:||.|:
Mouse  1569 NQVKSEIDRKIAEKDEEIDQLKRNHVRVVETMQSTLDAEIRSRNDALRVKKKMEGDLNEMEIQLN 1633

  Fly  1630 HANKANAEAQKNIKRYQQQLKDIQTALEEEQRARDDAREQLGISERRANALQNELEESRTLLEQA 1694
            |||:..||:.:|.:..|..|||.|..|::..|.::|.:|||.|.|||||.||.|:||.|..|||.
Mouse  1634 HANRLAAESLRNYRNTQGILKDTQLHLDDALRGQEDLKEQLAIVERRANLLQAEIEELRATLEQT 1698

  Fly  1695 DRGRRQAEQELADAHEQLNEVSAQNASISAAKRKLESELQTLHSDLDELLNEAKNSEEKAKKAMV 1759
            :|.|:.|||||.||.|::..:..||.|:...|:|||:::..|.|:::|::.|::|:|||||||:.
Mouse  1699 ERSRKIAEQELLDASERVQLLHTQNTSLINTKKKLENDVSQLQSEVEEVIQESRNAEEKAKKAIT 1763

  Fly  1760 D-----------------------------AARLADELRAEQDHAQTQEKLRKALEQQIKELQVR 1795
            |                             ||.:|:||:.|||.:...|:::|.:||.:|:||.|
Mouse  1764 DVSTTHITLPTPVLPATTRAYFCLDLFASQAAMMAEELKKEQDTSAHLERMKKNMEQTVKDLQHR 1828

  Fly  1796 LDEAEANALKGGKKAIQKLEQRVRELENELDGEQRRHADAQKNLRKSERRVKELSFQSEEDRKNH 1860
            |||||..|||||||.|||||.||||||.|::.||:|:|:|.|.|||.|||||||::|:||||||.
Mouse  1829 LDEAEQLALKGGKKQIQKLEARVRELEGEVENEQKRNAEAVKGLRKHERRVKELTYQTEEDRKNV 1893

  Fly  1861 ERMQDLVDKLQQKIKTYKRQIEEAEEIAALNLAKFRKAQQELEEAEERADLAEQAISKFRAKGR 1924
            .|:||||||||.|:|:||||.|||||.:..|||||||.|.||||||||||:||..::|.|.|.|
Mouse  1894 LRLQDLVDKLQAKVKSYKRQAEEAEEQSNANLAKFRKLQHELEEAEERADIAESQVNKLRVKSR 1957

Known Domains:


Indicated by green bases in alignment.

GeneSequenceDomainRegion External IDIdentity
MhcNP_523587.4 Myosin_N 33..75 CDD:460670 13/41 (32%)
MYSc_Myh1_insects_crustaceans 100..765 CDD:276874 422/670 (63%)
Myosin_tail_1 842..1922 CDD:460256 575/1109 (52%)
Myh8XP_036012291.1 Myosin_N 35..79 CDD:460670 14/43 (33%)
Motor_domain 102..769 CDD:473979 422/670 (63%)
Myosin_tail_1 849..1955 CDD:460256 575/1106 (52%)

Return to query results.
Submit another query.