DRSC/TRiP Functional Genomics Resources

powered by:
logo

back to: DIOPT - Ortholog Prediction Tool / DIOPT for Diseases and Traits


Protein Alignment Msh6 and Msh6

DIOPT Version :10

Sequence 1:NP_648755.1 Gene:Msh6 / 39654 FlyBaseID:FBgn0036486 Length:1190 Species:Drosophila melanogaster
Sequence 2:NP_001385477.1 Gene:Msh6 / 100360342 RGDID:2322311 Length:1362 Species:Rattus norvegicus


Alignment Length:1193 Identity:514/1193 - (43%)
Similarity:720/1193 - (60%) Gaps:99/1193 - (8%)


- Green bases have known domain annotations that are detailed below.


  Fly    42 ASKSEKENLQNQQPKVKDGKKEASKPAAKRKLPISDDEPASGQRKRKRIVQPESDSEPEMEVTKS 106
            :.|||:||        :|..:|.::|.|:      ....:|.|.|::|::   ||         |
  Rat   220 SDKSEEEN--------QDESEEETQPNAQ------GPRRSSRQVKKRRVI---SD---------S 258

  Fly   107 EDDFSDCASDYEPD-ENEASDDSVSSGAEEVSPSENDMSVDSPTPKKSRK-------KSKILNNN 163
            |.|......:::|| :.|.|.|.||||..: |.||...|.....||:.|.       |.|.|...
  Rat   259 ESDIGGSDVEFKPDSKQEGSSDEVSSGVGD-SDSEGLGSFGKGAPKRKRTVAAHGGLKRKSLKKE 322

  Fly   164 NNNEPSSKKVKLESTIQLAEGATFQEKLKNLQSNAKQDASYDDIVTNTSNLDEPVVWPHQKLEFL 228
            ..:...:.::..|:...|:.....|           ...|...:....::...|.:|.|:.||:|
  Rat   323 TGSAKQATRILSETKSTLSAFCAPQ-----------NSESQTHVCGGGNDSSGPTIWYHETLEWL 376

  Fly   229 QPDKIKDKEGRRPDHPDYDKSTLHVPEKFLNGLSPGVRQWWVLKSDNYDCVLFFKVGKFYELYHM 293
            :|:|.:|:..||||||||:.|||:|||.|||..:||:|:||..||.|:|.|:|:|||||||||||
  Rat   377 KPEKRRDENRRRPDHPDYNSSTLYVPEDFLNSCTPGMRRWWQFKSQNFDLVIFYKVGKFYELYHM 441

  Fly   294 DADVGVNELGFTYMRGEFAHSGFPEISFDKMSTILVDRGFKVARVEQTETPDMMTERCKRI-KAT 357
            ||.:||:|||..:|:|.:||||||||:|.:.|..||.:|:|||||||||||:||..||::: ..:
  Rat   442 DAVIGVSELGLIFMKGNWAHSGFPEIAFGRFSDSLVQKGYKVARVEQTETPEMMEARCRKMAHVS 506

  Fly   358 KFDKVVAREICQITNRGTQVFGSQCKIGPNHQPNYMLAIVEKDE---GTCSRYGVCFIDTSIGDF 419
            |||:||.||||:|..:|||.:.........:...|:|::.||:|   |....|||||:|||:|.|
  Rat   507 KFDRVVRREICRIITKGTQTYSVLDGDPSENYSRYLLSLKEKEEDSSGHMRAYGVCFVDTSLGKF 571

  Fly   420 HLGEFEDDKNCSRLLTLVSHHMPVLFLNEKSALSQRTQQIVRTVLGGILKEP-VPGNGKHACSAE 483
            .||:|.||::||||.|||:|:.||..|.||..||..|:.:::..|...|:|. :||:  ....|.
  Rat   572 FLGQFSDDRHCSRLRTLVAHYPPVQILFEKGNLSTETKTVLKGSLSSCLQEGLIPGS--QFWDAT 634

  Fly   484 KTLKLLAE-RYYAG-PGSDDNWPLVLRTMQSDMDHLGLTPNDNYKLALKALGQCIFFIHKCKLEP 546
            |||:.|.| .|:.| .||....|.||:.|.|:.|.:||||.:..:|:|.|||.|:|::.||.::.
  Rat   635 KTLRTLLEGGYFTGNEGSGAELPPVLKAMTSESDSVGLTPGEESELSLSALGGCVFYLKKCLIDQ 699

  Fly   547 KVLPMARYQLYVP--PDQLADAKPAVASTLRRSHMVLDATTLSNLRII------GEEHSLLSTLD 603
            ::|.||.::.|.|  .|.:...||....|.....|||||.|||||.|.      ..|.:||..||
  Rat   700 ELLSMANFEEYFPLDSDMVGTVKPGAVFTKASQRMVLDAVTLSNLEIFLNGTNGSTEGTLLERLD 764

  Fly   604 HCCTKFGKRLLHHWLCAPSCDVSVIKERQDAIGELIRMPTELQEVRALLAPMPDFERNLAQIHLF 668
            .|.|.||||||..|||||.|..|.|.:|.|||.:|:.:|.::.||..||..:||.||.|::||..
  Rat   765 TCHTPFGKRLLKQWLCAPLCSPSAISDRLDAIEDLMAVPDKVAEVADLLKKLPDLERLLSKIHNV 829

  Fly   669 GNKQIKQMDHPDSRAILFEEKLYNKQKLQGFMAVLKGFNDLTKLPTMFHQC----KTTLLKRITQ 729
            |: .:|..:|||:|||::||..|:|:|:..|::.|:||..:.|:..:....    |:..||::..
  Rat   830 GS-PLKSQNHPDTRAIMYEETTYSKKKIIDFLSALEGFKVMCKITRLMEDVADGFKSKTLKQVVT 893

  Fly   730 LPESG--GSFPDLSKELQYFATAFDHDAAAKTGVIAPQAGMDAEYDAAMDSIGEVEKRLKTYLVE 792
            |....  |.||||:.||..:.|||||:.|.|||:|.|:||.|::||.|:..|.|.|:.|..||.:
  Rat   894 LQTKSPKGRFPDLTAELNRWDTAFDHEKARKTGLITPKAGFDSDYDQALADIRENEQSLLEYLDK 958

  Fly   793 QERHFGCR-ITYFGSDKKRYQLDVPESHASK-ANKSYTLEGQTKGKKPSRRYTTAETRALLKDMQ 855
            |....||| |.|:|..:.||||::||:.|:: ..:.|.|:...||.|   ||.|......|.::.
  Rat   959 QRSRIGCRNIVYWGIGRNRYQLEIPENFATRNLPEEYELKSTKKGCK---RYWTKVIEKKLSNLI 1020

  Fly   856 HAEDTRNMVLKDLARRLFEKFSNHYDQWKQCIDCVANLDVLGSLAEYA-GQQMVICVPELV--SD 917
            :||:.|:..|||..||||..|..::..|:..::|.|.||||..||.|: |....:|.|.|:  .:
  Rat  1021 NAEERRDASLKDCMRRLFYNFDKNHKDWQSAVECTAVLDVLLCLASYSQGGDGPMCRPVLLLPGE 1085

  Fly   918 ADQPFIQLEEGYHPCAN----ASTYIPNGLELGTASEAPLS------LLTGPNMGGKSTLMREVG 972
            ...||::|:...|||..    ...:|||.:.:|...:|...      |:|||||||||||:|:.|
  Rat  1086 DTHPFLELKGSRHPCITKTFFGDDFIPNDILIGCEEDAEADGKAYCVLVTGPNMGGKSTLIRQAG 1150

  Fly   973 LLVIMAQIGAHIPAASCRLSLVDRIFTRLGAQDDILAGHSTFLVELNETSLILKHATCHSLVLLD 1037
            ||.:|||:|.::||..|||:.|||:||||||.|.|::|.|||.|||:||:.||:|||.|||||:|
  Rat  1151 LLAVMAQMGCYVPAELCRLTPVDRVFTRLGASDRIMSGESTFFVELSETASILRHATAHSLVLVD 1215

  Fly  1038 ELGRGTATYDGTAIAASVVNFLA-NLKCRTLFSTHYHNLIDFFHNDKRITLGHMACMVENEDNAD 1101
            ||||||||:||||||::||..|| .:|||||||||||:|::.:..:..:.|||||||||||.. |
  Rat  1216 ELGRGTATFDGTAIASAVVKELAETIKCRTLFSTHYHSLVEDYSKNVCVRLGHMACMVENECE-D 1279

  Fly  1102 PTQETVTFLYKYTAGACPKSYGFNAAKLAGMPQGII----KRAYELSKKVEAIALQRKITAKIVA 1162
            |:|||:|||||:..||||||||||||:||.:|:.:|    ::|.|..:..:|:.|.|:     |.
  Rat  1280 PSQETITFLYKFIKGACPKSYGFNAARLANLPEEVIQKGHRKAREFERMNQALQLFRE-----VC 1339

  Fly  1163 ATAGNEDTKKEKINALKDLLKQL 1185
            ..:.......|.|:.|..|:.||
  Rat  1340 LASERPTVNSEAIHRLLALVNQL 1362

Known Domains:


Indicated by green bases in alignment.

GeneSequenceDomainRegion External IDIdentity
Msh6NP_648755.1 MSCRAMM_ClfA <94..172 CDD:468110 24/85 (28%)
MutS 260..1185 CDD:440019 445/965 (46%)
Msh6NP_001385477.1 PWWP_MSH6 89..192 CDD:438962
MutS 410..1362 CDD:440019 464/992 (47%)
Blue background indicates that the domain is not in the aligned region.

Return to query results.
Submit another query.