DRSC/TRiP Functional Genomics Resources

powered by:
logo

back to: DIOPT - Ortholog Prediction Tool / DIOPT for Diseases and Traits


Protein Alignment HTT and Htt

DIOPT Version :8

Sequence 1:NP_002102.4 Gene:HTT / 3064 HGNCID:4851 Length:3144 Species:Homo sapiens
Sequence 2:NP_077333.2 Gene:Htt / 29424 RGDID:68337 Length:3120 Species:Rattus norvegicus

Alignment Length:3148 Identity:2847/3149 (90%)
Similarity:2966/3149 (94%) Gaps:32/3149 (1%)


Human     1 MATLEKLMKAFESLKSFQQQQQQQQQQQQQQQQQQQQQQQPP--PPPPPPPPPQLPQPPPQAQPL 63
            |||||||||||||||||              ||||||||.||  ||||||||||.||||||.|  
  Rat     1 MATLEKLMKAFESLKSF--------------QQQQQQQQPPPQAPPPPPPPPPQPPQPPPQGQ-- 49

Human    64 LPQPQPPPPPPPPPPGPAVAEEPLHRPKKELSATKKDRVNHCLTICENIVAQSVRNSPEFQKLLG 128
                   ||||||.|||  ||||||||||||||||||||||||||||||||||:|||||||||||
  Rat    50 -------PPPPPPLPGP--AEEPLHRPKKELSATKKDRVNHCLTICENIVAQSLRNSPEFQKLLG 105

Human   129 IAMELFLLCSDDAESDVRMVADECLNKVIKALMDSNLPRLQLELYKEIKKNGAPRSLRAALWRFA 193
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat   106 IAMELFLLCSDDAESDVRMVADECLNKVIKALMDSNLPRLQLELYKEIKKNGAPRSLRAALWRFA 170

Human   194 ELAHLVRPQKCRPYLVNLLPCLTRTSKRPEESVQETLAAAVPKIMASFGNFANDNEIKVLLKAFI 258
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat   171 ELAHLVRPQKCRPYLVNLLPCLTRTSKRPEESVQETLAAAVPKIMASFGNFANDNEIKVLLKAFI 235

Human   259 ANLKSSSPTIRRTAAGSAVSICQHSRRTQYFYSWLLNVLLGLLVPVEDEHSTLLILGVLLTLRYL 323
            |||||||||:||||||||||||||||||||||:||||||||||||:|::|.||||||||||||.|
  Rat   236 ANLKSSSPTVRRTAAGSAVSICQHSRRTQYFYNWLLNVLLGLLVPMEEDHPTLLILGVLLTLRCL 300

Human   324 VPLLQQQVKDTSLKGSFGVTRKEMEVSPSAEQLVQVYELTLHHTQHQDHNVVTGALELLQQLFRT 388
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat   301 VPLLQQQVKDTSLKGSFGVTRKEMEVSPSAEQLVQVYELTLHHTQHQDHNVVTGALELLQQLFRT 365

Human   389 PPPELLQTLTAVGGIGQLTAAKEESGGRSRSGSIVELIAGGGSSCSPVLSRKQKGKVLLGEEEAL 453
            |||||||.||..||:||||..:||:|||.||||||||:|||||||||||||||||||||||||||
  Rat   366 PPPELLQALTTPGGLGQLTLVREEAGGRGRSGSIVELLAGGGSSCSPVLSRKQKGKVLLGEEEAL 430

Human   454 EDDSESRSDVSSSALTASVKDEISGELAA-SSGVSTPGSAGHDIITEQPRSQHTLQADSVDLASC 517
            ||||||||||||||..||||.||.||||| |||||||||.||||||||||||||||||||||:.|
  Rat   431 EDDSESRSDVSSSAFAASVKSEIGGELAASSSGVSTPGSVGHDIITEQPRSQHTLQADSVDLSGC 495

Human   518 DLTSSATDGDEEDILSHSSSQVSAVPSDPAMDLNDGTQASSPISDSSQTTTEGPDSAVTPSDSSE 582
            ||||:||||||||||||||||.|||||||||||||||||||||||||||||||||||||||||||
  Rat   496 DLTSAATDGDEEDILSHSSSQFSAVPSDPAMDLNDGTQASSPISDSSQTTTEGPDSAVTPSDSSE 560

Human   583 IVLDGTDNQYLGLQIGQPQDED-EEATGILPDEASEAFRNSSMALQQAHLLKNMSHCRQPSDSSV 646
            |||||.|:||||:||||||:|| |||.|:|..|.|:.|||||:||||||||:.|.|.||||||||
  Rat   561 IVLDGADSQYLGVQIGQPQEEDEEEAAGVLSGEVSDVFRNSSLALQQAHLLERMGHSRQPSDSSV 625

Human   647 DKFVLRDEATEPGDQENKPCRIKGDIGQSTDDDSAPLVHCVRLLSASFLLTGGKNVLVPDRDVRV 711
            ||||.:||..|.||.|:|||||||||||..||||||||||||||||||||||.|..|||||||||
  Rat   626 DKFVSKDEVAEAGDPESKPCRIKGDIGQPNDDDSAPLVHCVRLLSASFLLTGEKKALVPDRDVRV 690

Human   712 SVKALALSCVGAAVALHPESFFSKLYKVPLDTTEYPEEQYVSDILNYIDHGDPQVRGATAILCGT 776
            |||||||||:||||||||||||||||||||.|.|..|||||||||||||||||||||||||||||
  Rat   691 SVKALALSCIGAAVALHPESFFSKLYKVPLSTMESTEEQYVSDILNYIDHGDPQVRGATAILCGT 755

Human   777 LICSILSRSRFHVGDWMGTIRTLTGNTFSLADCIPLLRKTLKDESSVTCKLACTAVRNCVMSLCS 841
            |:.|||||||..||||:||||.||||||||.||||||:|||||||||||||||||||:||:||||
  Rat   756 LVYSILSRSRLRVGDWLGTIRALTGNTFSLVDCIPLLQKTLKDESSVTCKLACTAVRHCVLSLCS 820

Human   842 SSYSELGLQLIIDVLTLRNSSYWLVRTELLETLAEIDFRLVSFLEAKAENLHRGAHHYTGLLKLQ 906
            ||||:|||||:||:|.|:|||||||||||||||||||||||||||||||:||||||||||.||||
  Rat   821 SSYSDLGLQLLIDMLPLKNSSYWLVRTELLETLAEIDFRLVSFLEAKAESLHRGAHHYTGFLKLQ 885

Human   907 ERVLNNVVIHLLGDEDPRVRHVAAASLIRLVPKLFYKCDQGQADPVVAVARDQSSVYLKLLMHET 971
            |||||||||:||||||||||||||.:|.|||||||||||||||||||||||||||||||||||||
  Rat   886 ERVLNNVVIYLLGDEDPRVRHVAATTLTRLVPKLFYKCDQGQADPVVAVARDQSSVYLKLLMHET 950

Human   972 QPPSHFSVSTITRIYRGYNLLPSITDVTMENNLSRVIAAVSHELITSTTRALTFGCCEALCLLST 1036
            ||||||||||||||||||:||||:||||||||||||:||||||||||||||||||||||||:||.
  Rat   951 QPPSHFSVSTITRIYRGYSLLPSVTDVTMENNLSRVVAAVSHELITSTTRALTFGCCEALCVLSA 1015

Human  1037 AFPVCIWSLGWHCGVPPLSASDESRKSCTVGMATMILTLLSSAWFPLDLSAHQDALILAGNLLAA 1101
            |||||.|||||||||||||||||||||||||||:|||||||||||||||||||||||||||||||
  Rat  1016 AFPVCTWSLGWHCGVPPLSASDESRKSCTVGMASMILTLLSSAWFPLDLSAHQDALILAGNLLAA 1080

Human  1102 SAPKSLRSSWASEEEANPAATKQEEVWPALGDRALVPMVEQLFSHLLKVINICAHVLDDVAPGPA 1166
            |||||||||||||||.:.|||:|||:|||||||.||||||||||||||||||||||||||.||||
  Rat  1081 SAPKSLRSSWASEEEGSSAATRQEEIWPALGDRTLVPMVEQLFSHLLKVINICAHVLDDVTPGPA 1145

Human  1167 IKAALPSLTNPPSLSPIRRKGKEKEPGEQASVPLSPKKGSEASAASRQSDTSGPVTTSKSSSLGS 1231
            |||||||||||||||||||||||||||||.|.|:|||||.|||.||||||||||||.||||||||
  Rat  1146 IKAALPSLTNPPSLSPIRRKGKEKEPGEQTSTPMSPKKGGEASTASRQSDTSGPVTASKSSSLGS 1210

Human  1232 FYHLPSYLKLHDVLKATHANYKVTLDLQNSTEKFGGFLRSALDVLSQILELATLQDIGKCVEEIL 1296
            ||||||||:||||||||||||||||||||||||||||||||||||||||||||||||||||||:|
  Rat  1211 FYHLPSYLRLHDVLKATHANYKVTLDLQNSTEKFGGFLRSALDVLSQILELATLQDIGKCVEEVL 1275

Human  1297 GYLKSCFSREPMMATVCVQQLLKTLFGTNLASQFDGLSSNPSKSQGRAQRLGSSSVRPGLYHYCF 1361
            |||||||||||||||||||||||||||||||||||||||||||||.|||||||||||||||||||
  Rat  1276 GYLKSCFSREPMMATVCVQQLLKTLFGTNLASQFDGLSSNPSKSQCRAQRLGSSSVRPGLYHYCF 1340

Human  1362 MAPYTHFTQALADASLRNMVQAEQENDTSGWFDVLQKVSTQLKTNLTSVTKNRADKNAIHNHIRL 1426
            ||||||||||||||||||||||:||:|.|||||||||||.|||||||||||||||||||||||||
  Rat  1341 MAPYTHFTQALADASLRNMVQADQEHDASGWFDVLQKVSAQLKTNLTSVTKNRADKNAIHNHIRL 1405

Human  1427 FEPLVIKALKQYTTTTCVQLQKQVLDLLAQLVQLRVNYCLLDSDQVFIGFVLKQFEYIEVGQFRE 1491
            ||||||||||||||||.||||||||||||||||||||||||||||||||||||||||||||||||
  Rat  1406 FEPLVIKALKQYTTTTSVQLQKQVLDLLAQLVQLRVNYCLLDSDQVFIGFVLKQFEYIEVGQFRE 1470

Human  1492 SEAIIPNIFFFLVLLSYERYHSKQIIGIPKIIQLCDGIMASGRKAVTHAIPALQPIVHDLFVLRG 1556
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat  1471 SEAIIPNIFFFLVLLSYERYHSKQIIGIPKIIQLCDGIMASGRKAVTHAIPALQPIVHDLFVLRG 1535

Human  1557 TNKADAGKELETQKEVVVSMLLRLIQYHQVLEMFILVLQQCHKENEDKWKRLSRQIADIILPMLA 1621
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||:|||||||||
  Rat  1536 TNKADAGKELETQKEVVVSMLLRLIQYHQVLEMFILVLQQCHKENEDKWKRLSRQVADIILPMLA 1600

Human  1622 KQQMHIDSHEALGVLNTLFEILAPSSLRPVDMLLRSMFVTPNTMASVSTVQLWISGILAILRVLI 1686
            ||||||||||||||||||||||||||||||||||||||:||:|||||||||||||||||||||||
  Rat  1601 KQQMHIDSHEALGVLNTLFEILAPSSLRPVDMLLRSMFITPSTMASVSTVQLWISGILAILRVLI 1665

Human  1687 SQSTEDIVLSRIQELSFSPYLISCTVINRLRDGDSTSTLEEHSEGKQIKNLPEETFSRFLLQLVG 1751
            ||||||||||||||||||||||||.||||||||||..||.|.|||||:|||||:|||||||||||
  Rat  1666 SQSTEDIVLSRIQELSFSPYLISCPVINRLRDGDSNPTLGERSEGKQVKNLPEDTFSRFLLQLVG 1730

Human  1752 ILLEDIVTKQLKVEMSEQQHTFYCQELGTLLMCLIHIFKSGMFRRITAAATRLFRSDGCGGSFYT 1816
            |||||||||||||:||||||||||||||||||||||||||||||||||||||||.||||.|||||
  Rat  1731 ILLEDIVTKQLKVDMSEQQHTFYCQELGTLLMCLIHIFKSGMFRRITAAATRLFTSDGCEGSFYT 1795

Human  1817 LDSLNLRARSMITTHPALVLLWCQILLLVNHTDYRWWAEVQQTPKRHSLSSTKLLSPQMSGEEED 1881
            |||||.|.|:|:.|||||||||||||||:||||:||||||||||||||||.||.|:||:|. |||
  Rat  1796 LDSLNARVRAMVPTHPALVLLWCQILLLINHTDHRWWAEVQQTPKRHSLSCTKSLNPQISA-EED 1859

Human  1882 SDLAAKLGMCNREIVRRGALILFCDYVCQNLHDSEHLTWLIVNHIQDLISLSHEPPVQDFISAVH 1946
            |..||:|||||||||||||||||||||||||||||||||||||||||||||||||||||||||:|
  Rat  1860 SGSAAQLGMCNREIVRRGALILFCDYVCQNLHDSEHLTWLIVNHIQDLISLSHEPPVQDFISAIH 1924

Human  1947 RNSAASGLFIQAIQSRCENLSTPTMLKKTLQCLEGIHLSQSGAVLTLYVDRLLCTPFRVLARMVD 2011
            ||||||||||||||||||||||||.||||||||||||||||||||||||||||.||||.||||||
  Rat  1925 RNSAASGLFIQAIQSRCENLSTPTTLKKTLQCLEGIHLSQSGAVLTLYVDRLLGTPFRALARMVD 1989

Human  2012 ILACRRVEMLLAANLQSSMAQLPMEELNRIQEYLQSSGLAQRHQRLYSLLDRFRLSTMQDSLSPS 2076
            .||||||||||||||||||||||.||||||||:||::||||||||||||||||||||:||||||.
  Rat  1990 TLACRRVEMLLAANLQSSMAQLPEEELNRIQEHLQNTGLAQRHQRLYSLLDRFRLSTVQDSLSPL 2054

Human  2077 PPVSSHPLDGDGHVSLETVSPDKDWYVHLVKSQCWTRSDSALLEGAELVNRIPAEDMNAFMMNSE 2141
            |||:|||||||||.|||||:||||||:.||:||||||||||||||||||||||||||:.|||:||
  Rat  2055 PPVTSHPLDGDGHTSLETVNPDKDWYLQLVRSQCWTRSDSALLEGAELVNRIPAEDMSDFMMSSE 2119

Human  2142 FNLSLLAPCLSLGMSEISGGQKSALFEAAREVTLARVSGTVQQLPAVHHVFQPELPAEPAAYWSK 2206
            |||||||||||||||||:.||||.||||||.|||.||:..||||||||.||||.||.||.|||||
  Rat  2120 FNLSLLAPCLSLGMSEIANGQKSPLFEAARRVTLDRVTNVVQQLPAVHQVFQPFLPTEPTAYWSK 2184

Human  2207 LNDLFGDAALYQSLPTLARALAQYLVVVSKLPSHLHLPPEKEKDIVKFVVATLEALSWHLIHEQI 2271
            |||||||...||||.||||||||||||:||:|:.||||||||...|||||.||||||||||||||
  Rat  2185 LNDLFGDTTSYQSLTTLARALAQYLVVLSKVPAPLHLPPEKEGHTVKFVVMTLEALSWHLIHEQI 2249

Human  2272 PLSLDLQAGLDCCCLALQLPGLWSVVSSTEFVTHACSLIYCVHFILEAVAVQPGEQLLSPERRTN 2336
            ||||||||||||||||||:||||.|:||.|:|||.||||:||.|||||:|||||:|||.||.|::
  Rat  2250 PLSLDLQAGLDCCCLALQVPGLWGVLSSPEYVTHTCSLIHCVRFILEAIAVQPGDQLLGPESRSH 2314

Human  2337 TPKAISEEEEEVDPNTQNPKYITAACEMVAEMVESLQSVLALGHKRNSGVPAFLTPLLRNIIISL 2401
            ||:|:  .:||||.:.||..:||:||||||:|||||||||||||||||.:|:|||.:|:||::||
  Rat  2315 TPRAV--RKEEVDSDIQNLSHITSACEMVADMVESLQSVLALGHKRNSTLPSFLTAVLKNIVVSL 2377

Human  2402 ARLPLVNSYTRVPPLVWKLGWSPKPGGDFGTAFPEIPVEFLQEKEVFKEFIYRINTLGWTSRTQF 2466
            |||||||||||||||||||||||||||||||.||||||||||||||.||||||||||||||||||
  Rat  2378 ARLPLVNSYTRVPPLVWKLGWSPKPGGDFGTVFPEIPVEFLQEKEVLKEFIYRINTLGWTSRTQF 2442

Human  2467 EETWATLLGVLVTQPLVMEQEESPPEEDTERTQINVLAVQAITSLVLSAMTVPVAGNPAVSCLEQ 2531
            ||||||||||||||||||||||||||||||||||:|||||||||||||||.||||||||||||||
  Rat  2443 EETWATLLGVLVTQPLVMEQEESPPEEDTERTQIHVLAVQAITSLVLSAMAVPVAGNPAVSCLEQ 2507

Human  2532 QPRNKPLKALDTRFGRKLSIIRGIVEQEIQAMVSKRENIATHHLYQAWDPVPSLSPATTGALISH 2596
            |||||||||||||||||||:||||||||||.|||:|||.||||.:|||||||||.||||||||||
  Rat  2508 QPRNKPLKALDTRFGRKLSMIRGIVEQEIQEMVSQRENTATHHSHQAWDPVPSLLPATTGALISH 2572

Human  2597 EKLLLQINPERELGSMSYKLGQVSIHSVWLGNSITPLREEEWDEEEEEEADAPAPSSPPTSPVNS 2661
            :|||||||.|||.|:|||||||||||||||||:||||||||||||||||||||||:|||.|||||
  Rat  2573 DKLLLQINSEREPGNMSYKLGQVSIHSVWLGNNITPLREEEWDEEEEEEADAPAPTSPPVSPVNS 2637

Human  2662 RKHRAGVDIHSCSQFLLELYSRWILPSSSARRTPAILISEVVRSLLVVSDLFTERNQFELMYVTL 2726
            ||||||||||||||||||||||||||||:|||||.||||||||||||||||||||.|||:||:||
  Rat  2638 RKHRAGVDIHSCSQFLLELYSRWILPSSAARRTPVILISEVVRSLLVVSDLFTERTQFEMMYLTL 2702

Human  2727 TELRRVHPSEDEILAQYLVPATCKAAAVLGMDKAVAEPVSRLLESTLRSSHLPSRVGALHGVLYV 2791
            ||||||||||||||.||||||||||||||||||.|||||||||||||||:||||::|||||:|||
  Rat  2703 TELRRVHPSEDEILIQYLVPATCKAAAVLGMDKTVAEPVSRLLESTLRSTHLPSQIGALHGILYV 2767

Human  2792 LECDLLDDTAKQLIPVISDYLLSNLKGIAHCVNIHSQQHVLVMCATAFYLIENYPLDVGPEFSAS 2856
            |||||||||.||||||:|||||||||||||||||||||||||||||||||:||||||||||||||
  Rat  2768 LECDLLDDTVKQLIPVVSDYLLSNLKGIAHCVNIHSQQHVLVMCATAFYLMENYPLDVGPEFSAS 2832

Human  2857 IIQMCGVMLSGSEESTPSIIYHCALRGLERLLLSEQLSRLDAESLVKLSVDRVNVHSPHRAMAAL 2921
            :||||||||||||||||||||||||||||||||||||||||.|||||||||||||.|||||||||
  Rat  2833 VIQMCGVMLSGSEESTPSIIYHCALRGLERLLLSEQLSRLDTESLVKLSVDRVNVQSPHRAMAAL 2897

Human  2922 GLMLTCMYTGKEKVSPGRTSDPNPAAPDSESVIVAMERVSVLFDRIRKGFPCEARVVARILPQFL 2986
            |||||||||||||.||||.|||:||.|||||||||||||||||||||||||||||||||||||||
  Rat  2898 GLMLTCMYTGKEKASPGRASDPSPATPDSESVIVAMERVSVLFDRIRKGFPCEARVVARILPQFL 2962

Human  2987 DDFFPPQDIMNKVIGEFLSNQQPYPQFMATVVYKVFQTLHSTGQSSMVRDWVMLSLSNFTQRAPV 3051
            ||||||||:||||||||||||||||||||||||||||||||.||||||||||||||||||||.||
  Rat  2963 DDFFPPQDVMNKVIGEFLSNQQPYPQFMATVVYKVFQTLHSAGQSSMVRDWVMLSLSNFTQRTPV 3027

Human  3052 AMATWSLSCFFVSASTSPWVAAILPHVISRMGKLEQVDVNLFCLVATDFYRHQIEEELDRRAFQS 3116
            |||.||||||.|||||||||:||||||||||||||||||||||||||||||||||||.|||||||
  Rat  3028 AMAMWSLSCFLVSASTSPWVSAILPHVISRMGKLEQVDVNLFCLVATDFYRHQIEEEFDRRAFQS 3092

Human  3117 VLEVVAAPGSPYHRLLTCLRNVHKVTTC 3144
            |.||||||||||||||.||:||||||.|
  Rat  3093 VFEVVAAPGSPYHRLLACLQNVHKVTAC 3120

Known Domains:


GeneSequenceDomainRegion External IDIdentity
HTTNP_002102.4 Sufficient for interaction with TPR. {ECO:0000269|PubMed:15654337} 3..13 10/10 (100%)
CAG repeat region 18..40 8/22 (36%)
HEAT repeat 94..119 CDD:293787 24/25 (96%)
HEAT repeat 133..155 CDD:293787 22/22 (100%)
HEAT repeat 169..197 CDD:293787 28/28 (100%)
HEAT 1 206..243 37/37 (100%)
HEAT repeat 210..240 CDD:293787 30/30 (100%)
HEAT 2 248..285 36/37 (97%)
HEAT repeat 249..278 CDD:293787 28/29 (97%)
HEAT 3 318..362 43/44 (98%)
Interaction with ZDHHC17. {ECO:0000269|PubMed:28757145} 493..504 11/11 (100%)
HEAT 4 804..841 33/37 (89%)
HEAT 5 904..942 34/38 (89%)
DUF3652 1527..1553 CDD:289166 26/26 (100%)
Nuclear export signal. {ECO:0000250} 2397..2406 7/9 (78%)
HttNP_077333.2 HEAT repeat 71..96 CDD:293787 24/25 (96%)
HEAT repeat 110..132 CDD:293787 22/22 (100%)
HEAT repeat 146..174 CDD:293787 28/28 (100%)
HEAT repeat 187..217 CDD:293787 30/30 (100%)
HEAT repeat 226..255 CDD:293787 28/29 (97%)
DUF3652 1506..1532 CDD:289166 26/26 (100%)


Information from Original Tools:


Tool Simple Score Weighted Score Original Tool Information
BLAST Result Score Score Type Cluster ID
Compara 1 0.930 C353247264
eggNOG 1 0.900 E1_28IQ9
HGNC 1 1.500
Hieranoid 1 1.000
Homologene 1 1.000 H1593
Inparanoid 1 1.050 5563 1.000 Inparanoid score I73
OMA 1 1.010
OrthoDB 1 1.010 D1408at9347
OrthoFinder 1 1.000 FOG0005433
OrthoInspector 1 1.000 T2470900
orthoMCL 00.000 Not matched by this tool.
Panther 1 1.100 LDO PTHR10170
Phylome 1 0.910 0.667 Consistency score
TreeFam 1 0.960
1313.370

Return to query results.
Submit another query.