DRSC/TRiP Functional Genomics Resources

powered by:
logo

back to: DIOPT - Ortholog Prediction Tool / DIOPT for Diseases and Traits


Protein Alignment NSD1 and Nsd1

DIOPT Version :9

Sequence 1:NP_071900.2 Gene:NSD1 / 64324 HGNCID:14234 Length:2696 Species:Homo sapiens
Sequence 2:XP_006253682.1 Gene:Nsd1 / 306764 RGDID:1307748 Length:2689 Species:Rattus norvegicus


Alignment Length:2702 Identity:2273/2702 - (84%)
Similarity:2412/2702 - (89%) Gaps:19/2702 - (0%)


- Green bases have known domain annotations that are detailed below.


Human     1 MDQTCELPRRNCLLPFSNPVNLDAPEDKDSPFGNGQSNFSEPLNGCTMQLSTVSGTSQNAYGQDS 65
            |||:|||.||||||.|||.|||||||||||||||||||||||||||||||.|.||||||||||||
  Rat     1 MDQSCELSRRNCLLSFSNSVNLDAPEDKDSPFGNGQSNFSEPLNGCTMQLPTASGTSQNAYGQDS 65

Human    66 PSCYIPLRRLQDLASMINVEYLNGSADGSESFQDPEKSDSRAQTPIVCTSLSPGGPTALAMKQEP 130
            ||||||||||||||||||||||:||||||||||||.|||||||:|||||||||||||||||.|||
  Rat    66 PSCYIPLRRLQDLASMINVEYLSGSADGSESFQDPAKSDSRAQSPIVCTSLSPGGPTALAMNQEP 130

Human   131 SCNNSPELQVKVTKTIKNGFLHFENFTCVDDADVDSEMDPEQPVTEDESIEEIFEETQTNATCNY 195
            :|||.||||:.||||.|||||||:|||||||||||||||||||||||||||||||||||||:|||
  Rat   131 TCNNPPELQLSVTKTTKNGFLHFDNFTCVDDADVDSEMDPEQPVTEDESIEEIFEETQTNASCNY 195

Human   196 ETKSENGVKVAMGSEQDSTPESRHGAVKSPFLPLAPQTETQKNKQRNEVDGSNEKAALLPAPFSL 260
            |.||||||::||||||||.||||||||:.||:|||||||.||||||:||||||||.||||||.||
  Rat   196 EPKSENGVEMAMGSEQDSMPESRHGAVEQPFVPLAPQTEKQKNKQRSEVDGSNEKTALLPAPNSL 260

Human   261 GDTNITIEEQLNSINLSFQDDPDSSTSTLGNMLELPGTSSSSTSQELPFCQPKKKSTPLKYEVGD 325
            ||||:|||||.|||||||||||||||||||||||||||||.|||||||||.||||||||||||||
  Rat   261 GDTNVTIEEQFNSINLSFQDDPDSSTSTLGNMLELPGTSSPSTSQELPFCHPKKKSTPLKYEVGD 325

Human   326 LIWAKFKRRPWWPCRICSDPLINTHSKMKVSNRRPYRQYYVEAFGDPSERAWVAGKAIVMFEGRH 390
            ||||||||||||||||||||||||||||||:||||||:|||||||||||:|||||||||||||||
  Rat   326 LIWAKFKRRPWWPCRICSDPLINTHSKMKVANRRPYREYYVEAFGDPSEKAWVAGKAIVMFEGRH 390

Human   391 QFEELPVLRRRGKQKEKGYRHKVPQKILSKWEASVGLAEQYDVPKGSKNRKCIPGSIKLDSEEDM 455
            |||||||||:||||||||||||||||||||||||||||||.|||:|.|.:||:|.|.||||||||
  Rat   391 QFEELPVLRKRGKQKEKGYRHKVPQKILSKWEASVGLAEQCDVPRGPKTQKCVPSSAKLDSEEDM 455

Human   456 PFEDCTNDPESEHDLLLNGCLKSLAFDSEHSADEKEKPCAKSRARKSSDNPKRTSVKKGHIQFEA 520
            |||||.|||:|||||||||||||||||||||||||||||||||.||||||.||||||||.:.|||
  Rat   456 PFEDCANDPDSEHDLLLNGCLKSLAFDSEHSADEKEKPCAKSRVRKSSDNIKRTSVKKGLMPFEA 520

Human   521 HKDERRGKIPENLGLNFISGDISDTQASNELSRIANSLTGSNTAPGSFLFSSCGKNTAKKEFETS 585
            .|:|||||.||||||:|:||.:||.||||||||||||||||:.|||.|||||||:||||.:|||.
  Rat   521 QKEERRGKSPENLGLDFLSGGVSDKQASNELSRIANSLTGSSAAPGQFLFSSCGQNTAKTDFETP 585

Human   586 NGDSLLGLPEGALISKCSREKNKPQRSLVCGSKVKLCYIGAGDEEKRSDSISICTTSDDGSSDLD 650
            |.|||.||.|.|||||.|.||.|.|...||.|||:|||:|||||||||||:|:||||||||||||
  Rat   586 NCDSLSGLSESALISKHSGEKKKLQPGQVCSSKVQLCYVGAGDEEKRSDSVSVCTTSDDGSSDLD 650

Human   651 PIEHSSESDNSVLEIPDAFDRTENMLSMQKNEKIKYSRFAATNTRVKAKQKPLISNSHTDHLMGC 715
            |.||:||...||||:.||.|:|||.|||.||| .||||:.||| |||.|||.||:||||||||..
  Rat   651 PTEHNSEFHKSVLEVTDALDKTENALSMHKNE-TKYSRYPATN-RVKEKQKSLITNSHTDHLMDS 713

Human   716 TKSAEPGT-ETSQVNLSDLKASTLVHKPQSDFTNDALSPKFNLSSSISSENSLIKGGAANQALLH 779
            ||:.|||| |.|||||||||.|:.:.|||.:|.||.|:.|||....|.:||||.|||.|||.||.
  Rat   714 TKTVEPGTAEISQVNLSDLKISSPIPKPQPEFRNDGLTTKFNAPPGIRNENSLTKGGLANQTLLP 778

Human   780 SKSKQPKFRSIKCKHKENPVMAEPPVINEECSLKCCSSDTKGSPLASISKSGKVDGLKLLNNMHE 844
            .|.:|||||||||||||:|..||....:|:.|||||||||.|||:.|||||||.:||||||||||
  Rat   779 LKCRQPKFRSIKCKHKESPTAAETSATSEDLSLKCCSSDTNGSPMTSISKSGKGEGLKLLNNMHE 843

Human   845 KTRDSSDIETAVVKHVLSELKELSYRSLGEDVSDSGTSKPSKPLLFSSASSQNHIPIEPDYKFST 909
            ||||||||||||||||||||||||||||.||||||||||.|||||||||||||||||||||||||
  Rat   844 KTRDSSDIETAVVKHVLSELKELSYRSLSEDVSDSGTSKSSKPLLFSSASSQNHIPIEPDYKFST 908

Human   910 LLMMLKDMHDSKTKEQRLMTAQNLVSYRSPGRGDCSTNSPVGVSKVLVSGGSTHNSEKKGDGTQN 974
            |||||||||||||||||||||||:.|||:|.|||||:.||||.|||||.|||||||||.||.||:
  Rat   909 LLMMLKDMHDSKTKEQRLMTAQNVASYRTPDRGDCSSGSPVGTSKVLVLGGSTHNSEKPGDSTQD 973

Human   975 SANPSPSGGDSALSGELSASLPGLLSDKRDLPASGKSRSDCVTRRNCGRSKPSSKLRDAFSAQMV 1039
            |...||.|||||||||||:||..|.||||||||.||.||:|:.||||||:|.|.|||...|.||.
  Rat   974 SVRLSPGGGDSALSGELSSSLSVLPSDKRDLPACGKIRSNCIPRRNCGRAKLSPKLRVTISTQMA 1038

Human  1040 KNTVNRKALKTERKRKLNQLPSVTLDAVLQGDRERGGS----LRGGAEDPSKEDPLQIMGHLTSE 1100
            |.:||.|||||||||||::||:|||.|...|::|.|||    |:|||:||:||:|||.|..|.:|
  Rat  1039 KPSVNPKALKTERKRKLSRLPAVTLAANGLGNKESGGSVNGPLKGGAQDPAKEEPLQQMDLLRNE 1103

Human  1101 DGDHFSDVHFDSKVKQSDPGKISEKGLSFENGKGPELDSVMNSENDELNGVNQVVPKKRWQRLNQ 1165
                  :.|||||||||||.||.||..||||.||||:.|.:|.||||.:||:|||||||||||||
  Rat  1104 ------ETHFDSKVKQSDPDKILEKEPSFENRKGPEVGSEINIENDEPHGVDQVVPKKRWQRLNQ 1162

Human  1166 RRTKPRKRMNRFKEKENSECAFRVLLPSDPVQEGRDEFPEHRTPSASILEEPLTEQNHADCLDSA 1230
            ||.||.||.:||:||||||.||.||||.||||:|||::.|.|.|..||||:...:.||....:|.
  Rat  1163 RRPKPGKRASRFREKENSEGAFGVLLPGDPVQKGRDDYLEQRAPPTSILEDSAADPNHVSHSESV 1227

Human  1231 GPRLNVCDKSSASIGDMEKEPGIPSLTPQAELPEPAVRSEKKRLRKPSKWLLEYTEEYDQIFAPK 1295
            |||||||||||.|:||:|||.||||||||.::|||||||||||||||||||||||||||||||||
  Rat  1228 GPRLNVCDKSSVSMGDLEKETGIPSLTPQTKIPEPAVRSEKKRLRKPSKWLLEYTEEYDQIFAPK 1292

Human  1296 KKQKKVQEQVHKVSSRCEEESLLARGRSSAQNKQVDENSLISTKEEPPVLEREAPFLEGPLAQSE 1360
            ||||||||||||||||||:||||||.|||||||||||||||||||||||||||||||||||.||:
  Rat  1293 KKQKKVQEQVHKVSSRCEDESLLARCRSSAQNKQVDENSLISTKEEPPVLEREAPFLEGPLVQSD 1357

Human  1361 LGGGHAELPQLTLSVPVAPEVSPRPALESEELLVKTPGNYESKRQRKPTKKLLESNDLDPGFMPK 1425
            ||..|||||||||||||||||||||.|||||||||||||||.|||||||||||||||||||||||
  Rat  1358 LGVAHAELPQLTLSVPVAPEVSPRPTLESEELLVKTPGNYEGKRQRKPTKKLLESNDLDPGFMPK 1422

Human  1426 KGDLGLSKKCYEAGHLENGITESCATSYSKDFGGGTTKIFDKPRKRKRQRHAAAKMQCKKVKNDD 1490
            |||||||:||.|:||||||:.:|.||.:.|:||||||:|||||||||||||..|::..|:||.:|
  Rat  1423 KGDLGLSRKCCESGHLENGVGDSRATPHLKEFGGGTTRIFDKPRKRKRQRHGTARVHYKRVKKED 1487

Human  1491 SSKEIPGS-EGELMPHRTATSPKETVEEGVEHDPGMPASKKMQGERGGGAALKENVCQNCEKLGE 1554
            |::|.|.| |||||.||||.||||.:|||:||||||.|||::|||||||||||||||||||||||
  Rat  1488 SARETPSSAEGELMIHRTAASPKEILEEGIEHDPGMSASKRLQGERGGGAALKENVCQNCEKLGE 1552

Human  1555 LLLCEAQCCGAFHLECLGLTEMPRGKFICNECRTGIHTCFVCKQSGEDVKRCLLPLCGKFYHEEC 1619
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat  1553 LLLCEAQCCGAFHLECLGLTEMPRGKFICNECRTGIHTCFVCKQSGEDVKRCLLPLCGKFYHEEC 1617

Human  1620 VQKYPPTVMQNKGFRCSLHICITCHAANPANVSASKGRLMRCVRCPVAYHANDFCLAAGSKILAS 1684
            ||||||||:|||||||.||||||||||||||||||||||||||||||||||||||||||||||||
  Rat  1618 VQKYPPTVVQNKGFRCPLHICITCHAANPANVSASKGRLMRCVRCPVAYHANDFCLAAGSKILAS 1682

Human  1685 NSIICPNHFTPRRGCRNHEHVNVSWCFVCSEGGSLLCCDSCPAAFHRECLNIDIPEGNWYCNDCK 1749
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat  1683 NSIICPNHFTPRRGCRNHEHVNVSWCFVCSEGGSLLCCDSCPAAFHRECLNIDIPEGNWYCNDCK 1747

Human  1750 AGKKPHYREIVWVKVGRYRWWPAEICHPRAVPSNIDKMRHDVGEFPVLFFGSNDYLWTHQARVFP 1814
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat  1748 AGKKPHYREIVWVKVGRYRWWPAEICHPRAVPSNIDKMRHDVGEFPVLFFGSNDYLWTHQARVFP 1812

Human  1815 YMEGDVSSKDKMGKGVDGTYKKALQEAAARFEELKAQKELRQLQEDRKNDKKPPPYKHIKVNRPI 1879
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat  1813 YMEGDVSSKDKMGKGVDGTYKKALQEAAARFEELKAQKELRQLQEDRKNDKKPPPYKHIKVNRPI 1877

Human  1880 GRVQIFTADLSEIPRCNCKATDENPCGIDSECINRMLLYECHPTVCPAGGRCQNQCFSKRQYPEV 1944
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||:|
  Rat  1878 GRVQIFTADLSEIPRCNCKATDENPCGIDSECINRMLLYECHPTVCPAGGRCQNQCFSKRQYPDV 1942

Human  1945 EIFRTLQRGWGLRTKTDIKKGEFVNEYVGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIIDA 2009
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat  1943 EIFRTLQRGWGLRTKTDIKKGEFVNEYVGELIDEEECRARIRYAQEHDITNFYMLTLDKDRIIDA 2007

Human  2010 GPKGNYARFMNHCCQPNCETQKWSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKTVCKCGA 2074
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat  2008 GPKGNYARFMNHCCQPNCETQKWSVNGDTRVGLFALSDIKAGTELTFNYNLECLGNGKTVCKCGA 2072

Human  2075 PNCSGFLGVRPKNQPIATEEKSKKFKKKQQGKRRTQGEITKEREDECFSCGDAGQLVSCKKPGCP 2139
            ||||||||||||||||.|||||:|||:|..||||:|||:|||||||||||||.||||||||||||
  Rat  2073 PNCSGFLGVRPKNQPIVTEEKSRKFKRKPHGKRRSQGEVTKEREDECFSCGDGGQLVSCKKPGCP 2137

Human  2140 KVYHADCLNLTKRPAGKWECPWHQCDICGKEAASFCEMCPSSFCKQHREGMLFISKLDGRLSCTE 2204
            ||||||||||||||||||||||||||:||||||||||||||||||||||||||||||||||||||
  Rat  2138 KVYHADCLNLTKRPAGKWECPWHQCDVCGKEAASFCEMCPSSFCKQHREGMLFISKLDGRLSCTE 2202

Human  2205 HDPCGPNPLEPGEIREYVPPPVPLPPGPSTHLAEQSTGMAAQAPKMSDKPPADTNQMLSLSKKAL 2269
            ||||||||||||||||||||...|.|.|.|...|||:.|..|.||.||:||.|..|||||||||:
  Rat  2203 HDPCGPNPLEPGEIREYVPPTATLSPSPGTQQTEQSSEMGTQGPKKSDQPPTDATQMLSLSKKAV 2267

Human  2270 AGTCQRPLLPERPLERTDSRPQPLDKVRDLAGSGTKSQSLVSSQRPLDRPPAVAGPRPQLSDKPS 2334
            .||||||||||||.|||||....||::|||||||||||||||||||.|||||..|||||..|:.|
  Rat  2268 TGTCQRPLLPERPPERTDSSSHLLDRIRDLAGSGTKSQSLVSSQRPQDRPPAKEGPRPQPPDRAS 2332

Human  2335 PVTSPSSSPSVRSQPLERPLGTADPRLDKSIGAASPRPQSLEKTSVPTGLRLPPPDRLLITSSPK 2399
            |||.|||||||.|.||||||...:||||||||||||:.|::||...||||||..|||||.|:|||
  Rat  2333 PVTRPSSSPSVSSLPLERPLRMTEPRLDKSIGAASPKSQAVEKPPAPTGLRLSSPDRLLNTNSPK 2397

Human  2400 PQTSDRPTDKPHASLSQRLPPPEKVLSAVVQTLVAKEKALRPVDQNTQSKNRAALVMDLIDLTPR 2464
            ||.||||.||.||||:|||||||||||||||:||||||||||||||||:|:|||:||||||||||
  Rat  2398 PQISDRPPDKSHASLTQRLPPPEKVLSAVVQSLVAKEKALRPVDQNTQAKHRAAVVMDLIDLTPR 2462

Human  2465 QKERAASPHQVTPQADEKMPVLESSSWPASKGLGHMPRAVEKGCVSDPLQTSGKAAAPSEDPWQA 2529
            ||||||||.:||.|||||.|||||||.|.|:||||:|||||||.||||||..||:|||||.||||
  Rat  2463 QKERAASPQEVTAQADEKTPVLESSSRPTSRGLGHVPRAVEKGGVSDPLQPPGKSAAPSEHPWQA 2527

Human  2530 VKSLTQARLLSQPPAKAFLYEPTTQASGRASAGAEQTPGPLSQSPGLVKQAKQMVGGQQLPALAA 2594
            |||||.||.||.|.|||||||...||||||..|:||||||.|.:|||:||.||:..|     |.|
  Rat  2528 VKSLTHARFLSPPSAKAFLYESAIQASGRAPVGSEQTPGPPSPAPGLLKQVKQLSRG-----LTA 2587

Human  2595 KSGQSFRSLGKAPASLPTEEKKLVTTEQSPWALGKASSRAGLWPIVAGQTLAQSCWSAGSTQTLA 2659
            |||||||||||..||||.|||||.|||||||.|||||..||||||||||||||:|||:|.|||||
  Rat  2588 KSGQSFRSLGKISASLPNEEKKLTTTEQSPWGLGKASPGAGLWPIVAGQTLAQACWSSGGTQTLA 2652

Human  2660 QTCWSLGRGQDPKPEQNTLPALNQAPSSHKCAESEQK 2696
            |.|||||||||||||||.:.||||||||.||||||||
  Rat  2653 QNCWSLGRGQDPKPEQNAIQALNQAPSSRKCAESEQK 2689

Known Domains:


Indicated by green bases in alignment.

Software error:

Illegal division by zero at /www/www.flyrnai.org/docroot/cgi-bin/DRSC_prot_align.pl line 591.

For help, please send mail to the webmaster (ritg@hms.harvard.edu), giving this error message and the time and date of the error.

GeneSequenceDomainRegion External IDIdentity
NSD1NP_071900.2 Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 207..252 38/44 (86%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 281..311 28/29 (97%)
MSH6_like 319..429 CDD:99898 105/109 (96%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 487..514 24/26 (92%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 872..891 16/18 (89%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 936..1035 71/98 (72%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 1067..1093 15/29 (52%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 1112..1134 16/21 (76%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 1243..1272 22/28 (79%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 1294..1344 47/49 (96%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 1382..1428 43/45 (96%)
ING <1431..1587 CDD:331088 122/156 (78%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 1480..1534 34/54 (63%)
PHD1_NSD1_2 1545..1587 CDD:277118 41/41 (100%)
PHD2_NSD1 1592..1638 CDD:277120 43/45 (96%)
PHD3_NSD1 1639..1692 CDD:277123 52/52 (100%)
PHD4_NSD1 1709..1748 CDD:277126 38/38 (100%)
WHSC1_related 1754..1848 CDD:99899 93/93 (100%)
AWS 1891..1941 CDD:197795 49/49 (100%)
SET 1942..2065 CDD:214614 121/122 (99%)
S-adenosyl-L-methionine binding 1952..1954 1/1 (100%)
S-adenosyl-L-methionine binding 1994..1997 2/2 (100%)