DRSC/TRiP Functional Genomics Resources

powered by:
logo

back to: DIOPT - Ortholog Prediction Tool / DIOPT for Diseases and Traits


Protein Alignment SETD1A and Setd1a

DIOPT Version :10

Sequence 1:NP_055527.1 Gene:SETD1A / 9739 HGNCID:29010 Length:1707 Species:Homo sapiens
Sequence 2:NP_001414023.1 Gene:Setd1a / 309001 RGDID:1311624 Length:1717 Species:Rattus norvegicus


Alignment Length:1724 Identity:1551/1724 - (89%)
Similarity:1594/1724 - (92%) Gaps:24/1724 - (1%)


- Green bases have known domain annotations that are detailed below.


Human     1 MDQEGGGDGQKAPSFQWRNYKLIVDPALDPALRRPSQKVYRYDGVHFSVNDSKYIPVEDLQDPRC 65
            |||||||||||||||||||||||||||||||||||||||||||||||||:||||.||||||||||
  Rat     1 MDQEGGGDGQKAPSFQWRNYKLIVDPALDPALRRPSQKVYRYDGVHFSVSDSKYTPVEDLQDPRC 65

Human    66 HVRSKNRDFSLPVPKFKLDEFYIGQIPLKEVTFARLNDNVRETFLKDMCRKYGEVEEVEILLHPR 130
            |||||.|||||||||||||||||||:|||||||||||||||||||||||||||||||||||||||
  Rat    66 HVRSKTRDFSLPVPKFKLDEFYIGQVPLKEVTFARLNDNVRETFLKDMCRKYGEVEEVEILLHPR 130

Human   131 TRKHLGLARVLFTSTRGAKETVKNLHLTSVMGNIIHAQLDIKGQQRMKYYELIVNGSYTPQTVPT 195
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat   131 TRKHLGLARVLFTSTRGAKETVKNLHLTSVMGNIIHAQLDIKGQQRMKYYELIVNGSYTPQTVPT 195

Human   196 GGKALSEKFQG-SGAATETAESRRRSSSDTAAYPAGTTAVGTPGNGTPCSQDTSFSSSRQDTPSS 259
            ||||||||||| |||.|||.|:|||||||||||.||||..|||||||||||||:|||||||||||
  Rat   196 GGKALSEKFQGSSGATTETTEARRRSSSDTAAYSAGTTVGGTPGNGTPCSQDTNFSSSRQDTPSS 260

Human   260 FGQFTPQSSQGTPYTSRGSTPYSQDSAYSSSTTSTSFKPRRSENSYQDAFSRRHFSASSASTTAS 324
            ||||||||||||||||||||||||||||||||||||||||||||||||:|||||||||||..|.:
  Rat   261 FGQFTPQSSQGTPYTSRGSTPYSQDSAYSSSTTSTSFKPRRSENSYQDSFSRRHFSASSAPATTA 325

Human   325 TAIAATTAAT-ASSSASSSSLSSSSSSSSSSSSSQFRSSDANYPAYYESWNRYQRHTSYPPRRAT 388
            ||.:||.||| ||||:||||.|||||||||||:||||.||::|||||||||||||||||||||||
  Rat   326 TATSATAAATVASSSSSSSSSSSSSSSSSSSSASQFRGSDSSYPAYYESWNRYQRHTSYPPRRAT 390

Human   389 REEPPGAPFAENTAERFPPSYTSYLPPEPSRPTDQDYRPPASEAPPPEPPEPGG----------G 443
            ||:|.||||||||||||||||||||.|||:|.||||||||||||||||||||||          |
  Rat   391 REDPSGAPFAENTAERFPPSYTSYLAPEPNRSTDQDYRPPASEAPPPEPPEPGGGSGGGGGGGSG 455

Human   444 GGGGGPSPEREEVRTSPRPASPARSGSPAPETTNESVPFAQHSSLDSRIEMLLKEQRSKFSFLAS 508
            ||||.|||||||.||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat   456 GGGGAPSPEREEARTSPRPASPARSGSPAPETTNESVPFAQHSSLDSRIEMLLKEQRSKFSFLAS 520

Human   509 DTEEEEENSSMVLGARDTGSEVPSGSGHGPCTPPPAPANFEDVAPTGSGEPGATRESPKANGQNQ 573
            ||||||||||...||||.|.|||||:|||||||||||||||||||||||||||.|||||||||||
  Rat   521 DTEEEEENSSAGPGARDAGGEVPSGAGHGPCTPPPAPANFEDVAPTGSGEPGAARESPKANGQNQ 585

Human   574 ASPCSSGDDMEISDDDRGGSPPPAPTPPQQ-PPPPPPPPPPPPPYLASLPLGYPPHQPAYLLPPR 637
            |||||||:|||||||||||||||||||||| |||||||||||||||||||||||||||||||||.
  Rat   586 ASPCSSGEDMEISDDDRGGSPPPAPTPPQQPPPPPPPPPPPPPPYLASLPLGYPPHQPAYLLPPH 650

Human   638 PDGPPPPEYPPPPPPPPHIYDFVNSLELMDRLGAQWGGMPMSFQMQTQMLTRLHQLRQGKGLIAA 702
            ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||.||
  Rat   651 PDGPPPPEYPPPPPPPPHIYDFVNSLELMDRLGAQWGGMPMSFQMQTQMLTRLHQLRQGKGLTAA 715

Human   703 SAGPPGGAFGEAFLPFPPPQEAAYGLPYALYAQGQEGRGAYSREAYHLPMPMAAEPLPSSSVSGE 767
            |||||||||||||||||||||||||||||||.|||||||||||||||||:|||||||||||||||
  Rat   716 SAGPPGGAFGEAFLPFPPPQEAAYGLPYALYTQGQEGRGAYSREAYHLPLPMAAEPLPSSSVSGE 780

Human   768 EARLPPREEAELAEGKTLPTAGTVGRVLAMLVQEMKSIMQRDLNRKMVENVAFGAFDQWWESKEE 832
            |||||.|||||:||.|.||:|||||||||.|||||||||||||||||||||||||||||||||||
  Rat   781 EARLPHREEAEIAESKALPSAGTVGRVLATLVQEMKSIMQRDLNRKMVENVAFGAFDQWWESKEE 845

Human   833 KAKPFQNAAKQQAKEEDKEKTKLKEPGLLSLVDWAKSGGTTGIEAFAFGSGLRGALRLPSFKVKR 897
            ||||||||||||||||||||.||||||:|||||||||||.|||||||||||||||||||||||||
  Rat   846 KAKPFQNAAKQQAKEEDKEKMKLKEPGMLSLVDWAKSGGITGIEAFAFGSGLRGALRLPSFKVKR 910

Human   898 KEPSEISEASEEKRPRPSTPAEEDEDDPEQEKEAGEPGRPGTKPPKRDEERGKTQGKHRKSFALD 962
            |||||||||||||||||||||||||||||:|||||||||||||||||||||||||||||||||||
  Rat   911 KEPSEISEASEEKRPRPSTPAEEDEDDPEREKEAGEPGRPGTKPPKRDEERGKTQGKHRKSFALD 975

Human   963 SEGEEASQESSSEKDEEDDEEDEEDEDREEAVDTTKKETEVSDGEDEESDSSSKCSLYADSDGEN 1027
            ||||||||||||||||:|||||||||:||||||.||||.|.||||||:.||||:||||||||||:
  Rat   976 SEGEEASQESSSEKDEDDDEEDEEDEEREEAVDATKKEAEASDGEDEDGDSSSQCSLYADSDGED 1040

Human  1028 DSTSDSESSSSSSSSSSSSSSSSSSSSSSSSESSSEDEEEEERPAALPSASPPPREVPVPTPAPV 1092
            .|||||||.|||||.||||||||||||.|||       ||||:.|.:|||||||||||.|.|||.
  Rat  1041 GSTSDSESGSSSSSPSSSSSSSSSSSSESSS-------EEEEQSAVIPSASPPPREVPEPLPAPD 1098

Human  1093 EVPVPERVAGSPVTPLPEQEASPARPAGPTEESPPSAPLRPPEPPAGPPAPAPRPDERPSSPIPL 1157
            |.|..:||..|||.||||:|.:..:||||.||.||:.|..|||||||||.|.||.||||||||||
  Rat  1099 EKPETDRVVDSPVMPLPEKETTSTQPAGPAEEPPPNIPQPPPEPPAGPPDPPPRLDERPSSPIPL 1163

Human  1158 LPPPKKRRKTVSFSAIEVVPAPEPPPATPPQAKFPGPASRKAPRGVERTIRNLPLDHASLVKSWP 1222
            |||||||||||||||.|..|.|||..|:|.|||.|||.|||.||.||||||||||||||||||||
  Rat  1164 LPPPKKRRKTVSFSATEEAPVPEPSTASPLQAKSPGPVSRKVPRVVERTIRNLPLDHASLVKSWP 1228

Human  1223 EEVSRGGRSRAGGRGRLTEEEEA-EPGTEVDLAVLADLALTPARRGLPALPAVEDSEATETSDEA 1286
            |||:||||:|||||.|.|||||| |.|||||||||||||||||||||.|:|..:|||||||||||
  Rat  1229 EEVARGGRNRAGGRVRSTEEEEATESGTEVDLAVLADLALTPARRGLAAIPTGDDSEATETSDEA 1293

Human  1287 ERPRPLLSHILLEHNYALAVKPTPPAPALRPPEPVPAPAALFSSPADEVLEAPEVVVAEAEEPKP 1351
            |||.|||||||||||||||:||.|..||.||.||.||.||||||||||||||||||||||||||.
  Rat  1294 ERPSPLLSHILLEHNYALAIKPPPTTPAPRPLEPAPALAALFSSPADEVLEAPEVVVAEAEEPKQ 1358

Human  1352 QQLQQQREEGEEEGEEEGEEEEEESSD---SSSSSDGEGALRRRSLRSHARRRRPPPPPPPPPPR 1413
            ...|||..|.|.|.|||.||||.|||:   ||||||.|||:||||||||.||||||.|||||||.
  Rat  1359 PLQQQQHPEQEGEDEEEDEEEESESSESSSSSSSSDEEGAIRRRSLRSHTRRRRPPLPPPPPPPP 1423

Human  1414 AYEPRSEFEQMTILYDIWNSGLDSEDMSYLRLTYERLLQQTSGADWLNDTHWVHHTITNLTTPKR 1478
            ::|||||||||||||||||||||.||||||||||||||||||||||||||||||||||||:||||
  Rat  1424 SFEPRSEFEQMTILYDIWNSGLDLEDMSYLRLTYERLLQQTSGADWLNDTHWVHHTITNLSTPKR 1488

Human  1479 KRRPQDGPREHQTGSARSEGYYPISKKEKDKYLDVCPVSARQLEGVDTQGTNRVLSERRSEQRRL 1543
            ||||||||||||||||||||||||||||||||||||||||||.||||||||||||||||||||||
  Rat  1489 KRRPQDGPREHQTGSARSEGYYPISKKEKDKYLDVCPVSARQPEGVDTQGTNRVLSERRSEQRRL 1553

Human  1544 LSAIGTSAIMDSDLLKLNQLKFRKKKLRFGRSRIHEWGLFAMEPIAADEMVIEYVGQNIRQMVAD 1608
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat  1554 LSAIGTSAIMDSDLLKLNQLKFRKKKLRFGRSRIHEWGLFAMEPIAADEMVIEYVGQNIRQMVAD 1618

Human  1609 MREKRYVQEGIGSSYLFRVDHDTIIDATKCGNLARFINHCCTPNCYAKVITIESQKKIVIYSKQP 1673
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat  1619 MREKRYVQEGIGSSYLFRVDHDTIIDATKCGNLARFINHCCTPNCYAKVITIESQKKIVIYSKQP 1683

Human  1674 IGVDEEITYDYKFPLEDNKIPCLCGTESCRGSLN 1707
            ||||||||||||||||||||||||||||||||||
  Rat  1684 IGVDEEITYDYKFPLEDNKIPCLCGTESCRGSLN 1717

Known Domains:


Indicated by green bases in alignment.

GeneSequenceDomainRegion External IDIdentity
SETD1ANP_055527.1 Interaction with WDR82. /evidence=ECO:0000269|PubMed:37030068 60..89 27/28 (96%)
RRM_Set1A 92..186 CDD:409964 93/93 (100%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 194..308 106/114 (93%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 331..363 26/32 (81%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 381..486 97/114 (85%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 506..655 139/149 (93%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 834..854 19/19 (100%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 891..1251 292/360 (81%)
PRK12323 <1070..>1130 CDD:481241 36/59 (61%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 1264..1293 22/28 (79%)
HCFC1-binding motif (HBM) 1299..1303 3/3 (100%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 1307..1417 83/112 (74%)
Interaction with CFP1 1415..1450 32/34 (94%)
N-SET 1425..1562 CDD:463344 133/136 (98%)
Interaction with ASH2L, RBBP5 and WDR5. /evidence=ECO:0000269|PubMed:17998332 1450..1537 84/86 (98%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 1472..1499 25/26 (96%)
WDR5 interaction motif (WIN). /evidence=ECO:0000269|PubMed:22266653, ECO:0000269|PubMed:22665483 1492..1497 4/4 (100%)
RxxxRR motif. /evidence=ECO:0000250|UniProtKB:P38827 1537..1542 4/4 (100%)
SET_SETD1 1556..1703 CDD:380946 146/146 (100%)
Setd1aNP_001414023.1 None

Return to query results.
Submit another query.