DRSC/TRiP Functional Genomics Resources

powered by:
logo

back to: DIOPT - Ortholog Prediction Tool / DIOPT for Diseases and Traits


Protein Alignment SETD1A and Setd1a

DIOPT Version :9

Sequence 1:NP_055527.1 Gene:SETD1A / 9739 HGNCID:29010 Length:1707 Species:Homo sapiens
Sequence 2:XP_038957149.1 Gene:Setd1a / 309001 RGDID:1311624 Length:1723 Species:Rattus norvegicus


Alignment Length:1730 Identity:1551/1730 - (89%)
Similarity:1594/1730 - (92%) Gaps:30/1730 - (1%)


- Green bases have known domain annotations that are detailed below.


Human     1 MDQEGGGDGQKAPSFQWRNYKLIVDPALDPALRRPSQKVYRYDGVHFSVNDSKYIPVEDLQDPRC 65
            |||||||||||||||||||||||||||||||||||||||||||||||||:||||.||||||||||
  Rat     1 MDQEGGGDGQKAPSFQWRNYKLIVDPALDPALRRPSQKVYRYDGVHFSVSDSKYTPVEDLQDPRC 65

Human    66 HVRSKNRDFSLPVPKFKLDEFYIGQIPLKEVTFARLNDNVRETFLKDMCRKYGEVEEVEILLHPR 130
            |||||.|||||||||||||||||||:|||||||||||||||||||||||||||||||||||||||
  Rat    66 HVRSKTRDFSLPVPKFKLDEFYIGQVPLKEVTFARLNDNVRETFLKDMCRKYGEVEEVEILLHPR 130

Human   131 TRKHLGLARVLFTSTRGAKETVKNLHLTSVMGNIIHAQLDIKGQQRMKYYELIVNGSYTPQTVPT 195
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat   131 TRKHLGLARVLFTSTRGAKETVKNLHLTSVMGNIIHAQLDIKGQQRMKYYELIVNGSYTPQTVPT 195

Human   196 GGKALSEKFQG-SGAATETAESRRRSSSDTAAYPAGTTAVGTPGNGTPCSQDTSFSSSRQDTPSS 259
            ||||||||||| |||.|||.|:|||||||||||.||||..|||||||||||||:|||||||||||
  Rat   196 GGKALSEKFQGSSGATTETTEARRRSSSDTAAYSAGTTVGGTPGNGTPCSQDTNFSSSRQDTPSS 260

Human   260 FGQFTPQSSQGTPYTSRGSTPYSQDSAYSSSTTSTSFKPRRSENSYQDAFSRRHFSASSASTTAS 324
            ||||||||||||||||||||||||||||||||||||||||||||||||:|||||||||||..|.:
  Rat   261 FGQFTPQSSQGTPYTSRGSTPYSQDSAYSSSTTSTSFKPRRSENSYQDSFSRRHFSASSAPATTA 325

Human   325 TAIAATTAAT-ASSSASSSSLSSSSSSSSSSSSSQFRSSDANYPAYYESWNRYQRHTSYPPRRAT 388
            ||.:||.||| ||||:||||.|||||||||||:||||.||::|||||||||||||||||||||||
  Rat   326 TATSATAAATVASSSSSSSSSSSSSSSSSSSSASQFRGSDSSYPAYYESWNRYQRHTSYPPRRAT 390

Human   389 REEPPGAPFAENTAERFPPSYTSYLPPEPSRPTDQDYRPPASEAPPPEPPEPGG----------G 443
            ||:|.||||||||||||||||||||.|||:|.||||||||||||||||||||||          |
  Rat   391 REDPSGAPFAENTAERFPPSYTSYLAPEPNRSTDQDYRPPASEAPPPEPPEPGGGSGGGGGGGSG 455

Human   444 GGGGGPSPEREEVRTSPRPASPARSGSPAPETTNESVPFAQHSSLDSRIEMLLKEQRSKFSFLAS 508
            ||||.|||||||.||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat   456 GGGGAPSPEREEARTSPRPASPARSGSPAPETTNESVPFAQHSSLDSRIEMLLKEQRSKFSFLAS 520

Human   509 DTEEEEENSSMVLGARDTGSEVPSGSGHGPCTPPPAPANFEDVAPTGSGEPGATRESPKANGQNQ 573
            ||||||||||...||||.|.|||||:|||||||||||||||||||||||||||.|||||||||||
  Rat   521 DTEEEEENSSAGPGARDAGGEVPSGAGHGPCTPPPAPANFEDVAPTGSGEPGAARESPKANGQNQ 585

Human   574 ASPCSSGDDMEISDDDRGGSPPPAPTPPQQ-PPPPPPPPPPPPPYLASLPLGYPPHQPAYLLPPR 637
            |||||||:|||||||||||||||||||||| |||||||||||||||||||||||||||||||||.
  Rat   586 ASPCSSGEDMEISDDDRGGSPPPAPTPPQQPPPPPPPPPPPPPPYLASLPLGYPPHQPAYLLPPH 650

Human   638 PDGPPPPEYPPPPPPPPHIYDFVNSLELMDRLGAQWGGMPMSFQMQTQMLTRLHQLRQGKGLIAA 702
            ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||.||
  Rat   651 PDGPPPPEYPPPPPPPPHIYDFVNSLELMDRLGAQWGGMPMSFQMQTQMLTRLHQLRQGKGLTAA 715

Human   703 SAGPPGGAFGEAFLPFPPPQEAAYGLPYALYAQGQEGRGAYSREAYHLPMPMAAEPLPSSSVSGE 767
            |||||||||||||||||||||||||||||||.|||||||||||||||||:|||||||||||||||
  Rat   716 SAGPPGGAFGEAFLPFPPPQEAAYGLPYALYTQGQEGRGAYSREAYHLPLPMAAEPLPSSSVSGE 780

Human   768 EARLPPREEAELAEGKTLPTAGTVGRVLAMLVQEMKSIMQRDLNRKMVENVAFGAFDQWWESKEE 832
            |||||.|||||:||.|.||:|||||||||.|||||||||||||||||||||||||||||||||||
  Rat   781 EARLPHREEAEIAESKALPSAGTVGRVLATLVQEMKSIMQRDLNRKMVENVAFGAFDQWWESKEE 845

Human   833 KAKPFQNAAKQQAKEEDKEKTKLKEPGLLSLVDWAKSGGTTGIEAFAFGSGLRGALRLPSFKVKR 897
            ||||||||||||||||||||.||||||:|||||||||||.|||||||||||||||||||||||||
  Rat   846 KAKPFQNAAKQQAKEEDKEKMKLKEPGMLSLVDWAKSGGITGIEAFAFGSGLRGALRLPSFKVKR 910

Human   898 KEPSEISEASEEKRPRPSTPAEEDEDDPEQEKEAGEPGRPGTKPPKRDEERGKTQGKHRKSFALD 962
            |||||||||||||||||||||||||||||:|||||||||||||||||||||||||||||||||||
  Rat   911 KEPSEISEASEEKRPRPSTPAEEDEDDPEREKEAGEPGRPGTKPPKRDEERGKTQGKHRKSFALD 975

Human   963 SEGEEASQESSSE------KDEEDDEEDEEDEDREEAVDTTKKETEVSDGEDEESDSSSKCSLYA 1021
            |||||||||||||      |||:|||||||||:||||||.||||.|.||||||:.||||:|||||
  Rat   976 SEGEEASQESSSEKFVLFLKDEDDDEEDEEDEEREEAVDATKKEAEASDGEDEDGDSSSQCSLYA 1040

Human  1022 DSDGENDSTSDSESSSSSSSSSSSSSSSSSSSSSSSSESSSEDEEEEERPAALPSASPPPREVPV 1086
            |||||:.|||||||.|||||.||||||||||||.|||       ||||:.|.:|||||||||||.
  Rat  1041 DSDGEDGSTSDSESGSSSSSPSSSSSSSSSSSSESSS-------EEEEQSAVIPSASPPPREVPE 1098

Human  1087 PTPAPVEVPVPERVAGSPVTPLPEQEASPARPAGPTEESPPSAPLRPPEPPAGPPAPAPRPDERP 1151
            |.|||.|.|..:||..|||.||||:|.:..:||||.||.||:.|..|||||||||.|.||.||||
  Rat  1099 PLPAPDEKPETDRVVDSPVMPLPEKETTSTQPAGPAEEPPPNIPQPPPEPPAGPPDPPPRLDERP 1163

Human  1152 SSPIPLLPPPKKRRKTVSFSAIEVVPAPEPPPATPPQAKFPGPASRKAPRGVERTIRNLPLDHAS 1216
            |||||||||||||||||||||.|..|.|||..|:|.|||.|||.|||.||.||||||||||||||
  Rat  1164 SSPIPLLPPPKKRRKTVSFSATEEAPVPEPSTASPLQAKSPGPVSRKVPRVVERTIRNLPLDHAS 1228

Human  1217 LVKSWPEEVSRGGRSRAGGRGRLTEEEEA-EPGTEVDLAVLADLALTPARRGLPALPAVEDSEAT 1280
            |||||||||:||||:|||||.|.|||||| |.|||||||||||||||||||||.|:|..:|||||
  Rat  1229 LVKSWPEEVARGGRNRAGGRVRSTEEEEATESGTEVDLAVLADLALTPARRGLAAIPTGDDSEAT 1293

Human  1281 ETSDEAERPRPLLSHILLEHNYALAVKPTPPAPALRPPEPVPAPAALFSSPADEVLEAPEVVVAE 1345
            |||||||||.|||||||||||||||:||.|..||.||.||.||.|||||||||||||||||||||
  Rat  1294 ETSDEAERPSPLLSHILLEHNYALAIKPPPTTPAPRPLEPAPALAALFSSPADEVLEAPEVVVAE 1358

Human  1346 AEEPKPQQLQQQREEGEEEGEEEGEEEEEESSD---SSSSSDGEGALRRRSLRSHARRRRPPPPP 1407
            |||||....|||..|.|.|.|||.||||.|||:   ||||||.|||:||||||||.||||||.||
  Rat  1359 AEEPKQPLQQQQHPEQEGEDEEEDEEEESESSESSSSSSSSDEEGAIRRRSLRSHTRRRRPPLPP 1423

Human  1408 PPPPPRAYEPRSEFEQMTILYDIWNSGLDSEDMSYLRLTYERLLQQTSGADWLNDTHWVHHTITN 1472
            |||||.::|||||||||||||||||||||.|||||||||||||||||||||||||||||||||||
  Rat  1424 PPPPPPSFEPRSEFEQMTILYDIWNSGLDLEDMSYLRLTYERLLQQTSGADWLNDTHWVHHTITN 1488

Human  1473 LTTPKRKRRPQDGPREHQTGSARSEGYYPISKKEKDKYLDVCPVSARQLEGVDTQGTNRVLSERR 1537
            |:||||||||||||||||||||||||||||||||||||||||||||||.||||||||||||||||
  Rat  1489 LSTPKRKRRPQDGPREHQTGSARSEGYYPISKKEKDKYLDVCPVSARQPEGVDTQGTNRVLSERR 1553

Human  1538 SEQRRLLSAIGTSAIMDSDLLKLNQLKFRKKKLRFGRSRIHEWGLFAMEPIAADEMVIEYVGQNI 1602
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat  1554 SEQRRLLSAIGTSAIMDSDLLKLNQLKFRKKKLRFGRSRIHEWGLFAMEPIAADEMVIEYVGQNI 1618

Human  1603 RQMVADMREKRYVQEGIGSSYLFRVDHDTIIDATKCGNLARFINHCCTPNCYAKVITIESQKKIV 1667
            |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Rat  1619 RQMVADMREKRYVQEGIGSSYLFRVDHDTIIDATKCGNLARFINHCCTPNCYAKVITIESQKKIV 1683

Human  1668 IYSKQPIGVDEEITYDYKFPLEDNKIPCLCGTESCRGSLN 1707
            ||||||||||||||||||||||||||||||||||||||||
  Rat  1684 IYSKQPIGVDEEITYDYKFPLEDNKIPCLCGTESCRGSLN 1723

Known Domains:


Indicated by green bases in alignment.

GeneSequenceDomainRegion External IDIdentity
SETD1ANP_055527.1 RRM_Set1A 92..186 CDD:240992 93/93 (100%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 194..308 106/114 (93%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 331..363 26/32 (81%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 381..486 97/114 (85%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 506..655 139/149 (93%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 834..854 19/19 (100%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 891..1251 292/366 (80%)
DNA_pol3_delta2 <1070..>1130 CDD:331068 36/59 (61%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 1264..1293 22/28 (79%)
HCFC1-binding motif (HBM) 1299..1303 3/3 (100%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 1307..1417 83/112 (74%)
Interaction with CFP1 1415..1450 32/34 (94%)
N-SET 1425..1562 CDD:314603 133/136 (98%)
Interaction with ASH2L, RBBP5 and WDR5. /evidence=ECO:0000269|PubMed:17998332 1450..1537 84/86 (98%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 1472..1499 25/26 (96%)
WDR5 interaction motif (WIN). /evidence=ECO:0000269|PubMed:22266653, ECO:0000269|PubMed:22665483 1492..1497 4/4 (100%)
SET 1568..1691 CDD:214614 122/122 (100%)
PostSET 1691..1707 CDD:214703 15/15 (100%)
Setd1aXP_038957149.1 RRM_Set1A 92..186 CDD:409964 93/93 (100%)
N-SET 1441..1578 CDD:403078 133/136 (98%)
SET_SETD1 1572..1719 CDD:380946 146/146 (100%)


Information from Original Tools:


Tool Simple Score Weighted Score Original Tool Information
BLAST Result Score Score Type Cluster ID
Compara 1 0.930 - - C83694886
Domainoid 1 1.000 2202 1.000 Domainoid score I200
eggNOG 00.000 Not matched by this tool.
HGNC 1 1.500 - -
Hieranoid 1 1.000 - -
Homologene 00.000 Not matched by this tool.
Inparanoid 1 1.050 3100 1.000 Inparanoid score I477
NCBI 1 1.000 - -
OMA 1 1.010 - - QHG43917
OrthoDB 00.000 Not matched by this tool.
OrthoFinder 1 1.000 - - FOG0001603
OrthoInspector 1 1.000 - - oto134660
orthoMCL 1 0.900 - - OOG6_101262
Panther 1 1.100 - - LDO PTHR45814
Phylome 1 0.910 - -
SonicParanoid 1 1.000 - - X1161
SwiftOrtho 1 1.000 - -
TreeFam 00.000 Not matched by this tool.
1414.400

Return to query results.
Submit another query.