DRSC/TRiP Functional Genomics Resources

powered by:
logo

back to: DIOPT - Ortholog Prediction Tool / DIOPT for Diseases and Traits


Protein Alignment RpII215 and Polr2a

DIOPT Version :9

Sequence 1:NP_511124.1 Gene:RpII215 / 32100 FlyBaseID:FBgn0003277 Length:1887 Species:Drosophila melanogaster
Sequence 2:NP_001277997.1 Gene:Polr2a / 20020 MGIID:98086 Length:1970 Species:Mus musculus


Alignment Length:1926 Identity:1404/1926 - (72%)
Similarity:1640/1926 - (85%) Gaps:54/1926 - (2%)


- Green bases have known domain annotations that are detailed below.


  Fly     6 DSKAPLRQVKRVQFGILSPDEIRRMSVTEGGVQFAETMEGGRPKLGGLMDPRQGVIDRTSRCQTC 70
            ||..|||.:||||||:|||||::||||||||:::.||.||||||||||||||||||:||.|||||
Mouse    10 DSACPLRTIKRVQFGVLSPDELKRMSVTEGGIKYPETTEGGRPKLGGLMDPRQGVIERTGRCQTC 74

  Fly    71 AGNMTECPGHFGHIDLAKPVFHIGFITKTIKILRCVCFYCSKMLVSPHNPKIKEIVMKSRGQPRK 135
            ||||||||||||||:|||||||:||:.||:|:||||||:|||:||..:|||||:|:.||:|||:|
Mouse    75 AGNMTECPGHFGHIELAKPVFHVGFLVKTMKVLRCVCFFCSKLLVDSNNPKIKDILAKSKGQPKK 139

  Fly   136 RLAYVYDLCKGKTICEGGEDMDLTKENQQP----DPNKKPGHGGCGHYQPSIRRTGLDLTAEWKH 196
            ||.:||||||||.||||||:||.....:||    |..|:.||||||.|||.|||:||:|.|||||
Mouse   140 RLTHVYDLCKGKNICEGGEEMDNKFGVEQPEGDEDLTKEKGHGGCGRYQPRIRRSGLELYAEWKH 204

  Fly   197 QNEDSQEKKIVVSAERVWEILKHITDEECFILGMDPKYARPDWMIVTVLPVPPLAVRPAVVMFGA 261
            .|||||||||::|.|||.||.|.|:|||||:|||:|:||||:||||||||||||:|||||||.|:
Mouse   205 VNEDSQEKKILLSPERVHEIFKRISDEECFVLGMEPRYARPEWMIVTVLPVPPLSVRPAVVMQGS 269

  Fly   262 AKNQDDLTHKLSDIIKANNELRKNEASGAAAHVIQENIKMLQFHVATLVDNDMPGMPRAMQKSGK 326
            |:|||||||||:||:|.||:||:||.:|||||||.|::|:|||||||:|||::||:||||||||:
Mouse   270 ARNQDDLTHKLADIVKINNQLRRNEQNGAAAHVIAEDVKLLQFHVATMVDNELPGLPRAMQKSGR 334

  Fly   327 PLKAIKARLKGKEGRIRGNLMGKRVDFSARTVITPDPNLRIDQVGVPRSIAQNLTFPELVTPFNI 391
            |||::|.||||||||:|||||||||||||||||||||||.|||||||||||.|:||.|:||||||
Mouse   335 PLKSLKQRLKGKEGRVRGNLMGKRVDFSARTVITPDPNLSIDQVGVPRSIAANMTFAEIVTPFNI 399

  Fly   392 DRMQELVRRGNSQYPGAKYIVRDNGERIDLRFHPKSSDLHLQCGYKVERHLRDDDLVIFNRQPTL 456
            ||:|||||||||||||||||:||||:|||||||||.||||||.|||||||:.|.|:|||||||||
Mouse   400 DRLQELVRRGNSQYPGAKYIIRDNGDRIDLRFHPKPSDLHLQTGYKVERHMCDGDIVIFNRQPTL 464

  Fly   457 HKMSMMGHRVKVLPWSTFRMNLSCTSPYNADFDGDEMNLHVPQSMETRAEVENIHITPRQIITPQ 521
            ||||||||||::|||||||:|||.|:||||||||||||||:|||:|||||::.:.:.||.|:|||
Mouse   465 HKMSMMGHRVRILPWSTFRLNLSVTTPYNADFDGDEMNLHLPQSLETRAEIQELAMVPRMIVTPQ 529

  Fly   522 ANKPVMGIVQDTLTAVRKMTKRDVFITREQVMNLLMFLPTWDAKMPQPCILKPRPLWTGKQIFSL 586
            :|:|||||||||||||||.||||||:.|.:||||||||.|||.|:|||.||||||||||||||||
Mouse   530 SNRPVMGIVQDTLTAVRKFTKRDVFLERGEVMNLLMFLSTWDGKVPQPAILKPRPLWTGKQIFSL 594

  Fly   587 IIPGNVNMIRTHSTHPDEEDEGPYKWISPGDTKVMVEHGELIMGILCKKSLGTSAGSLLHICFLE 651
            ||||::|.|||||||||:||.||||.||||||||:||:||||||||||||||||||||:||.:||
Mouse   595 IIPGHINCIRTHSTHPDDEDSGPYKHISPGDTKVVVENGELIMGILCKKSLGTSAGSLVHISYLE 659

  Fly   652 LGHDIAGRFYGNIQTVINNWLLFEGHSIGIGDTIADPQTYNEIQQAIKKAKDDVINVIQKAHNME 716
            :||||...||.|||||||||||.|||:|||||:|||.:||.:||..|||||.|||.||:||||.|
Mouse   660 MGHDITRLFYSNIQTVINNWLLIEGHTIGIGDSIADSKTYQDIQNTIKKAKQDVIEVIEKAHNNE 724

  Fly   717 LEPTPGNTLRQTFENKVNRILNDARDKTGGSAKKSLTEYNNLKAMVVSGSKGSNINISQVIACVG 781
            |||||||||||||||:|||||||||||||.||:|||:||||.|:|||||:|||.||||||||.||
Mouse   725 LEPTPGNTLRQTFENQVNRILNDARDKTGSSAQKSLSEYNNFKSMVVSGAKGSKINISQVIAVVG 789

  Fly   782 QQNVEGKRIPYGFRKRTLPHFIKDDYGPESRGFVENSYLAGLTPSEFYFHAMGGREGLIDTAVKT 846
            ||||||||||:||:.|||||||||||||||||||||||||||||:||:|||||||||||||||||
Mouse   790 QQNVEGKRIPFGFKHRTLPHFIKDDYGPESRGFVENSYLAGLTPTEFFFHAMGGREGLIDTAVKT 854

  Fly   847 AETGYIQRRLIKAMESVMVNYDGTVRNSVGQLIQLRYGEDGLCGELVEFQNMPTVKLSNKSFEKR 911
            ||||||||||||:||||||.||.|||||:.|::|||||||||.||.|||||:.|:|.|||:|||:
Mouse   855 AETGYIQRRLIKSMESVMVKYDATVRNSINQVVQLRYGEDGLAGESVEFQNLATLKPSNKAFEKK 919

  Fly   912 FKFDWSNERLMKKVFTDDVIKEMTDSSEAIQELEAEWDRLVSDRDSLRQIFPNGESKVVLPCNLQ 976
            |:||::|||.:::...:|::|::..::....|||.|::|:..||:.||.|||.|:|||||||||.
Mouse   920 FRFDYTNERALRRTLQEDLVKDVLSNAHIQNELEREFERMREDREVLRVIFPTGDSKVVLPCNLL 984

  Fly   977 RMIWNVQKIFHINKRLPTDLSPIRVIKGVKTLLERCVIVTGNDRISKQANENATLLFQCLIRSTL 1041
            |||||.|||||||.|||:||.||:|::|||.|.::.|||.|:|.:|:||.|||||||...:||||
Mouse   985 RMIWNAQKIFHINPRLPSDLHPIKVVEGVKELSKKLVIVNGDDPLSRQAQENATLLFNIHLRSTL 1049

  Fly  1042 CTKYVSEEFRLSTEAFEWLVGEIETRFQQAQANPGEMVGALAAQSLGEPATQMTLNTFHFAGVSS 1106
            |::.::||||||.|||:||:||||::|.||.|:||||||||||||||||||||||||||:||||:
Mouse  1050 CSRRMAEEFRLSGEAFDWLLGEIESKFNQAIAHPGEMVGALAAQSLGEPATQMTLNTFHYAGVSA 1114

  Fly  1107 KNVTLGVPRLKEIINISKKPKAPSLTVFLTGGAARDAEKAKNVLCRLEHTTLRKVTANTAIYYDP 1171
            ||||||||||||:||||||||.|||||||.|.:|||||:||::||||||||||||||||||||||
Mouse  1115 KNVTLGVPRLKELINISKKPKTPSLTVFLLGQSARDAERAKDILCRLEHTTLRKVTANTAIYYDP 1179

  Fly  1172 DPQRTVISEDQEFVNVYYEMPDFDPTRISPWLLRIELDRKRMTDKKLTMEQIAEKINVGFGEDLN 1236
            :||.||::||||:|||||||||||..||||||||:|||||.|||:||||||||||||.|||:|||
Mouse  1180 NPQSTVVAEDQEWVNVYYEMPDFDVARISPWLLRVELDRKHMTDRKLTMEQIAEKINAGFGDDLN 1244

  Fly  1237 CIFNDDNADKLVLRIRIMNNEENKFQDEDEAVDKMEDDMFLRCIEANMLSDMTLQGIEAIGKVYM 1301
            ||||||||:||||||||||::|||.|:|:|.||||:||:||||||:|||:||||||||.|.||||
Mouse  1245 CIFNDDNAEKLVLRIRIMNSDENKMQEEEEVVDKMDDDVFLRCIESNMLTDMTLQGIEQISKVYM 1309

  Fly  1302 HLPQTDSKKRIVITETGEFKAIGEWLLETDGTSMMKVLSERDVDPIRTSSNDICEIFQVLGIEAV 1366
            ||||||:||:|:|||.|||||:.||:|||||.|:|:||||:||||:||:||||.|||.|||||||
Mouse  1310 HLPQTDNKKKIIITEDGEFKALQEWILETDGVSLMRVLSEKDVDPVRTTSNDIVEIFTVLGIEAV 1374

  Fly  1367 RKSVEKEMNAVLQFYGLYVNYRHLALLCDVMTAKGHLMAITRHGINRQDTGALMRCSFEETVDVL 1431
            ||::|:|:..|:.|.|.||||||||||||.||.:||||||||||:||||||.||:||||||||||
Mouse  1375 RKALERELYHVISFDGSYVNYRHLALLCDTMTCRGHLMAITRHGVNRQDTGPLMKCSFEETVDVL 1439

  Fly  1432 MDAAAHAETDPMRGVSENIIMGQLPKMGTGCFDLLLDAEKCRFGIEIP-NTLGNSMLGGAAMFIG 1495
            |:||||.|:|||:||||||::|||...||||||||||||||::|:||| |..|....|...||.|
Mouse  1440 MEAAAHGESDPMKGVSENIMLGQLAPAGTGCFDLLLDAEKCKYGMEIPTNIPGLGAAGPTGMFFG 1504

  Fly  1496 GGSTP--SMTPPMTPWANCNTPRYFS-PPGHVSAMTPGGPSFSPSAASDASGMSPSWSPA---HP 1554
            ...:|  .::|.||||....||.|.: .|...|.||||...|||||||||||.||.:|||   .|
Mouse  1505 SAPSPMGGISPAMTPWNQGATPAYGAWSPSVGSGMTPGAAGFSPSAASDASGFSPGYSPAWSPTP 1569

  Fly  1555 GSSPSSPGPSMSPYFPASP--SVSPSYSPTSPNYTASSPGG-----------------ASPNYSP 1600
            | ||.||||| |||.| ||  ::|||||||||.|...||||                 .||:|||
Mouse  1570 G-SPGSPGPS-SPYIP-SPGGAMSPSYSPTSPAYEPRSPGGYTPQSPSYSPTSPSYSPTSPSYSP 1631

  Fly  1601 SSPNYSPTSPLYA--SPRYASTTPNFNPQSTGYSPSSSGYSPTSPVYSPTVQFQS--SPSFAGSG 1661
            :|||||||||.|:  ||.|:.|:|:::|.|..|||:|..||||||.||||....|  |||::.: 
Mouse  1632 TSPNYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPT- 1695

  Fly  1662 SNIYSPGN-AYSPSSSNYSPNSPSYSPTSPSYSPSSPSYSPTSPCYSPTSPSYSPTSPNYTPVTP 1725
            |..|||.: :|||:|.:|||.|||||||||||||:|||||||||.||||||:||||||||||.:|
Mouse  1696 SPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPSYSPTSPNYSPTSPNYTPTSP 1760

  Fly  1726 SYSPTSPNYS-ASPQYSPASPAYSQTGVKYSPTSPTYSPPSPSYDGS------------PGSPQY 1777
            |||||||:|| .||.|:|.||.||.|...||||||:|||.||||..|            |.||.|
Mouse  1761 SYSPTSPSYSPTSPNYTPTSPNYSPTSPSYSPTSPSYSPTSPSYSPSSPRYTPQSPTYTPSSPSY 1825

  Fly  1778 TPGSPQYSPASPKYSPTSPLYSPSSPQHSP-SNQYSPTGSTYSATSPRYSPNMSIYSPSSTKYSP 1841
            :|.||.|||.||||:||||.||||||:::| |.:||||...||.|||:|||....|||::.||||
Mouse  1826 SPSSPSYSPTSPKYTPTSPSYSPSSPEYTPASPKYSPTSPKYSPTSPKYSPTSPTYSPTTPKYSP 1890

  Fly  1842 TSPTYTPTARNYSPTSPMYSPTAPSHYSPTSPAYSPSSPTF 1882
            |||||:||:..|:||||.||||:|: ||||||.|||:|||:
Mouse  1891 TSPTYSPTSPVYTPTSPKYSPTSPT-YSPTSPKYSPTSPTY 1930

Known Domains:


Indicated by green bases in alignment.

GeneSequenceDomainRegion External IDIdentity
RpII215NP_511124.1 PRK08566 14..887 CDD:236292 699/876 (80%)
RNAP_II_RPB1_N 15..868 CDD:259848 685/856 (80%)
RNA_pol_Rpb1_5 822..1420 CDD:282807 445/597 (75%)
RNA_pol_Rpb1_6 890..1071 CDD:282801 105/180 (58%)
RNAP_II_Rpb1_C 1050..1468 CDD:132720 334/417 (80%)
TCRP1 1602..1880 CDD:291605 188/296 (64%)
RCR <1789..1864 CDD:304939 49/75 (65%)
Polr2aNP_001277997.1 RNAP_II_RPB1_N 19..876 CDD:259848 685/856 (80%)
Bridging helix 833..845 9/11 (82%)
RNA_pol_Rpb1_6 896..1079 CDD:309914 106/182 (58%)
RNAP_II_Rpb1_C 1058..1476 CDD:132720 334/417 (80%)
CTD 1491..1610 CDD:215026 65/121 (54%)
Disordered. /evidence=ECO:0000256|SAM:MobiDB-lite 1546..1970 241/390 (62%)
C-terminal domain (CTD), 52 X 7 AA approximate tandem repeats of Y-[ST]-P-[STQ]-[ST]-P-[SRNTEVKGN] 1593..1960 207/340 (61%)
Herpes_BLLF1 <1857..>1961 CDD:330317 49/75 (65%)


Information from Original Tools:


Tool Simple Score Weighted Score Original Tool Information
BLAST Result Score Score Type Cluster ID
Compara 1 0.930 - - C167849175
Domainoid 1 1.000 928 1.000 Domainoid score I40
eggNOG 1 0.900 - - E1_COG0086
Hieranoid 1 1.000 - -
Homologene 1 1.000 - - H721
Inparanoid 1 1.050 2836 1.000 Inparanoid score I21
Isobase 1 0.950 - 0 Normalized mean entropy S300
OMA 1 1.010 - - QHG53835
OrthoDB 1 1.010 - - D591636at2759
OrthoFinder 1 1.000 - - FOG0000819
OrthoInspector 1 1.000 - - oto94993
orthoMCL 1 0.900 - - OOG6_100210
Panther 1 1.100 - - LDO PTHR19376
Phylome 1 0.910 - -
RoundUp 1 1.030 - avgDist Average_Evolutionary_Distance R1183
SonicParanoid 1 1.000 - - X2195
SwiftOrtho 00.000 Not matched by this tool.
TreeFam 1 0.960 - -
1716.750

Return to query results.
Submit another query.