DRSC/TRiP Functional Genomics Resources

powered by:
logo

back to: DIOPT - Ortholog Prediction Tool / DIOPT for Diseases and Traits


Protein Alignment Polr1A and NRPA1

DIOPT Version :10

Sequence 1:NP_523743.1 Gene:Polr1A / 36617 FlyBaseID:FBgn0019938 Length:1642 Species:Drosophila melanogaster
Sequence 2:NP_191325.1 Gene:NRPA1 / 824935 AraportID:AT3G57660 Length:1670 Species:Arabidopsis thaliana


Alignment Length:1818 Identity:618/1818 - (33%)
Similarity:940/1818 - (51%) Gaps:347/1818 - (19%)


- Green bases have known domain annotations that are detailed below.


  Fly     1 MGSKRAMDVHMFPSDLEFAVFTDQEIRKLSVVKVITGITFDALGHAIPGGLYDIRMGSYGRCMDP 65
            ||:.:.::      .:.|:..|:|::||.|.:||.:.|..|.:|:..||||||:::|.... ...
plant    21 MGASQVVE------SVRFSFMTEQDVRKHSFLKVTSPILHDNVGNPFPGGLYDLKLGPKDD-KQA 78

  Fly    66 CGTC--LKLQDCPGHMGHIELGTPVYNP----FFIKFVQRLLCIFCLHCYKLQMKDHECEIIMLQ 124
            |.:|  |||. ||||.|||||..|:|:|    ....|:|| .|.||.|   ...|..:.|..:.|
plant    79 CNSCGQLKLA-CPGHCGHIELVFPIYHPLLFNLLFNFLQR-ACFFCHH---FMAKPEDVERAVSQ 138

  Fly   125 LRLIDAGYIIEAQELEL---FKSEIVCQNTENLVAIKNGDMVHPHIAAMYKLLEKNEKNSSNSTK 186
            |:||..|.|:.|::||.   .||:...::.|::|...:.:.           .|.::......|.
plant   139 LKLIIKGDIVSAKQLESNTPTKSKSSDESCESVVTTDSSEE-----------CEDSDVEDQRWTS 192

  Fly   187 TSCSLRTAITHSALQRLGKKCRHC-------NKSMRF----VRYMHRRLVFYVTLADIKERVGTG 240
            ...:..||:..:.::...|.|..|       .|.| |    :|.|....|....:..:|.:..|.
plant   193 LQFAEVTAVLKNFMRLSSKSCSRCKGINPKLEKPM-FGWVRMRAMKDSDVGANVIRGLKLKKSTS 256

  Fly   241 A-----------------------ETGGQNKVIFAD-------------ECRRYLRQIYANYPEL 269
            :                       ||..::..:.|:             |.|..|:.::.|..|.
plant   257 SVENPDGFDDSGIDALSEVEDGDKETREKSTEVAAEFEEHNSKRDLLPSEVRNILKHLWQNEHEF 321

  Fly   270 LKLLVPVLGLSNTDLTQGDRSPVD--LFFMDTLPVTPPRARPLNMVGDMLKGNPQTDIYINIIEN 332
            ...:        .||.|.....:|  :||::::.|.|.:.||....||.:..:|||.....:||:
plant   322 CSFI--------GDLWQSGSEKIDYSMFFLESVLVPPTKFRPPTTGGDSVMEHPQTVGLNKVIES 378

  Fly   333 NHVLNVVLKYMKGGQEKLTEEAKAAYQTLKGETAHEKLYTAWLALQMSVDVLLDVNMS--REMKS 395
            |::|.      .....|| :::|..::              |..||.||:||.|...:  :..:.
plant   379 NNILG------NACTNKL-DQSKVIFR--------------WRNLQESVNVLFDSKTATVQSQRD 422

  Fly   396 GEGLKQIIEKKSGLIRSHMMGKRVNYAARTVITPDPNINVDEIGIPDIFAKKLSYPVPVTEWNVT 460
            ..|:.|::|||.||.|..|||||||:|.|:||:|||.|.|::||||..||.||:||..||.|||.
plant   423 SSGICQLLEKKEGLFRQKMMGKRVNHACRSVISPDPYIAVNDIGIPPCFALKLTYPERVTPWNVE 487

  Fly   461 ELRKMVMNGPDVHPGANYIQDKNGFTTYIPADNASKRESLAKLLLSNPK------------DGIK 513
            :||:.::||||:||||.:..||:. |..:|:...::|....|||.|...            :| |
plant   488 KLREAIINGPDIHPGATHYSDKSS-TMKLPSTEKARRAIARKLLSSRGATTELGKTCDINFEG-K 550

  Fly   514 IVHRHVLNGDVLLLNRQPSLHKPSIMGHKARILHGEKTFRLHYSNCKAYNADFDGDEMNAHYPQS 578
            .||||:.:||::|:||||:|||||:|.||.|:|.||||.||||:||..|||||||||||.|:||.
plant   551 TVHRHMRDGDIVLVNRQPTLHKPSLMAHKVRVLKGEKTLRLHYANCSTYNADFDGDEMNVHFPQD 615

  Fly   579 EVARAEAYNLVNVASNYLVPKDGTPLGGLIQDHVISGVKLSIRGRFFNREDYQQLVF-QGLSQL- 641
            |::||||||:||..:.|..|.:|.||..|||||::|.|.|:.|..|.:::.:.||:| .|::.: 
plant   616 EISRAEAYNIVNANNQYARPSNGEPLRALIQDHIVSSVLLTKRDTFLDKDHFNQLLFSSGVTDMV 680

  Fly   642 ---------KK------DIKLL--PPTILKPAVLWSGKQILSTIIINIIPEGYERINLDSFAKIA 689
                     ||      |.:||  .|.||||..||:|||:: |.::|.|.:|:....::...|:.
plant   681 LSTFSGRSGKKVMVSASDAELLTVTPAILKPVPLWTGKQVI-TAVLNQITKGHPPFTVEKATKLP 744

  Fly   690 GKNWNV-SRPRPPICGTNPEGNDLSES--------QVQIRNGELLVGVLDKQQYGATTYGLIHCM 745
            ...:.. ||...|..|...:..::.||        ::.||..|.:.||:||.|:  ..|||:|.:
plant   745 VDFFKCRSREVKPNSGDLTKKKEIDESWKQNLNEDKLHIRKNEFVCGVIDKAQF--ADYGLVHTV 807

  Fly   746 YELYGGDVSTLLLTAFTKVFTFFLQLEGFTLGVKDILVTDVADRKRRKIIRECRNVGNSAVAAAL 810
            :||||.:.:..||:.|:::||.|||..|||.||.|:::....|.:|.|.::||.|||...:....
plant   808 HELYGSNAAGNLLSVFSRLFTVFLQTHGFTCGVDDLIILKDMDEERTKQLQECENVGERVLRKTF 872

  Fly   811 ELEDEPPHD--ELVEKMEAAYVKDSKFRVL-LDRKYKSLLD-----GYTNDINSTCLPRGLITKF 867
            .::.:...|  ::..::|....:|.:..:. |||...:.|:     |..||:    |..||: |.
plant   873 GIDVDVQIDPQDMRSRIERILYEDGESALASLDRSIVNYLNQCSSKGVMNDL----LSDGLL-KT 932

  Fly   868 PSNN-LQLMVLSGAKGSMVNTMQISCLLGQIELEGKRPPLMISGKSLPSFTSFETSPKSGGFIDG 931
            |..| :.||.:||||||.||..|||..|||.:|||||.|.|:|||:||.|..::.||::||||..
plant   933 PGRNCISLMTISGAKGSKVNFQQISSHLGQQDLEGKRVPRMVSGKTLPCFHPWDWSPRAGGFISD 997

  Fly   932 RFMTGIQPQDFFFHCMAGREGLIDTAVKTSRSGYLQRCLIKHLEGLSVHYDLTVRDSDNSVVQFL 996
            ||::|::||:::||||||||||:||||||||||||||||:|:||.|.|:||.||||:|.|::||.
plant   998 RFLSGLRPQEYYFHCMAGREGLVDTAVKTSRSGYLQRCLMKNLESLKVNYDCTVRDADGSIIQFQ 1062

  Fly   997 YGEDGLDILKSKFFNDKFCADFLTQNATAILRPAQLQLMKDEEQLAKVQRHEKHIRSWEKKKPAK 1061
            |||||:|:.:|.|. :||  ..||.|...:|:       |..|.:                    
plant  1063 YGEDGVDVHRSSFI-EKF--KELTINQDMVLQ-------KCSEDM-------------------- 1097

  Fly  1062 LRAAFTHFSEELREEVEVKRPNEINSKTGRRRFDEGLLKLWKKADAEDKALYRKKYARCPDPTVA 1126
            |..|.::.|:           ..|:.|.|..:|.|.:                            
plant  1098 LSGASSYISD-----------LPISLKKGAEKFVEAM---------------------------- 1123

  Fly  1127 VYKQDLYYGSVSERTRKLITDYAKRKPALKETIADIMRVKTIKSLAAPGEPVGLIAAQSIGEPST 1191
                     .::||   :.:.:.:::..||     :::.|...|||.||||||::||||:|||||
plant  1124 ---------PMNER---IASKFVRQEELLK-----LVKSKFFASLAQPGEPVGVLAAQSVGEPST 1171

  Fly  1192 QMTLNTFHFAGRGEMNVTLGIPRLREILMLASSNIKTPSMDIPIKPGQ-QHQAEKLRINLNSVTL 1255
            ||||||||.|||||||||||||||:||||.|::|||||.|..|:..|: :..|..:...|..:|:
plant  1172 QMTLNTFHLAGRGEMNVTLGIPRLQEILMTAAANIKTPIMTCPLLKGKTKEDANDITDRLRKITV 1236

  Fly  1256 ANLLEYVHVSTGLTLDPERSYEYDM-RFQFLPREVYKEDYGVRPKHI-------IKYMHQTFFKQ 1312
            |::::    |..|::.|...||.:: ....|...:||.::  .|||.       .:.|...|.::
plant  1237 ADIIK----SMELSVVPYTVYENEVCSIHKLKINLYKPEH--YPKHTDITEEDWEETMRAVFLRK 1295

  Fly  1313 LIRAI---LKVSNASR------TTKIVVIDDKKDADKEDDNDLDNGDEVGRSKAKANDDDSSDDN 1368
            |..||   :|:.:..|      |..|.            .|:.||.|.|   ..|.|:||..||.
plant  1296 LEDAIETHMKMLHRIRGIHNDVTGPIA------------GNETDNDDSV---SGKQNEDDGDDDG 1345

  Fly  1369 -----DDDDATGVKLKQRKTDEKDYD--------DPDDVEELH----DANDDDDEAEDEDDEEKG 1416
                 ||..:...|.|:::|||.||:        :|..:..:.    |:.::|.|...||..|..
plant  1346 EGTEVDDLGSDAQKQKKQETDEMDYEENSEDETNEPSSISGVEDPEMDSENEDTEVSKEDTPEPQ 1410

  Fly  1417 QDGNDNDGDDKAVERLLSNDMVKAYTY---DKENHLWCQ---VKLNLSVRYQKPD----LTSIIR 1471
            ::..:...:.|.|:.:......|...:   ..:.|::.:   .|..:..::...|    |..|.:
plant  1411 EESMEPQKEVKGVKNVKEQSKKKRRKFVRAKSDRHIFVKGEGEKFEVHFKFATDDPHILLAQIAQ 1475

  Fly  1472 ELAGKSVVHQVQHIKRA---------IIYKG---------TDDDQ----LLKTDGINIGEMFQHN 1514
            :.|.|..:.....|:|.         :||.|         ::|::    .|...|::...:::..
plant  1476 QTAQKVYIQNSGKIERCTVANCGDPQVIYHGDNPKERREISNDEKKASPALHASGVDFPALWEFQ 1540

  Fly  1515 KILDLNRLYSNDIHAIARTYGIEAASQVIVKEVSNVFKVYGITVDRRHLSLIADYMTFDGTFQPL 1579
            ..||:..||||.||.:...:|:|||.:.|::|:::|||.|||:|..|||:||||||||.|.::|:
plant  1541 DKLDVRYLYSNSIHDMLNIFGVEAARETIIREINHVFKSYGISVSIRHLNLIADYMTFSGGYRPM 1605

  Fly  1580 SRK-GMEHSSSPLQQMSFESSLQFLKSAAGFGRADELSSPSSRLMVGLPVRNGTGAFELLTKI 1641
            ||. |:..|:||..:|:||::.:|:..||.:|..|.|.:||:|:.:|||..:|||.|:|:.::
plant  1606 SRMGGIAESTSPFCRMTFETATKFIVQAATYGEKDTLETPSARICLGLPALSGTGCFDLMQRV 1668

Known Domains:


Indicated by green bases in alignment.

GeneSequenceDomainRegion External IDIdentity
Polr1ANP_523743.1 RNAP_I_RPA1_N 18..982 CDD:259844 394/1072 (37%)
HMG-box_SF 1065..1119 CDD:438789 7/53 (13%)
RNAP_I_Rpa1_C 1166..1638 CDD:132722 183/539 (34%)
NRPA1NP_191325.1 PRK14977 23..1668 CDD:184940 616/1814 (34%)
RNAP_I_RPA1_N 31..1048 CDD:259844 394/1073 (37%)

Return to query results.
Submit another query.