DRSC/TRiP Functional Genomics Resources

powered by:
logo

back to: DIOPT - Ortholog Prediction Tool / DIOPT for Diseases and Traits


Protein Alignment Col4a1 and Col4a6

DIOPT Version :10

Sequence 1:NP_723044.1 Gene:Col4a1 / 33727 FlyBaseID:FBgn0000299 Length:1779 Species:Drosophila melanogaster
Sequence 2:NP_001414189.1 Gene:Col4a6 / 363458 RGDID:1589724 Length:1690 Species:Rattus norvegicus


Alignment Length:1823 Identity:796/1823 - (43%)
Similarity:943/1823 - (51%) Gaps:284/1823 - (15%)


- Green bases have known domain annotations that are detailed below.


  Fly    71 KNCTAGYAGCVPKCIAEKGNRGLPGPLGPTGLKGEMGFPGMEGPSGDKGQKGDP---GPYGQRGD 132
            ::| :|...|.|    |||.||..||:|..|..|..||.|..|.||.||::|.|   ||||.:||
  Rat    33 QDC-SGACACSP----EKGARGHTGPIGTQGPAGPEGFAGPTGLSGLKGERGSPGRLGPYGPKGD 92

  Fly   133 KGERGSPGLHGQAGVPGVQGPAGNPGAPGINGKDGCDGQDGIPGLEGLSGMPGPRGYAGQLGSKG 197
            ||..|.||..|.:|:||..|..|..|.||:   |||:|..|..|..|..|.||..|..|..|.||
  Rat    93 KGPIGVPGFVGISGIPGHPGQPGPRGPPGL---DGCNGTQGAVGFPGTDGYPGVLGPPGLPGHKG 154

  Fly   198 EKGEPAKENGDYAKGEKGEPGWRGTAGLAGPQGFPGEKGERGDSGPYGAKGPRGEHGLKGEKGAS 262
            .|||||...|... |.||:||..|..|:.||.|.||..|:.|..||.|.:||.|..||.|..|..
  Rat   155 AKGEPASFQGSII-GMKGDPGLPGLHGITGPSGSPGSPGDAGPIGPPGFQGPPGPPGLPGPDGNM 218

  Fly   263 CYGPMKPGAPGIKGEKGEPASSFPVKPTHTV--MG-PRGDMGQKGE---PGLVGRKGEPG-PE-G 319
            ..|  ..|..||||:.|.|..:.|...|..:  || |:|:.|.|||   ||..||.|.|| || |
  Rat   219 GLG--FQGEKGIKGDVGLPGPAGPPPSTGELEFMGFPKGEKGSKGEPGPPGFPGRSGLPGVPELG 281

  Fly   320 DTGLDGQKGEKGLPGGPGDRGRQGNFGPPGSTGQKGDRGEPGLNGLPGNPGQKGEPGRAG----- 379
            ..|..|::|..||||..|..|.:|..|.||..|:||..|.||.||.||..|:||..|..|     
  Rat   282 SIGEKGERGILGLPGPRGPVGSEGIQGYPGKQGKKGTSGFPGTNGFPGIKGEKGSIGVRGPDSFT 346

  Fly   380 ---ATGKPGLLGPPGPPG--GGRGTPGPPGPKGPRGYVGAPGPQGLNGVDGLPGPQGYNGQKGGA 439
               .|...|..|.||.||  |.||..|..|.:||.|..|.|   .|.|:.|..||||..|.||..
  Rat   347 DAEGTVISGFPGDPGVPGLPGLRGDEGIQGQRGPAGTAGLP---SLTGLPGALGPQGSPGLKGDR 408

  Fly   440 GLPGRP--GNEGPPGKKGEKGTAGLNGPKGSIGPIGHPGP-----PGPEGQKGDAGLPGY-GIQG 496
            |..||.  |..|.||:.|..|..||.||.|..|.....||     ||..|.:|:.||.|: ||:|
  Rat   409 GNSGRTTFGEAGLPGRVGLPGLPGLPGPSGPPGRTFVSGPLLSIEPGLPGLQGEQGLKGHQGIKG 473

  Fly   497 SKGDAGI---------------PGYPGLKGSKGERGFKGNAGAPGDSKLGRP-GTPGAAGAPGQK 545
            .|||:|.               .|.||::|..|.||.||..|.||......| ||||..|..||.
  Rat   474 VKGDSGFCACEGGAPNIGPHGESGLPGIQGPIGLRGIKGTRGDPGSRGASGPTGTPGLFGPRGQT 538

  Fly   546 GDAGRPGTP---------GQKGDMGIKGDVGGKCSSCRAGPKGDKGTSGLPGIPGKDG--ARGPP 599
            |..|:.|.|         |.|||.|.:|..|      .||..|..|..||||.||..|  ..|.|
  Rat   539 GLKGKKGEPTVSRGSKMAGDKGDPGPQGIPG------LAGAPGKDGIPGLPGFPGTQGDDGSGFP 597

  Fly   600 GER---GYPGERGHD-----------GINGQTGPPGEKGEDGRTGLPGATGEPGKPALCDLSLIE 650
            |||   |.|||:|||           |:.|..|.||:||.||..|..|..|..|....|   :|.
  Rat   598 GERGLPGLPGEKGHDGPTGPRGIGLPGLPGPRGLPGDKGVDGLPGQQGLRGAKGVTLPC---IIP 659

  Fly   651 PLKGDKGYPGAPGAKGVQGFKGAEGLPGIPGPKGEFGFKGEKGLSG---APGNDGTPGRAGRDGY 712
            ...|..|:||||   |..|.|||.|||||||..|..|.|||.|..|   .||..|.||..|..|.
  Rat   660 GSYGPSGFPGAP---GFPGSKGARGLPGIPGKPGTHGSKGEPGSPGLIHLPGFPGFPGARGEKGL 721

  Fly   713 PGIPGQSIKGEPGFHGRDGAKGDKGSFGRSG-----EKGEPGSCALDEIKMPAKGNKGEPGQTGM 772
            ||.||  :.|:.|:.|:.|:.|..||.|.:|     |.|..|...|..:    .|:||.||.:|:
  Rat   722 PGFPG--LLGKHGYPGKAGSPGVPGSKGVAGDIFGAENGASGEQGLQGL----PGDKGFPGDSGL 780

  Fly   773 PGPPGEDGSPGERGYTGLKGNTGPQGPPGVEGPRGLNGPRGEKGNQGAVGVPGNPGKDGLRGIPG 837
            |||.|..|..|..|..|.:||.|..||||..||.|...|.|.||..   |:||.||..|:.|.||
  Rat   781 PGPKGLSGKSGMLGPKGERGNPGTSGPPGQPGPSGSTDPFGIKGTS---GLPGAPGLPGISGHPG 842

  Fly   838 RNGQPGPRGEPGISRPGPMGPPGLNGLQGEKGDRGPTGPIGFPGADGSVGYPGDRGDAGLPGVSG 902
            :.||.|..|.||.:  |..|.||:.||.      ||.|..||      :|.||..|..||||:  
  Rat   843 KKGQRGDIGHPGST--GKRGLPGIKGLP------GPQGLAGF------LGSPGLSGVTGLPGI-- 891

  Fly   903 RPGIVGEKGDVGPIGPAGVAGPPGVPGIDGVRGRDGAKGEPGSPGLVGMPGNKGDRGAPGNDG-- 965
             ||..||||..||:|..|:.|.||:||.||::|..|:.|:.|.||..|.||.|||||.||..|  
  Rat   892 -PGQKGEKGSSGPVGFPGLPGLPGLPGADGLKGFSGSFGKVGQPGQAGTPGEKGDRGDPGPVGIS 955

  Fly   966 -PK------GFAGVTGAPGKRGPAGIPGVSGAKGDKGATGLTGNDGPVGGRGPPGAPGLMG-IKG 1022
             |:      .|.|..|:.|..|..|.||..|.||:.|..||.         |.|||||... |||
  Rat   956 SPRPPMLNLWFKGEKGSQGSAGSDGFPGPRGDKGEPGIPGLP---------GAPGAPGQSNTIKG 1011

  Fly  1023 DQGLAGAPGQQGLDGMPGEKGNQGFPGLDGPPGLPGDASEKGQKGEPGPSGLRGDTGPAGTPGWP 1087
            ..|..|:||..|..|:||.||:.|..|.   ||:||.:..:|..|.|||      .|..|.||..
  Rat  1012 LSGSPGSPGSMGRRGLPGLKGSLGIAGF---PGIPGKSGSQGLTGTPGP------LGATGIPGLK 1067

  Fly  1088 GEKGLPGLAVHGRAGPPGEKGDQGRSGIDGRDGINGEKGEQGLQGVWGQPGEKGSVGAPGIPGAP 1152
            |::| |.|.:.|..||.|:.|:.|..|:.|:||:.|::|..|.:   |..|:.||.|.||.||:|
  Rat  1068 GDQG-PTLGISGSPGPKGQPGELGFKGVKGKDGLVGDRGYPGNK---GDSGKVGSAGDPGFPGSP 1128

  Fly  1153 GMDGLPGAAGAPGAVGYPGDRGDKGEPGLSGLPGLKGETGPVGLQGFTGAPGPKGERG-----IR 1212
            |:.|:.|..|.||..|..|..|..|.||.|||.|.||..|..||.|..|.||.||..|     |.
  Rat  1129 GLKGISGMNGDPGFPGSSGHVGSIGRPGPSGLIGPKGFPGLPGLHGLNGLPGTKGTHGTPGASIT 1193

  Fly  1213 GQPGLPATVPDIRGDK-------GSQGERGYTGEKGEQGERGLTGPAGVAGAKGDRGLQGPPGAS 1270
            |.|| ||.:|..:|:|       |..|::|..|:||:||..||.||||.            ||||
  Rat  1194 GVPG-PAGLPGPKGEKGMPGIVIGDPGKQGLRGQKGDQGSPGLQGPAGT------------PGAS 1245

  Fly  1271 GLNGIPGAKGDIGPRGEIGYPGVTIKGEKGLPGRPGRNGRQGLIGAPGLIGERGLPGLAGEPGLV 1335
            |                |..|.|.    .|.||.||:         |||.||||.|||.|.    
  Rat  1246 G----------------ISLPSVI----AGQPGDPGQ---------PGLDGERGRPGLPGP---- 1277

  Fly  1336 GLPGPIGPAGSKGERGLAGSPGQPGQDGFPGAPGLKGDTGPQGFKGERGLNGFEGQKGDKGDRGL 1400
              |||.||:..:|:         ||..||||.|||      ||.||.:||.||.|..||.|.:|:
  Rat  1278 --PGPPGPSSDQGD---------PGDSGFPGIPGL------QGLKGNQGLPGFSGLSGDLGLKGM 1325

  Fly  1401 QGPSGL---PGLVGQKGDTGYPGLNGNDGPVGAPGERGFTGPKGRDGRDGTPGLPGQKGEPGMLP 1462
            :|..||   ||.:|..||.|:||:.|..||      |||:||               :|.||..|
  Rat  1326 RGEPGLMGTPGKIGPPGDPGFPGMKGKAGP------RGFSGP---------------QGAPGHTP 1369

  Fly  1463 -------PPGPKGEPGQPGRNGPKGEPGRPGERGLIGIQGERGEKGERGLIGETGNVGRPGPKGD 1520
                   ||||.|.||..|..|..|:||..|..||      :|.||..|:.|:.|..|.|||.|.
  Rat  1370 IAEARHVPPGPLGLPGIDGIPGLTGDPGSQGSVGL------QGSKGLPGIPGKDGPSGLPGPSGI 1428

  Fly  1521 RGEP------GERGYEGAIGLIGQKGEPGAPAPAALDYLTGILITRHSQSETVPACSAGHTELWT 1579
            .|:|      |..|:|||.|..|..|:||.|..:.   ..|..:.:|||||.||.|..|.::||.
  Rat  1429 LGDPGLPGLQGPPGFEGAPGNQGPIGQPGMPGHSV---RVGYTLVKHSQSEHVPPCPIGMSQLWV 1490

  Fly  1580 GYSLLYVDGNDYAHNQDLGSPGSCVPRFSTLPVLSCGQNNVCNYASRNDKTFWLTTNAAIPMMPV 1644
            |||||:|:|.:.|||||||..|||:|||||:|.:.|..|.||:||.||||::||:|.|.||||||
  Rat  1491 GYSLLFVEGQEKAHNQDLGFAGSCLPRFSTMPFIYCNINEVCHYARRNDKSYWLSTTAPIPMMPV 1555

  Fly  1645 ENIEIRQYISRCVVCEAPANVIAVHSQTIEVPDCPNGWEGLWIGYSFLMHTAVGNGGGGQALQSP 1709
            ...:|.||||||.|||||:..||||||.|.||.||.||..||||||||||||.|..||||:|.||
  Rat  1556 GETQIPQYISRCSVCEAPSQAIAVHSQDITVPQCPLGWHSLWIGYSFLMHTAAGTEGGGQSLVSP 1620

  Fly  1710 GSCLEDFRATPFIECNGAKGTCHFYETMTSFWMYNLESSQPF-ERPQQQTIKAGERQSHVSRCQV 1773
            |||||||||.|||||:||:||||::....|||:..:|....| |:|..:.:|.|:..:.||||||
  Rat  1621 GSCLEDFRANPFIECSGARGTCHYFANKYSFWLTTVEERGQFQEQPVSENLKTGQLHTRVSRCQV 1685

  Fly  1774 CMK 1776
            |||
  Rat  1686 CMK 1688

Known Domains:


Indicated by green bases in alignment.

GeneSequenceDomainRegion External IDIdentity
Col4a1NP_723044.1 gly_rich_SclB <107..>361 CDD:468478 120/264 (45%)
gly_rich_SclB <355..>642 CDD:468478 138/345 (40%)
gly_rich_SclB <543..820 CDD:468478 128/309 (41%)
gly_rich_SclB <727..>968 CDD:468478 108/254 (43%)
gly_rich_SclB <969..>1218 CDD:468478 107/254 (42%)
gly_rich_SclB <1186..>1420 CDD:468478 97/248 (39%)
gly_rich_SclB <1321..>1547 CDD:468478 98/241 (41%)
C4 1555..1662 CDD:128421 65/106 (61%)
C4 1663..1777 CDD:128421 71/115 (62%)
Col4a6NP_001414189.1 None

Return to query results.
Submit another query.