Proteinski domen
Proteinski domen je dio proteinske sekvence i strukture koji može evoluirati, funkcionirati i postoji nezavisno od ostatka proteinskog lanca. Svaki domen formira kompaktnu trodimenzijsku strukturu i često može biti samostalno stabilan i savijen. Mnogi proteini sadrže nekoliko strukturnih domena. Jedan domen se može javiti u nizu različitih proteina.
Molekulska evolucija koristi domene kao strukturne komponente koje se mogu kombinirati u različitim aranžmanima da bi se formirali proteine sa različitim funkcijama. Domeni variraju u dužini od oko 25 do 500 aminokiselina. Najkraći domeni kao što su cinkovi prsti stabilizirani su metalnim ionima ili disulfidnim mostovima. Domeni često formiraju funkcionalne jedinice, kao što je kalcij-vezujući domen EF-šaka kalmodulina. Budući da su samostalno stabilni, domeni se mogu zamijeniti putem genetičkog inženjerstva između proteina, čime se formiraju himerni proteini.
Osnovi
urediKoncept domen prvi je predložio Vetlaufer 1973. na osnovu kristalografskih rengenskih studija živinskog lizozima[1] i papaina[2] i ograničenih proteolitičkih ispitivanja imunoglobulina.[3][4] Definirao je domene kao stabilne jedinice proteinske strukture koje se mogu autonomno sklapati. U prošlosti su domeni bili opisani kao jedinice:
Sve te definicije su validne i često se preklapaju, naprimjer za kompaktni strukturni domen koji je nađen u nizu različitih proteina i vjerovatno se samostalno sklapa i savija unutar svog strukturnog okruženja. Priroda često povezuje nekoliko domena čime se formiraju multidomeni i multifunkcionalni proteini sa velikim brojem mogućnosti.[7] U multidomenskom proteinu, svaki domen može obavljati svoju funkciju neovisno ili organizirao sa svojim susjedima. Domeni mogu da služe bilo kao moduli za izgradnju velikih sklopova, kao što su virusne čestice ili mišićna vlakna ili do pruže specifična katalitska ili mjesta vezanja kod enzima ili regulatornih proteina.
Primjer proteina sa više domena je piruvat-kinaza, glikolitski enzim koji ima važnu ulogu u regulaciji fluksa od fruktoza-1,6-bifosfata do piruvata. Ovaj protein sadrži sve-β regulatorni domen, α/β-supstrat vezujući domen i α/β-nukleotid vezujući domen, koji su povezani s nekoliko polipeptidnih veza.[8]. Svaki domen u ovom proteinu pojavljuje se u različitim grupama porodica proteina.
Centralni α/β-barelni domen, koji vezuje poslogu, je jedan od uobičajenih enzimskih sklopova. Prisutan je kod mnogih različitih enzimskih porodica koje katalizuju sasvim nevezane reakcije.[9] Barel α/β se obično naziva TIM barelom. Ovo ime potiče od trioza-fosfatnih izomeraza, u čijoj strukturi je bio prvo uočen.[10] On je trenutno klasifikovan u 26 homolognih familija u CATH bazi podataka domena.[11] TIM barel formiran je od sekvence β-α-β motiva koji su zatvoreni vodoikovim vezama prvog i zadnjeg lanca, čime se formira barel sa osam lanaca. Postoje različita stanovišta o evolucijskom porujeklu ovog domena. Jedna od studija sugestira da se zajednički predački enzim raščlanio u nekoliko porodica,[12] dok druga smatra da je stabilna struktura TIM-barela evoluirala putem konvergentne evolucije.[13]
TIM-barel piruvat-kinaza je diskontinuiran, što znači da je više od jednog polipeptidnog segmenta neophodno da bi se formirao domen. To je vjerovatno posljedica insercije jednog domena u drugi tokom evolucije ovog proteina. Bilo je pokazano da je među poznatim strukturama diskontinuirana jedna četvrtina strukturnih domena.[14][15] Insertirani β-barelni regulatorni domen je kontinuiran, jer se sastoji od jednog neprekinutog segmenta polipeptida.
Kovalentna veza dva domena ima funkcionalnu i strukturnu prednost jer povećava stabilnost u poređenju sa istim strukturama bez kovalentne veze.[16] Druge prednosti su zaštita intermedijara unutar inter-domenskog enzimskog otvora, koji bi inače bio nestabilan u vodenom okruženju, i ustaljeni stehiometrijski odnos enzimske aktivnosti koji je neophodan za sekvencijski niz reakcija.[17]
Domeni – jedinice strukture proteina
urediPrimarna struktura proteina (lanac aminokiselina) prvenstveno kodira njegovu jedinstvenu 3D konformaciju savijanja.[18] Najvažniji faktor sklapanja proteina u 3D strukturu je distribucija polarnih i nepolarnih bočnih lanaca.[19] Sklapanje dovodi do sklanjanja hidrofobnih bočnih lanaca u unutrašnjost molekula da bi se izbegao kontakt sa vodenim okruženjem. Općenito, proteini imaju jezgro od hidrofobnih ostataka okruženo omotačem hidrofilnih ostataka. Pošto su same peptidne veze polarne, neutraliziraju se međusobnim vodikovim vezama u hidrofobnom okruženju. Time se stvaraju regije polipeptida koji formiraju regularne 3D strukturne motive koji se nazivaju sekundarnim strukturama. Postoje dva glavna tipa sekundarne strukture: α-heliksi i β-listovi.
Domeni kao evolucijski moduli
urediPriroda je petljanac, a ne izumitelj,[20] jer nove sekvence su prilagođene iz već postojećih sekvenci, a ne izmišljene. Domeni su uobičajeni materijal koji priroda koristi za stvaranje novih sekvenci; mogu se smatrati genetički pokretnim jedinicama, koje se nazivaju „moduli“. Često su C– i N-krajevi domena bliski zajedno u prostoru, što im omogućava da se lahko "ubace" u roditeljske strukture tokom procesa evolucije. Mnoge domenske porodice nalaze se u sva tri oblika života, Archaea, Bacteria i Eukarya.[21] Proteinski moduli su podskupovi proteinskih domena koji se nalaze u nizu različitih proteina s posebno svestranom strukturom. Primjeri se mogu naći među vanćelijskim proteinima povezanim sa zgrušavanjem, fibrinolizom, komplementom, vanćelijskim matriksom, molekulama adhezije na ćelijskoj površini i receptorima citokina.[22] Četiri konkretna primjera široko rasprostranjenih proteinskih modula su domeni: SH2, imunoglobulinski, fibronektinski tip 3 i kringle.[23]
Molekulska evolucija stvara porodice srodnih proteina sa sličnom sekvencom i strukturom. Međutim, sličnosti sekvenci mogu biti izuzetno niske između proteina koji dijele istu strukturu. Proteinske strukture mogu biti slične jer su proteini odstupili od modela zajedničkog pretka. Alternativno, neki nabori mogu biti favoriziraniji od drugih jer predstavljaju stabilne aranžmane sekundarnih struktura, a neki proteini se tokom evolucije mogu konvergirati prema tim savijanjima. Postoji oko 110.000 eksperimentalno određenih 3D proteinskih struktura deponiranih u Banci podataka o proteinima (PDB).[24] Međutim, ovaj skup sadrži mnoge identične ili vrlo slične strukture. Sve proteine treba klasificirati u strukturne porodice, kako bi se razumjeli njihovi evolucijski odnosi. Strukturna poređenja najbolje se postižu na nivou domena. Zato razvijeni su mnogi algoritmi za automatsko dodjeljivanje domena u proteinima poznate 3D strukture.
Baza podataka CATH, klasificira domene u približno 800 složenih porodica; deset od ovih nčina savijanja je visoko zastupljeno i naziva se „super-nabiranje“. Super-nabori su definirani kao nabori za koje postoje najmanje tri strukture bez značajne sličnosti sekvenci.[25] Najnaseljeniji je supernabor α/β-barel, kako je ranije opisano.
Multidomenski proteini
urediVećina bjelančevina, dvije trećine među jednoćelijskim organizmima i više od 80% višećelijskih, su višedomenski proteini.[26] Međutim, druga istraživanja zaključila su da se 40% prokariotskih proteina sastoji od više domena, dok eukarioti imaju približno 65% proteina s više domena.[27]
Mnogi domeni u eukariotskim multidomenskim proteinima mogu se naći kao nezavisni proteini u prokariotima,[28] sugerirajući da su domeni u višedominskim proteinima nekada postojali kao nezavisni proteini. Naprimjer, kičmenjaci imaju multienzimski polipeptid koji sadrži domene GAR-sintetaza, AIR-sintetaza i domen GAR-transformacijaza (GARs-AIRs-GARt; GAR: glicinamid ribonukleotid/transferaza; AIR: aminoimidazol ribonukleotid sintetaza). Kod insekata, polipeptid se pojavljuje kao GAR-ovi (AIR-ovi) 2-GARt, u kvascima se GARs-AIRs kodira odvojeno od GARt, a kod bakterija svaki domen kodiran je zasebno.[29]
Porijeklo
urediMultidomenski proteini vjerojatno su se pojavili zbog selekcijskog pritiska tokom evolucije, kako bi stvorili nove funkcije. Različiti proteini odstupili su od zajedničkih predaka različitim kombinacijama i asocijacijama domena. Modulne jedinice često se kreću, unutar i između bioloških sistema putem mehanizama genetičkog miješanja:
- transpozicija mobilnih elemenata, uključujući horizontalne transfere (između vrsta);[30]
- gruba preuređivanje, kao što su inverzije, translokacije, delecije i duplikacije;
- homologna rekombinacija;
- klizanje DNK-polimeraza tokom replikacije.
Tipovi organizacije
urediNajjednostavnija organizacija multidomena koja se vidi u proteinima je organizacija jednog domena koji se ponavlja u tandemu.[31] Domeni mogu međusobno komunicirati (interakcijama domen-domen) ili ostati izolirani, poput perlica na žici. Ogromni mišićni protein od 30.000 ostataka, titin sastoji se od oko 120 domena tipa fibronektina-III i Ig-tipa.[32] U serinskim proteazama, duplikacija gena dovela je do stvaranja enzimskih domena s dva β-barela.[33] Ponavljanja su se toliko razlikovala da među njima nema očigledne sličnosti u sekvenci. Aktivno mjesto nalazi se na rascjepu između dva β-barelska domena, u koji iz svakog domensa doprinose funkcionalno važni ostaci. Pokazalo se da genetički modificirani mutanti himotripsina serin-proteazama imaju određenu aktivnost proteinaza, iako su njihovi ostaci na aktivnom mjestu ukinuti, pa je stoga pretostavljeno da je duplikacija povećala aktivnost enzima.[33]
Moduli često pokazuju različite odnose povezivanja, što ilustriraju kinezini i ABC transporteri. Motorni domen kinezina može biti na bilo kojem kraju polipeptidnog lanca koji uključuje regiju s upredenom zavojnicom i domen tereta.[34] ABC transporteri su građeni sa do četiri domena koji se sastoje od po dva nepovezana modula, ATP-vezujuće kasete i integralnog membranskog modula, raspoređenih u različitim kombinacijama.
Ne samo da se domeni rekombiniraju, već postoji mnogo primjera insercija domena u drugi. Sekvencna ili strukturne sličnosti s drugima domeni pokazuju tako da homolozi insefrtiranih i roditeljskih domena mogu postojati nezavisno. Primjer je kod 'prstiju' umetnutih u 'dlan' domen unutar polimerazne porodice Pol I.[35] Budući da se domen može umetnuti u drugi, uvijek bi trebao postojati barem jedan kontinuirani domen u multidomenskom proteinu. Ovo je glavna razlika između definicija strukturnih domena i evolucijskih/funkcionalnih domena. Evolucijski domen bit će ograničen na jednu ili dvije veze između domena, dok strukturni domeni mogu imati neograničene veze, unutar zadanog kriterija postojanja zajedničkog jezgra. Nekoliko strukturnih domena moglo bi se dodijeliti evolucijskom domenu.
Superdomen sastoji se od dva ili više konzerviranih domena nominalno nezavisnog porijekla, ali je kasnije naslijeđen kao jedna strukturna/funkcionalna jedinica.[36] Ovaj kombimirani superdomen može se javiti u divergentnim proteinima koji nisu srodni samo po genskim duplikacijama. Primjeri superdomena su par proteinska tirozin-fosfataza – C2 domen par u PTEN-u, tenzin, auksilin i membranski protein TPTE2 . Ovaj superdomen nalazi se u proteinima životinja, biljaka i gljiva. Ključna karakteristika PTP-C2 superdomena je konzerviranost aminokiselinskih ostataka u interfejsu domena.
Domeni nepoznate funkcije
urediVeliki dio domena je nepoznate funkcije. domen nepoznate funkcije (DUF) je proteinski domen koji nema okarakteriziranu funkciju. Ove porodice su prikupljene zajedno u Pfam bazi podataka koristeći prefiks DUF iza kojeg slijedi broj, s primjerima koji su DUF2992 i DUF1220. U bazi podataka Pfam sada postoji preko 3.000 DUF porodica koje predstavljaju preko 20% poznatih porodica.[37] Iznenađujuće je da je broj DUF-ova u Pfam-u povećan sa 20% (2010.) na 22% (2019.), uglavnom zbog sve većeg broja novih sekvenci genoma. Pfam izdanje 32.0 (2019) sadržavalo je 3.961 DUF-ova.[38]
Također pogledajte
uredi- Vezujući domen
- Kratki linearni motiv
- Pfam: baza proteinskih domena
- Protein
- Strukturna biologija
- Strukturna klasifikacija proteina (SCOP)
- CATH
Reference
uredi- ^ Phillips DC. (1966). "The three-dimensional structure of an enzyme molecule". Scientific American. 215 (5): 78–90. PMID 5978599.
- ^ Drenth J, Jansonius JN, Koekoek R, Swen HM, Wolthers BG. (1968). "Structure of papain". Nature. 218 (5145): 929–32. doi:10.1038/218929a0. PMID 5681232.CS1 održavanje: više imena: authors list (link)
- ^ Porter RR. (1973). "Structural studies of immunoglobulins". Science. 180 (87): 713–6. doi:10.1126/science.180.4087.713. PMID 4122075.
- ^ Edelman GM. (1973). "Antibody structure and molecular immunology". Science. 180 (88): 830–40. doi:10.1126/science.180.4088.830. PMID 4540988.
- ^ Bork P. (1991). "Shuffled domains in extracellular proteins". FEBS Lett. 286 (1–2): 47–54. doi:10.1016/0014-5793(91)80937-X. PMID 1864378.
- ^ Wetlaufer DB. (1973). "Nucleation, rapid folding, and globular intrachain regions in proteins". Proc Natl Acad Sci USA. 70 (3): 697–701. doi:10.1073/pnas.70.3.697. PMC 433338. PMID 4351801.
- ^ Chothia C. (1992). "Proteins. One thousand families for the molecular biologist". Nature. 357 (6379): 543–4. doi:10.1038/357543a0. PMID 1608464.
- ^ George RA, Heringa J. (2002). "An analysis of protein domain linkers: their classification and role in protein folding". Protein Eng. 15 (11): 871–9. doi:10.1093/protein/15.11.871. PMID 12538906.
- ^ Hegyi H, and Gerstein M. (1999). "The relationship between protein structure and function: a comprehensive survey with application to the yeast genome". J Mol Biol. 288 (1): 147–64. doi:10.1006/jmbi.1999.2661. PMID 10329133.
- ^ Banner; Bloomer, AC; Petsko, GA; Phillips, DC; Pogson, CI; Wilson, IA; Corran, PH; Furth, AJ; Milman, JD; et al. (1975). "Structure of chicken muscle triose phosphate isomerase determined crystallographically at 2.5 angstrom resolution using amino acid sequence data". Nature. 255 (5510): 609–614. doi:10.1038/255609a0. PMID 1134550. Eksplicitna upotreba et al. u:
|author=
(pomoć) - ^ Orengo CA, Michie AD, Jones S, Jones DT, Swindells MB, Thornton JM. (1997). "CATH--a hierarchic classification of protein domain structures". Structure. 5 (8): 1093–108. doi:10.1016/S0969-2126(97)00260-8. PMID 9309224.CS1 održavanje: više imena: authors list (link)
- ^ Copley, R. R. and Bork, P (2000). "Homology among (betaalpha)(8) barrels: implications for the evolution of metabolic pathways". J Mol Biol. 303 (4): 627–641. doi:10.1006/jmbi.2000.4152. PMID 11054297.CS1 održavanje: više imena: authors list (link)
- ^ Lesk AM, Brändén CI, Chothia C. (1989). "Structural principles of alpha/beta barrel proteins: the packing of the interior of the sheet". Proteins. 5 (2): 139–48. doi:10.1002/prot.340050208. PMID 2664768.CS1 održavanje: više imena: authors list (link)
- ^ Jones S, Stewart M, Michie A, Swindells MB, Orengo C, Thornton JM. (1998). "Domain assignment for protein structures using a consensus approach: characterization and analysis". Protein Sci. 7 (2): 233–42. doi:10.1002/pro.5560070202. PMC 2143930. PMID 9521098.CS1 održavanje: više imena: authors list (link)[trajno mrtav link]
- ^ Holm L, Sander C. (1994). "Parser for protein folding units". Proteins. 19 (3): 256–68. doi:10.1002/prot.340190309. PMID 7937738.
- ^ Ghélis C, Yon JM. (1979). "[Conformational coupling between structural units. A decisive step in the functional structure formation]". C R Seances Acad Sci D. 289 (2): 197–9. PMID 117925.
- ^ Ostermeier M, Benkovic SJ. (2000). "Evolution of protein function by domain swapping". Adv Protein Chem. 55: 29–77. PMID 11050932.
- ^ ANFINSEN CB, HABER E, SELA M, WHITE FH Jr. (1961). "The kinetics of formation of native ribonuclease during oxidation of the reduced polypeptide chain". Proc Natl Acad Sci USA. 47 (9): 1309–14. doi:10.1073/pnas.47.9.1309. PMC 223141. PMID 13683522.CS1 održavanje: više imena: authors list (link)
- ^ Cordes, M. H., Davidson, A. R., and Sauer, R. T (1996). "Sequence space, folding and protein design". Curr Opin Struct Biol. 6 (1): 3–10. doi:10.1016/S0959-440X(96)80088-1. PMID 8696970.CS1 održavanje: više imena: authors list (link)
- ^ Jacob F (juni 1977). "Evolution and tinkering". Science. 196 (4295): 1161–6. Bibcode:1977Sci...196.1161J. doi:10.1126/science.860134. PMID 860134. S2CID 29756896.
- ^ Ren S, Yang G, He Y, Wang Y, Li Y, Chen Z (oktobar 2008). "The conservation pattern of short linear motifs is highly correlated with the function of interacting protein domains". BMC Genomics. 9: 452. doi:10.1186/1471-2164-9-452. PMC 2576256. PMID 18828911.
- ^ Campbell ID, Downing AK (maj 1994). "Building protein structure and function from modular units". Trends in Biotechnology. 12 (5): 168–72. doi:10.1016/0167-7799(94)90078-7. PMID 7764899.
- ^ Bruce, Alberts (18. 11. 2014). Molecular biology of the cell (Sixth izd.). New York, NY. ISBN 9780815344322. OCLC 887605755.
- ^ wwPDB.org. "wwPDB: Worldwide Protein Data Bank". www.pdb.org. Arhivirano s originala, 7. 4. 2015. Pristupljeno 25. 7. 2007.
- ^ Orengo CA, Jones DT, Thornton JM (decembar 1994). "Protein superfamilies and domain superfolds". Nature. 372 (6507): 631–4. Bibcode:1994Natur.372..631O. doi:10.1038/372631a0. PMID 7990952. S2CID 4330359.
- ^ Apic G, Gough J, Teichmann SA (juli 2001). "Domain combinations in archaeal, eubacterial and eukaryotic proteomes". Journal of Molecular Biology. 310 (2): 311–25. doi:10.1006/jmbi.2001.4776. PMID 11428892. S2CID 11894663.
- ^ Ekman D, Björklund AK, Frey-Skött J, Elofsson A (april 2005). "Multi-domain proteins in the three kingdoms of life: orphan domains and other unassigned regions". Journal of Molecular Biology. 348 (1): 231–43. doi:10.1016/j.jmb.2005.02.007. PMID 15808866.
- ^ Davidson JN, Chen KC, Jamison RS, Musmanno LA, Kern CB (mart 1993). "The evolutionary history of the first three enzymes in pyrimidine biosynthesis". BioEssays. 15 (3): 157–64. doi:10.1002/bies.950150303. PMID 8098212. S2CID 24897614.
- ^ Henikoff S, Greene EA, Pietrokovski S, Bork P, Attwood TK, Hood L (oktobar 1997). "Gene families: the taxonomy of protein paralogs and chimeras". Science. 278 (5338): 609–14. Bibcode:1997Sci...278..609H. CiteSeerX 10.1.1.562.2262. doi:10.1126/science.278.5338.609. PMID 9381171.
- ^ Bork P, Doolittle RF (oktobar 1992). "Proposed acquisition of an animal protein domain by bacteria". Proceedings of the National Academy of Sciences of the United States of America. 89 (19): 8990–4. Bibcode:1992PNAS...89.8990B. doi:10.1073/pnas.89.19.8990. PMC 50050. PMID 1409863.
- ^ Heringa J (juni 1998). "Detection of internal repeats: how common are they?". Current Opinion in Structural Biology. 8 (3): 338–45. doi:10.1016/S0959-440X(98)80068-7. PMID 9666330.
- ^ Politou AS, Gautel M, Improta S, Vangelista L, Pastore A (februar 1996). "The elastic I-band region of titin is assembled in a "modular" fashion by weakly interacting Ig-like domains". Journal of Molecular Biology. 255 (4): 604–16. doi:10.1006/jmbi.1996.0050. PMID 8568900.
- ^ a b McLachlan AD (februar 1979). "Gene duplications in the structural evolution of chymotrypsin". Journal of Molecular Biology. 128 (1): 49–79. doi:10.1016/0022-2836(79)90308-5. PMID 430571.
- ^ Moore JD, Endow SA (mart 1996). "Kinesin proteins: a phylum of motors for microtubule-based motility". BioEssays. 18 (3): 207–19. doi:10.1002/bies.950180308. PMID 8867735. S2CID 46012215.
- ^ Russell RB (decembar 1994). "Domain insertion". Protein Engineering. 7 (12): 1407–10. doi:10.1093/protein/7.12.1407. PMID 7716150.
- ^ Haynie DT, Xue B (maj 2015). "Superdomains in the protein structure hierarchy: The case of PTP-C2". Protein Science. 24 (5): 874–82. doi:10.1002/pro.2664. PMC 4420535. PMID 25694109.
- ^ Bateman A, Coggill P, Finn RD (oktobar 2010). "DUFs: families in search of function". Acta Crystallographica. Section F, Structural Biology and Crystallization Communications. 66 (Pt 10): 1148–52. doi:10.1107/S1744309110001685. PMC 2954198. PMID 20944204.
- ^ El-Gebali S, Mistry J, Bateman A, Eddy SR, Luciani A, Potter SC, et al. (januar 2019). "The Pfam protein families database in 2019". Nucleic Acids Research. 47 (D1): D427–D432. doi:10.1093/nar/gky995. PMC 6324024. PMID 30357350.
Ključni radovi
uredi- Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN, Weissig H, et al. (januar 2000). "The Protein Data Bank". Nucleic Acids Research. 28 (1): 235–42. doi:10.1093/nar/28.1.235. PMC 102472. PMID 10592235.
- Tooze J, Brändén C (1999). Introduction to protein structure. New York: Garland Pub. ISBN 978-0-8153-2305-1.
- Das S, Smith TF (2000). "Identifying nature's protein Lego set". Advances in Protein Chemistry. 54: 159–83. doi:10.1016/S0065-3233(00)54006-6. ISBN 978-0-12-034254-9. PMID 10829228.
- Dietmann S, Park J, Notredame C, Heger A, Lappe M, Holm L (januar 2001). "A fully automatic evolutionary classification of protein folds: Dali Domain Dictionary version 3". Nucleic Acids Research. 29 (1): 55–7. doi:10.1093/nar/29.1.55. PMC 29815. PMID 11125048.
- Dyson HJ, Sayre JR, Merutka G, Shin HC, Lerner RA, Wright PE (august 1992). "Folding of peptide fragments comprising the complete sequence of proteins. Models for initiation of protein folding. II. Plastocyanin". Journal of Molecular Biology. 226 (3): 819–35. doi:10.1016/0022-2836(92)90634-V. PMID 1507228.
- Fersht AR (februar 1997). "Nucleation mechanisms in protein folding". Current Opinion in Structural Biology. 7 (1): 3–9. doi:10.1016/S0959-440X(97)80002-4. PMID 9032066.
- George DG, Hunt LT, Barker WC (1996). "PIR-International Protein Sequence Database". Methods in Enzymology. 266: 41–59. doi:10.1016/S0076-6879(96)66005-4. ISBN 978-0-12-182167-8. PMC 145575. PMID 8743676.
- Go M (maj 1981). "Correlation of DNA exonic regions with protein structural units in haemoglobin". Nature. 291 (5810): 90–2. Bibcode:1981Natur.291...90G. doi:10.1038/291090a0. PMID 7231530. S2CID 4313732.
- Hadley C, Jones DT (septembar 1999). "A systematic comparison of protein structure classifications: SCOP, CATH and FSSP". Structure. 7 (9): 1099–112. doi:10.1016/S0969-2126(99)80177-4. PMID 10508779.
- Hayward S (septembar 1999). "Structural principles governing domain motions in proteins". Proteins. 36 (4): 425–35. doi:10.1002/(SICI)1097-0134(19990901)36:4<425::AID-PROT6>3.0.CO;2-S. PMID 10450084.
- Heringa J, Argos P (juli 1991). "Side-chain clusters in protein structures and their role in protein folding". Journal of Molecular Biology. 220 (1): 151–71. doi:10.1016/0022-2836(91)90388-M. PMID 2067014.
- Honig B (oktobar 1999). "Protein folding: from the levinthal paradox to structure prediction". Journal of Molecular Biology. 293 (2): 283–93. CiteSeerX 10.1.1.332.955. doi:10.1006/jmbi.1999.3006. PMID 10550209.
- Kim PS, Baldwin RL (1990). "Intermediates in the folding reactions of small proteins". Annual Review of Biochemistry. 59 (1): 631–60. doi:10.1146/annurev.bi.59.070190.003215. PMID 2197986.
- Murvai J, Vlahovicek K, Barta E, Cataletto B, Pongor S (januar 2000). "The SBASE protein domain library, release 7.0: a collection of annotated protein sequence segments". Nucleic Acids Research. 28 (1): 260–2. doi:10.1093/nar/28.1.260. PMC 102474. PMID 10592241.
- Murzin AG, Brenner SE, Hubbard T, Chothia C (april 1995). "SCOP: a structural classification of proteins database for the investigation of sequences and structures" (PDF). Journal of Molecular Biology. 247 (4): 536–40. doi:10.1016/S0022-2836(05)80134-2. PMID 7723011. Arhivirano s originala (PDF), 26. 4. 2012.
- Janin J, Chothia C (1985). "Domains in proteins: definitions, location, and structural principles". Methods in Enzymology. 115: 420–30. doi:10.1016/0076-6879(85)15030-5. ISBN 978-0-12-182015-2. PMID 4079796.
- Schultz J, Copley RR, Doerks T, Ponting CP, Bork P (januar 2000). "SMART: a web-based tool for the study of genetically mobile domains". Nucleic Acids Research. 28 (1): 231–4. doi:10.1093/nar/28.1.231. PMC 102444. PMID 10592234.
- Siddiqui AS, Dengler U, Barton GJ (februar 2001). "3Dee: a database of protein structural domains". Bioinformatics. 17 (2): 200–1. doi:10.1093/bioinformatics/17.2.200. PMID 11238081.
- Srinivasarao GY, Yeh LS, Marzec CR, Orcutt BC, Barker WC, Pfeiffer F (januar 1999). "Database of protein sequence alignments: PIR-ALN". Nucleic Acids Research. 27 (1): 284–5. doi:10.1093/nar/27.1.284. PMC 148157. PMID 9847202.
- Tatusov RL, Natale DA, Garkavtsev IV, Tatusova TA, Shankavaram UT, Rao BS, et al. (januar 2001). "The COG database: new developments in phylogenetic classification of proteins from complete genomes". Nucleic Acids Research. 29 (1): 22–8. doi:10.1093/nar/29.1.22. PMC 29819. PMID 11125040.
- Taylor WR, Orengo CA (juli 1989). "Protein structure alignment". Journal of Molecular Biology. 208 (1): 1–22. doi:10.1016/0022-2836(89)90084-3. PMID 2769748.
- Yang AS, Honig B (septembar 1995). "Free energy determinants of secondary structure formation: I. alpha-Helices". Journal of Molecular Biology. 252 (3): 351–65. doi:10.1006/jmbi.1995.0502. PMID 7563056.
- Yang AS, Honig B (septembar 1995). "Free energy determinants of secondary structure formation: II. Antiparallel beta-sheets". Journal of Molecular Biology. 252 (3): 366–76. doi:10.1006/jmbi.1995.0503. PMID 7563057.
- Gough J, Chothia C (januar 2002). "SUPERFAMILY: HMMs representing all proteins of known structure. SCOP sequence searches, alignments and genome assignments". Nucleic Acids Research. 30 (1): 268–72. doi:10.1093/nar/30.1.268. PMC 99153. PMID 11752312.
Vanjski linkovi
urediBaze podataka o strukturnim domenima
uredi- Conserved Domains at the National Center for Biotechnology website
- 3Dee
- CATH
- DALI
- Definition and assignment of structural domains in proteins na Wayback Machine (archived 11. 9. 2006.)
- PFAM clan browser
Baze podataka o sekvencama
uredi- InterPro
- Pfam na Library of Congress Web Archives (archived 6. 5. 2011.)
- PROSITE
- ProDom[trajno mrtav link]
- SMART
- NCBI Conserved Domain Database
- SUPERFAMILY Arhivirano 8. 2. 2014. na Wayback Machine Library of HMMs representing superfamilies and database of (superfamily and family) annotations for all completely sequenced organisms
Baze podataka o funkcionalnim domrnima
uredi- dcGO Arhivirano 2. 1. 2015. na Wayback Machine A comprehensive database of domain-centric ontologies on functions, phenotypes and diseases.
Šablon:Proteinski domeni Šablon:Tercijarna struktura proteina