Sie sind auf Seite 1von 69

14.

Estructura de
proteínas, 1
Niveles estructurales en las proteínas

Estructura primaria: Secuencia de aminoácidos

Estructura secundaria: Plegamiento básico de la cadena


debido a enlaces de hidrógeno entre grupos -CO- y -NH-
de la unión peptídica: hélices, láminas y giros

Estructura terciaria: Estructura tridimensional de la proteína

Estructura cuaternaria: Asociación de distintas subunidades,


siendo cada una un polipéptido.
Estructura primaria

5’-AAGGGTACCCAACATTTAGTT-3’
3’-TTCCCATGGGTTGTAAATCAA-5’
DNA

5’-AAGGGUACCCAACAUUUAGUU-3’ RNA

N Lys.Gly.Ser.Gln.His.Leu.Val C Proteína
Estructura primaria de la insulina

S S
GIVEQCCASVCSLYQLENYCN
S S
S S
FVNQHLCGSHLVEALYLVCGERGFFYTPKA
Oxidación de puentes disulfuro

H O
H O
N H C
N H C C
C
CH2
CH2
SO3H
S HCO3H
S
SO3H
CH2
CH2
C
N H C C
N H C
H O
H O
Reducción y alquilación de puentes disulfuro H O
N H C
C
CH2
H O H O
S
N H C N H C
C C CH2
CH2 CH2 COO-
ICH2 COOH
S DTT SH
COO-
S SH
CH2
CH2 CH2
S
C C
N H C N H C CH2
H O H O C
N H C
H O
Determinación del N-término por la reacción de Sanger

O R2 H O
O2N F + H2N C N
N C

NO2 R1 H O R3

O R2 H O
O2N HN C N
N C

NO2 R1 H O R3

R2 H2N COOH
O2N HN COOH
+ +
H2N COOH R3
NO2 R1
Tripsina

---.---.---.Lys.---.---.---
---.---.---.Arg.---.---.---

Rotura enzimática
de polipéptidos
---.---.---.Phe.---.---.---
---.---.---.Tyr.---.---.---
---.---.---.Trp.---.---.---
---.---.---.Leu.---.---.---

Quimotripsina
Rotura de un péptido por bromuro de cianógeno

H O R H O R H O R H O
N C N C N C N C
N C N C N C
R H O CH2 H O R H O R
CH2
S BrCN
CH3

H O R H O R H O R H O
N C N
N C N C N C
O H2N C N C
R H O
O R H O R
Degradación secuencial de Edman

O R2 H O R4
N C S + H2N C N C
N C N C
R1 H O R3 H O
Feniltioisocianato
Péptido (n)

S H O R2 H O R4
N C N C N C
N C N C
R1 H O R3 H O
PTC-péptido
Ácido diluído
S R2 H O R4
NH N C
+ H2N C N C
N
R1 O R3 H O
H
PTH-aminoácido O Péptido (n-1)
Hoy día, la mayor parte de estructuras primarias de proteínas
se determina a partir de la secuencia de nucleótidos en el genoma.

Técnicamente la secuenciación de ácidos nucleicos (en particular,


la de DNA) es mucho más sencilla y barata que la de proteínas,
estando al alcance de cualquier laboratorio.
10 20 30 40 50 60
| | | | | |
PYQYPALTPE QKKELSDIAH RIVAPGKGIL AADESTGSIA KRLQSIGTEN TEENRRFYRQ

70 80 90 100 110 120


| | | | | |
LLLTADDRVN PCIGGVILFH ETLYQKADDG RPFPQVIKSK GGVVGIKVDK GVVPLAGTNG

130 140 150 160 170 180


| | | | | |
ETTTQGLDGL SERCAQYKKD GADFAKWRCV LKIGEHTPSA LAIMENANVL ARYASICQQN

190 200 210 220 230 240


| | | | | |
GIVPIVEPEI LPDGDHDLKR CQYVTEKVLA AVYKALSDHH IYLEGTLLKP NMVTPGHACT

250 260 270 280 290 300


| | | | | |
QKFSHEEIAM ATVTALRRTV PPAVTGITFL SGGQSEEEAS INLNAINKCP LLKPWALTFS

310 320 330 340 350 360


| | | | | |
YGRALQASAL KAWGGKKENL KAAQEEYVKR ALANSLACQG KYTPSGQAGA AASESLFVSN

HAY
Estructura primaria de la aldolasa A humana
SWISS-PROT http://www.expasy.ch
Cálculos a partir de estructura primaria

- Número, porcentaje y fracción molar de aminoácidos

- Fórmula molecular y peso molecular

- pI (punto isoeléctrico) teórico

- Absorbancia molar teórica

- Vida media teórica

- Índices de inestabilidad e hidrofobicidad


Amino acid composition:

Ala (A) 42 11.6%


Arg (R) 15 4.1%
Asn (N) 14 3.9%
Asp (D) 14 3.9%
Cys (C) 8 2.2%
Gln (Q) 17 4.7%
Glu (E) 24 6.6% Atomic composition:
Gly (G) 30 8.3%
His (H) 9 2.5% Carbon C 1741
Ile (I) 20 5.5% Hydrogen H 2780
Leu (L) 34 9.4% Nitrogen N 486
Lys (K) 26 7.2% Oxygen O 526
Met (M) 3 0.8% Sulfur S 11
Phe (F) 8 2.2%
Pro (P) 19 5.2% Formula: C1741H2780N486O526S11
Ser (S) 20 5.5% Total number of atoms: 5544
Thr (T) 22 6.1%
Trp (W) 3 0.8% Molecular weight: 39288.8
Tyr (Y) 13 3.6%
Val (V) 22 6.1%

Asx (B) 0 0.0%


Glx (Z) 0 0.0%
Xaa (X) 0 0.0%
ProtParam, 1
http://www.expasy.ch
Total number of negatively charged residues (Asp + Glu): 38
Total number of positively charged residues (Arg + Lys): 41

Theoretical pI: 8.39

Extinction coefficients:

Conditions: 6.0 M guanidium hydrochloride


0.02 M phosphate buffer
pH 6.5

Extinction coefficients are in units of M-1 cm-1 .

The first table lists values computed assuming ALL Cys


residues appear as half cystines, whereas the second table
assumes that NONE do.

276 278 279 280 282


nm nm nm nm nm
Ext. coefficient 35630 35508 34945 34190 32880
Abs 0.1% (=1 g/l) 0.907 0.904 0.889 0.870 0.837

276 278 279 280 282


nm nm nm nm nm
Ext. coefficient 35050 35000 34465 33710 32400
Abs 0.1% (=1 g/l) 0.892 0.891 0.877 0.858 0.825

ProtParam, 2
http://www.expasy.ch
Estimated half-life:

The N-terminal of the sequence considered is P (Pro).

The estimated half-life is: >20 hours (mammalian reticulocytes, in vitro).


>20 hours (yeast, in vivo).
? (Escherichia coli, in vivo).

Instability index:

The instability index (II) is computed to be 34.82


This classifies the protein as stable.

Aliphatic index: 87.16

Grand average of hydropathicity (GRAVY): -0.268

ProtParam, 3
http://www.expasy.ch
Predicciones a partir de estructura primaria, 1

- Hidrofobicidad

- Estructura secundaria

- Retención cromatográfica en HPLC

- Residuos accesibles y ocultos

- Mutabilidad
Ala: 1.800
Arg: -4.500 PYQYPALTPEQKKELSDIAH
Asn: -3.500
Asp: -3.500
Cys: 2.500 Valor de hidrofobicidad para la
Gln: -3.500 posición n (en este caso, 8):
Glu: -3.500
Gly: -0.400
His: -3.200 n+4

S bi
Ile: 4.500
Leu: 3.800 = -10.5
Lys: -3.900 i = n-4
Met: 1.900
Phe: 2.800
Pro: -1.600
Ser: -0.800
Thr: -0.700
Trp: -0.900
Tyr: -1.300
Val: 4.200 Escala de hidrofobicidad
(según Kyte y Doolittle)
Cálculo predictivo de hidrofobicidad (Kyte & Doolittle)
Predicciones a partir de estructura primaria, 2: Homologías

(CG5432)CG5432 PROTEIN. [Drosophila melanogaster]


376 AA
Score = 398 bits (1011), Expect = e-110
Identities = 197/355 (55%), Positives = 245/355 (68%), Gaps = 2/355 (0%)
Query: 2 YQYPALTPEQKKELSDIAHRIVAPGKGILAADESTGSIAKRLQSIGTENTEENRRFYRQL 61
+ YP E ++EL I+ +VAPGKGILAADES+ + KR Q IG ENTEENRR YRQ+
Sbjct: 5 FYYP--NKELQEELICISKALVAPGKGILAADESSAVMGKRFQLIGVENTEENRRLYRQM 62

Query: 62 LLTADDRVNPCIGGVILFHETLYQKADDGRPFPQXXXXXXXXXXXXXXXXXXPLAGTNGE 121


L T D ++ I GVI +HETL+Q+ DDG PF + PL G+ E
Sbjct: 63 LFTTDPKIAENISGVIFYHETLHQRTDDGLPFVEALRKKGILTGIKVDKHFSPLFGSEDE 122

Query: 122 TTTQGLDGLSERCAQYKKDGADFAKWRCVLKIGEHTPSALAIMENANVLARYASICQQNG 181


TTQGLD L+ RCAQYKK+G FAKWRC+LKI ++TPS AI+ ENANV+ARYA+ICQ
Sbjct: 123 FTTQGLDDLANRCAQYKKEGCSFAKWRCILKITKNTPSPQAILENANVMARYAAICQSQR 182

Query: 182 IVPIVEPEILPDGDHDLKRCQYVTEKVLAAVYKALSDHHIYLEGTLLKPNMVTPGHACTQ 241


+VPI+ PE+L GDHDL RCQ V E +LA VYKALSDHH++LEGTLL+P+MV PG +
Sbjct: 183 LVPIISPEVLATGDHDLDRCQKVNEILLAGVYKALSDHHVFLEGTLLQPSMVMPGLQSNK 242

Query: 242 KFSHEEIAMATVTALRRTVPPAVTGITFLSGGQSEEEASINLNAINKCPLLKPWALTFSY 301


+I +ATV A+RR+VPPAV G+ F G QSEEEA+++LNAIN PL KPWA+TF++
Sbjct: 243 NHPPADIGVATVLAIRRSVPPAVMGVLFCGGAQSEEEATVHLNAINNVPLCKPWAMTFAF 302

Query: 302 GRALQASALKAWGGKKENLKAAQEEYVKRALANSLACQGKYTPSGQAGAAASESL 356


RALQ S L+ WGGKKE + AQ E +KR AN LA GKY +AA+E L
Sbjct: 303 DRALQTSILRTWGGKKEQISHAQNELIKRCRANGLASIGKYVIGSVESSAATERL 357
Dependiendo del grado de homología en su estructura
primaria, las proteínas se agrupan en:

- Superfamilias: homología en torno a 30 %

- Familias: homología superior a un 50 % y


la misma función, por lo general.

Además, hay pequeños tractos de secuencias comunes


a proteínas muy diversas, y que corresponden a ciertos
aspectos funcionales (como p.e. modificación
postraduccional): son los motivos secuenciales
Algunos motivos secuenciales en las proteínas

N-Glicosilación N-{P}-[ST]-{P}
Unión a glicosaminoglicano S-G-x-G
Fosforilación dependiente de cAMP [RK]-(2)-[ST]
Fosforilación, protein kinasa C [ST]-x(2)-[RK]
Fosforilación, tirosin kinasa [RK]-x(2)-[DE]-x(3)-Y
N-miristilación G- {EDRKHPFYW}-x(2)-[STAGCN]-{P}
Amidación C-terminal x-G- [RK]-[RK]
-carboxilación de ácido glutámico x(12)-E-x(3)-E-x-C-x(6)-[DEN]-x-[LIVMFY]
Prenilación C-{DENQ}-[LIVM]
Predicciones a partir de estructura
primaria, 3: Filogenia y Taxonomía
-8 1 10
___.___.___.___.___.___.___.___.Gly.___.___.___.___.Gly.___.___.___.Phe.

20
___.___.___.Cys.___.___.Cys.His.___.___.___.___.___.___.___.___.Lys.___.

30 40
Gly.Pro.___.Leu.___.Gly.___.___.___.Arg.___.___.Gly.___.___.___.Gly.___.

50 60
___.Tyr.___.___.Ala.Asn.___.___.___.___.___.___.Trp.___.___.___.___.___.

70 80
___.___.Tyr.Leu.___.Asn.Pro.Lys.Lys.Tyr.Ile.Pro.Gly.Thr.Lys.Met.___.Phe.

90 100
___.Gly.___.___.Lys.___.___.___.Arg.___.___.___.___.___.___.___.___.___.

104
___.___.___.___.
Invariantes en citocromo c
Sustituciones conservadoras en citocromo c

Posición Aminoácidos

13 Arg, Lys

40 Ser, Thr

46 Phe, Tyr

49 Ser, Thr

81 Val, Leu, Ile

85 Leu, Ile

90 Asp, Glu

94 Leu, Ile

95 Ile, Val

97 Phe, Tyr
Sustituciones radicales en citocromo c

Posición Aminoácidos

33 His, Ser, Trp, Tyr, Asn

44 Ala, Pro, Asp, Gln, Val, Glu

54 Asn, Ala, Ser, Gln, Arg, Lys

60 Glu, Gly, Asp, Ala, Gln, Lys, Asn

65 Tyr, Phe, Ser, Met, Arg

83 Pro, Ala, Val, Gly, Thr

88 Pro, Ala, Asp, Glu, Lys, Thr

89 Gln, Lys, Asn, Glu, Thr, Gly, Asp, Ala, Ser

92 Ana, Asn, Asp, Gly, Glu, Val, Thr, Lys, Gln


Distancias filogenéticas en citocromo c

1 2 3 4 5 6 7 8 9
__________________________________________________________________________

1. Homo sapiens -

2. Maccaca mulata 1 -

3. Sus scrofa 10 9 -

4. Gallus domesticus 13 12 9 -

5. Rana pipiens 18 17 11 11 -

6. Musca domestica 27 26 22 23 22 -

7. Bombyx mori 31 30 27 28 29 14 -

8. Triticum vulgare 43 43 45 46 48 45 45 -

9. Neurospora crassa 48 47 46 47 49 41 47 54 -
F

Ángulos de
conformación
Representación de Ramachandran
a-Hélice
F = -57º
Y= -47º

Paso de rosca: 0.54 nm


Traslación por residuo: 0.15 nm
Residuos por vuelta: 3.6
Enlaces H: n a n+3
Hélice 310

F = -49º
Y = -26º

Paso de rosca: 0.59 nm


Traslación por residuo: 0.19
Residuos por vuelta: 3
Mioglobina

Proteína globular con


alto contenido en
a-hélice
N
Fibrinógeno

Proteína fibrosa
con alto contenido
en a-hélice
Propensión estructural hacia a-hélices (Chou y Fasman)

Estabilizan Indiferentes
Desestabilizan
Ala: 1.420 Arg: 0.980 Asn: 0.670
Gln: 1.110 Asp:1.010
Cys: 0.700
Glu: 1.510 His: 1.000 Gly: 0.570
Leu: 1.210 Ile: 1.080 Pro: 0.570
Lys: 1.160 Trp: 1.080 Ser: 0.770
Met: 1.450 Val: 1.060 Thr: 0.830
Phe: 1.130 Tyr: 0.690
Prolina y
a-hélices
Hélice de poliprolina
Colágeno
Estructura b

F = -119
Y = 113
C N C N C N
N C N C N C C
N
H O H O H O
O H O H O H
C N C N C N
N C N C N C C
N
H O H O H O

O H O H O H
C N C N C N
N C N C N C
N C
H O H O H O
O H O H O H
C N C N C N
N N C N C N C
C

Lámina b paralela
Lámina b paralela
Barril b paralelo
H O H O H O
N N C N C N C
C
C N C N C N
O H O H O H
H O H O H O
N C N C N C
C N C N C N
C N
O H O H O H
H O H O H O
N N C N C N C C
C N C N C N
O H O H O H

Lámina b antiparalela
Lámina b antiparalela
Lámina antiparalela
Propensión estructural hacia estructuras b (Chou y Fasman)

Estabilizan Indiferentes Desestabilizan

Ile: 1.600 Arg: 0.930 Ala: 0.830


Cys: 1.190 Met: 1.050 Asn: 0.890
Gln: 1.100 Asp: 0.540
Leu: 1.300 Glu: 0.370
Phe: 1.380 Gly: 0.750
Thr: 1.190 His: 0.870
Trp: 1.370 Lys: 0.740
Tyr: 1.470 Pro: 0.550
Val: 1.700 Ser: 0.750
Proteína fibrosa con
estructura b: Fibroína
Proteína globular
con estructura b:
Concanavalina A
Giro b
Propensión estructural hacia giros b

Estabilizan Indiferentes Desestabilizan

Asn: 1.560 Arg: 0.950 Ala: 0.660


Asp: 1.460 Gln: 0.980 Glu: 0.740
Cys: 1.190 His: 0.950 Ile: 0.470
Gly: 1.560 Lys: 1.010 Leu: 0.590
Pro: 1.520 Thr: 0.960 Met: 0.600
Ser: 1.430 Trp: 0.960 Phe: 0.600
Tyr: 1.140 Val: 0.500
1ntr
Proteína
regulatoria
Estructuras suprasecundarias

- Hélice-vuelta-hélice
- Siete hélices transmembrana y hélice anfipática
- Cremallera de leucina
- Unidad bab
- Meandro b
- Dedo de Zn
- Mano EF
Hélice-vuelta-hélice

N
Siete hélices transmembrana
(bacteriorrodopsina)
a-hélice
anfipática

Lado Lado polar


hidrofóbico
Cremallera de leucina
Motivo bab
Meandro b
Dedo de Zn
Mano EF
Determinación experimental de la estructura secundaria

1. Métodos físicos:

Cristalografía Rayos X, Resonancia Magnética Nuclear


(RMN, NMR) en tanto en cuanto resuelven la estructura
terciaria
Otras técnicas: dicroísmo circular

2. Métodos predictivos a partir de la estructura primaria


Propensión de un aminoácido hacia una estructura dada

1. A partir de un conjunto de proteínas de estructura 3D conocida,


se forma la siguiente tabla:

Total a-hélice Estr. b Giro b

Glutamato 282 132 29 43


Aminoácidos 5507 1715 1555 1121

(Se ha puesto el Glutamato como ejemplo; esta tabla se prepara


para todos los aminoácidos)
2. A partir de la tabla anterior, se calculan las frecuencias relativas
de aparición de dicho aminoácido en las tres estructuras:

a-hélice Estr. b Giro b

Glutamato 0.470 0.104 0.151


Aminoácidos 0.311 0.282 0.204

3. Se calcula entonces la propensión de cada aminoácido hacia una


estructura dada por el cociente de dividir la frecuencia relativa de
cada estructura por la frecuencia relativa media de todos los amino-
ácidos. En el caso del glutamato,

Pa = 0.470/0.311 = 1.511 Pb = 0.104/0.282 = 0.370


Pg = 0.151/0.202 = 0.748
Ala: 1.420
Arg: 0.980 PYQYPALTPEQKKELSDIAH
Asn: 0.670
Asp: 1.010
Cys: 0.700 Valor de propensión hacia
Gln: 1.110
Glu: 1.510 a-hélice para la posición n
Gly: 0.570 (en este caso, 8):
His: 1.000
Ile: 1.080
Leu: 1.210
n+4
Lys: 1.160
Met:
Phe:
1.450
1.130
S bi = 9.07
i = n-4
Pro: 0.570
Ser: 0.770
Thr: 0.830
Trp: 1.080
Tyr: 0.690
Val: 1.060
Escala de propensiones hacia a-hélice
(según Chou y Fasman)
Ala: 0.830
Arg: 0.930
Asn: 0.890 PYQYPALTPEQKKELSDIAH
Asp: 0.540
Cys: 1.190
Gln: 1.100 Valor de propensión hacia
Glu: 0.370
Gly: 0.750
estructura b para la posición n
His: 0.870 (en este caso, 8):
Ile: 1.600
Leu: 1.300
Lys: 0.740 n+4
Met: 1.050
Phe:
Pro:
1.380
0.550
S bi = 8.1
i = n-4
Ser: 0.750
Thr: 1.190
Trp: 1.370
Tyr: 1.470
Val: 1.700

Escala de propensiones hacia estructura b


(según Chou y Fasman)
Ala: 0.660
Arg: 0.950 PYQYPALTPEQKKELSDIAH
Asn: 1.560
Asp: 1.460
Cys: 1.190
Gln: 0.980 Valor de propensión hacia
Glu: 0.740 giro b para la posición n
Gly: 1.560
His: 0.950 (en este caso, 8):
Ile: 0.470
Leu: 0.590
Lys: 1.010 n+4
Met:
Phe:
0.600
0.600 S bi = 9.12
Pro: 1.520 i = n-4
Ser: 1.430
Thr: 0.960
Trp: 0.960
Tyr: 1.140
Val: 0.500

Escala de propensiones hacia giro b


(según Chou y Fasman)

Das könnte Ihnen auch gefallen