Beruflich Dokumente
Kultur Dokumente
PROTEOMA
HUMANO
HUANCAYO,
2013
DEDICATORIA
INTRODUCCION
La gentica molecular y los diversos aspectos derivados (clonacin, investigacin
con clulas madre) es una de las reas de investigacin ms emergentes en los
ltimos aos. No obstante es bastante amplio el desconocimiento real sobre su
significado y, sobre todo, de las verdaderas posibilidades de dicho campo de
investigacin. El presente trabajo supone una puesta al da sobre gentica general,
gentica molecular y sobre los diversos aspectos de la clonacin y de las
posibilidades futuras que de todo ello se deriva.
HISTORIA DE LA GENETICA
4. GREGOR MENDEL
1. PRIMERA LEY:
2. SEGUNDA LEY:
3. TERCERA LEY:
Fue uno de los mayores impulsores del proyecto Genoma Humano que
representa un importante avance para la curacin de enfermedades de
origen gentico. Sus trabajos se basan mayormente en el estudio del
ADN, campo en el que colabor con Crick en el descubrimiento de la
estructura de la doble hlice del ADN y en el estudio de la replicacin de
ste. Cuando volvi a estados Unidos, colabor en trabajos que le
permitieron descifrar el cdigo gentico y descubrir la presencia del ARN
mensajero, que hace la funcin de intermediario entre el ADN y la sntesis
de las protenas. Gan un Premio Nobel (compartido con Crick y Wilkins).
5 Rafael Oliva Virgili, Jos Manuel Vidal Taboada. GENOMA HUMANO - 2006
Participa en la constitucin de unos orgnulos citoplasmticos
(ribosomas) y en el paso de la informacin del ARN a protena, llamado
TRADUCCIN. La protena se elabora segn la secuencia de
nucletidos asociada al cdigo gentico.
Los tres tipos de ARN se forman a medida que son necesarios, utilizando
como plantilla secciones determinadas del ADN celular.
EL GENOMA HUMANO
COMPONENTES:
Cromosomas
ADN intragnico
Genes
Un gen es la unidad bsica de la herencia, y porta la informacin gentica necesaria
para la sntesis de una protena (genes codificantes) o de un ARN no codificante
(genes de ARN). Est formado por una secuencia promotora, que regula su
expresin, y una secuencia que se transcribe, compuesta a su vez por: secuencias
UTR (regiones flanqueantes no traducidas), necesarias para la traduccin y la
estabilidad del ARN, exones (codificantes) e intrones, que son secuencias de ADN
no traducidas situadas entre dos exones que sern eliminadas en el procesamiento
del ARN (ayuste).
Con base en los resultados iniciales arrojados por el proyecto ENCODE[] (acrnimo
de Enciclopedia Of DNA Elements), algunos autores han propuesto redefinir el
concepto actual de gen. Las observaciones ms recientes hacen difcilmente
sostenible la visin tradicional de un gen, como una secuencia formada por las
regiones UTRs, los exones y los intrones. Estudios detallados han hallado un
nmero de secuencias de inicio de transcripcin por gen muy superior a las
estimaciones iniciales, y algunas de estas secuencias se sitan en regiones muy
alejadas de la traducida, por lo que los UTR 5' pueden abarcar secuencias largas
dificultando la delimitacin del gen. Por otro lado, un mismo transcrito puede dar
lugar a ARN maduros totalmente diferentes (ausencia total de solapamiento), debido
a una gran utilizacin del splicing alternativo. De este modo, un mismo transcrito
primario puede dar lugar a protenas de secuencia y funcionalidad muy dispar. En
consecuencia, algunos autores han propuesto una nueva definicin de gen: [] [] la
unin de secuencias genmicas que codifican un conjunto coherente de productos
funcionales, potencialmente solapantes. De este modo, se identifican como genes
los genes ARN y los conjuntos de secuencias traducidas parcialmente solapantes
(se excluyen, as, las secuencias UTR y los intrones, que pasan a ser considerados
como "regiones asociadas a genes", junto con los promotores). De acuerdo con esta
definicin, un mismo transcrito primario que da lugar a dos transcritos secundarios (y
dos protenas) no solapantes debe considerarse en realidad dos genes diferentes,
independientemente de que estos presenten un solapamiento total o parcial de sus
transcritos primarios.
Las nuevas evidencias aportadas por ENCODE, segn las cuales las regiones UTR
no son fcilmente delimitables y se extienden largas distancias, obligaran a re
identificar nuevamente los genes que en realidad componen el genoma humano. De
acuerdo con la definicin tradicional (actualmente vigente), sera necesario
identificar como un mismo gen a todos aquellos que muestren un solapamiento
parcial (incluyendo las regiones UTR y los intrones), con lo que a la luz de las
nuevas observaciones, los genes incluiran mltiples protenas de secuencia y
funcionalidad muy diversa. Colateralmente se reducira el nmero de genes que
componen el genoma humano. La definicin propuesta, en cambio, se fundamenta
en el producto funcional del gen, por lo que se mantiene una relacin ms coherente
entre un gen y una funcin biolgica. Como consecuencia, con la adopcin de esta
nueva definicin, el nmero de genes del genoma humano aumentar
significativamente.
Genes de ARN
Adems de los genes codificantes de protenas, el genoma humano contiene varios
miles de genes ARN, cuya transcripcin reproduce ARN de transferencia (ARNt),
ARN ribosmico (ARNr), microARN (miARN), u otros genes ARN no codificantes.
Los ARN ribosmico y de transferencia son esenciales en la constitucin de los
ribosomas y en la traduccin de las protenas. Por su parte, los microARN tienen
gran importancia en la regulacin de la expresin gnica, estimndose que hasta un
20-30% de los genes del genoma humano puede estar regulado por el mecanismo
de interferencia por miARN. Hasta el momento se han identificado ms de 300
genes de miARN y se estima que pueden existir unos 500-
Distribucin de genes
A continuacin se muestran algunos valores promedio del genoma humano. Cabe
advertir, sin embargo, que la enorme heterogeneidad que presentan estas variables
hace poco representativos a los valores promedio, aunque tienen valor orientativo.
La densidad media de genes es de 1 gen cada 100 kb, con un tamao medio de 20-
30 kb, y un nmero de exones promedio de 7-8 por cada gen, con un tamao medio
de 150 nucletidos. El tamao medio de un ARNm es de 1,8-2,2 kb, incluyendo las
regiones UTR (regiones no traducidas flanqueantes), siendo la longitud media de la
regin codificante de 1,4 kb.
Secuencias reguladoras
El genoma tiene diversos sistemas de regulacin de la expresin gnica, basados
en la regulacin de la unin de factores de transcripcin a las secuencias
promotoras, en mecanismos de modificacin epigentica (metilacin del ADN o
metilacin-acetilacin de histonas) o en el control de la accesibilidad a los
promotores determinada por el grado de condensacin de la cromatina; todos ellos
muy interrelacionados. Adems hay otros sistemas de regulacin a nivel del
procesamiento, estabilidad y traduccin del ARNm, entre otros. Por lo tanto, la
expresin gnica est intensamente regulada, lo cual permite desarrollar los
mltiples fenotipos que caracterizan los distintos tipos celulares de un organismo
eucariota multicelular, al mismo tiempo que dota a la clula de la plasticidad
necesaria para adaptarse a un medio cambiante. No obstante, toda la informacin
necesaria para la regulacin de la expresin gnica, en funcin del ambiente celular,
est codificada en la secuencia de ADN al igual que lo estn los genes.
Pseudogenes
En el genoma humano se han encontrado asimismo unos 19.000 pseudogenes, que
son versiones completas o parciales de genes que han acumulado diversas
mutaciones y que generalmente no se transcriben. Se clasifican en pseudogenes no
procesados (~30%) y pseudogenes procesados (~70%) []
ADN intergnico
Satlites
El conjunto de repeticiones en tndem de tipo satlite comprende un total de 250 Mb
del genoma humano. Son secuencias de entre 5 y varios cientos de nucletidos que
se repiten en tndem miles de veces generando regiones repetidas con tamaos
que oscilan entre 100 kb (100.000 nucletidos) hasta varias megas bases.
4. Satlite alfa: secuencia bsica de 171 nucletidos. Forma parte del ADN de
los centrmeros cromosmicos.
Mini satlites
Estn compuestas por una unidad bsica de secuencia de 6-25 [] nucletidos que se
repite en tndem generando secuencias de entre 100 y 20.000 pares de bases. Se
estima que el genoma humano contiene unos 30.000 mini satlites.
Diversos estudios han relacionado los mini satlites con procesos de regulacin de
la expresin gnica. Asimismo, se han asociado con puntos de fragilidad
cromosmica dado que se sitan prximos a lugares preferentes de rotura
cromosmica, translocacin gentica y recombinacin meitica. Por ltimo, algunos
mini satlites humanos (-10%) son impermutables, presentando una tasa media de
mutacin entre el 0.5% y el 20% en las clulas de la lnea germinal, siendo as las
regiones ms inestables del genoma humano conocidas hasta la fecha.
Algunos mini satlites por su gran inestabilidad presentan una notable variabilidad
entre individuos distintos. Se consideran polimorfismos multiallicos, dado que
pueden presentarse en un nmero de repeticiones muy variable, y se denominan
VNTR. Son marcadores muy utilizados en gentica forense, ya que permiten
establecer una huella gentica caracterstica de cada individuo, y son identificables
mediante hibridacin.
Micros satlites
Estn compuestos por secuencias bsicas de 2-4 nucletidos, cuya repeticin en
tndem origina frecuentemente secuencias de menos de 150 nucletidos. Algunos
ejemplos importantes son el di nucletido CA y el trinucletido CAG.
Los micro satlites son tambin polimorfismos multiallicos, denominados STR y
pueden identificarse mediante PCR, de modo rpido y sencillo. Se estima que el
genoma humano contiene unos 200.000 micro satlites, que se distribuyen ms o
menos homogneamente, al contrario que los mini satlites, lo que los hace ms
informativos como marcadores.
SINE
Elementos nucleares dispersos cortos. Son secuencias cortas, generalmente de
unos pocos cientos de bases, que aparecen repetidas miles de veces en el genoma
humano. Suponen el 13% del genoma humano, [] un 10% debido exclusivamente a la
familia de elementos Alu (caracterstica de primates).
LINE
Su riqueza en G+C es del 42%, prxima a la media del genoma (41%) y se localizan
preferentemente en las bandas G de los cromosomas. Poseen adems un promotor
de la ARN polimerasa II.
Los elementos LINE completos son codificantes. En concreto LINE-1 codifica dos
protenas:
Diversos estudios han mostrado que las secuencias LINE pueden tener importancia
en la regulacin de la expresin gnica, habindose comprobado que los genes
prximos a LINE presentan un nivel de expresin inferior. Esto es especialmente
relevante porque aproximadamente el 80% de los genes del genoma humano
contiene algn elemento L1 en sus intrones. [
Se ha visto que la insercin aleatoria de L1 activos en el genoma humano ha dado
lugar a enfermedades genticas, ya que interfiere en la expresin normal. Tambin
se observa una predileccin de L1 por regiones ricas en AT.
HERV
Retrovirus endgenos humanos. Los retrovirus son virus cuyo genoma est
compuesto por ARN, capaces de retro transcribirse e integrar su genoma en el de la
clula infectada. As, los HERV son copias parciales del genoma de retrovirus
integrados en el genoma humano a lo largo de la evolucin de los vertebrados,
vestigios de antiguas infecciones retrovirales que afectaron a clulas de la lnea
germinal. Algunas estimaciones establecen que hay unas 98.000 secuencias HERV,
mientras que otras afirman que son ms de 400.000. En cualquier caso, se acepta
que en torno al 5-8% del genoma humano est constituido por genomas
antiguamente virales. El tamao de un genoma retroviral completo es de en torno a
6-11 kb, pero la mayora de los HERV son copias incompletas.
Transposones de ADN
Bajo la denominacin de transposones a veces se incluyen los retrotransposones,
tales como los pseudogenes procesados, los SINES y los LINES. En tal caso se
habla de transposones de clase I para hacer referencia a los retrotransposones, y de
clase II para referirse a transposones de ADN, a los que se dedica el presente
apartado.
Variabilidad
Si bien dos seres humanos del mismo sexo comparten un porcentaje elevadsimo
(en torno al 99,9%) de su secuencia de ADN, lo que nos permite trabajar con una
nica secuencia de referencia, pequeas variaciones genmicas fundamentan
buena parte de la variabilidad fenotpica interindividual. Una variacin en el genoma,
por sustitucin, de lesin o insercin, se denomina polimorfismo o alelo gentico. No
todo polimorfismo gentico provoca una alteracin en la secuencia de una protena o
de su nivel de expresin, es decir, muchos son silenciosos y carecen de expresin
fenotpica.
SNPs
La principal fuente de variabilidad en los genomas de dos seres humanos procede
de las variaciones en un slo nucletido, conocidas como SNPs, en las cuales se
han centrado la mayor parte de los estudios. Dada su importancia, en la actualidad
existe un proyecto internacional (International HapMap Project) para catalogar a
gran escala los SNPs del genoma humano. En este contexto, la denominacin de
SNP frecuentemente se restringe a aquellos polimorfismos de un slo nucletido en
los que el alelo menos frecuente aparece en al menos el 1% de la poblacin.
Los SNP son marcadores tetrallicos, dado que en teora en una posicin puede
haber cuatro nucletidos distintos, cada uno de los cuales identificara un alelo; sin
embargo, en la prctica suelen presentar slo dos alelos en la poblacin. Se estima
que la frecuencia de SNPs en el genoma humano es de un SNP cada 500-100 pares
de bases, de los que una parte relevante son polimorfismos codificantes, que
causan la sustitucin de un aminocido por otro en una protena.
Variacin estructural
Este tipo de variaciones se refiere a duplicaciones, inversiones, inserciones o
variantes en el nmero de copias de segmentos grandes del genoma (por lo general
de 1000 nucletidos o ms). Estas variantes implican a una gran proporcin del
genoma, por lo que se piensa que son, al menos, tan importantes como los SNPs.
Aunque an quedan dudas acerca de las causas de este tipo de variantes, cada vez
existe ms evidencia a favor de que es un fenmeno recurrente que todava
continua moldeando y creando nuevas variantes del genoma.
Evolucin
Los estudios de genmica comparada se basan en comparacin de secuencias
genmicas a gran escala, generalmente mediante herramientas bioinformticas.
Dichos estudios permiten ahondar en el conocimiento de aspectos evolutivos de
escala temporal y espacial muy diversa, desde el estudio de la evolucin de los
primeros seres vivos hace miles de millones de aos o las radiaciones filogenticas
en mamferos, hasta el estudio de las migraciones de seres humanos en los ltimos
100.000 aos, que explican la actual distribucin de las distintas razas humanas.
Mapa de las migraciones humanas creado a partir de genmica comparada con los
genomas mitocondriales de individuos actuales. Los nmeros de la leyenda
representan miles de aos antes del presente. La lnea azul rayada delimita el rea
cubierta de hielo o de tundra durante la ltima glaciacin. Las letras englobadas por
crculos indican los halo grupos de ADN mitocondrial; los halo grupos se usan para
definir subpoblaciones genticas, que frecuentemente tienen una correlacin
geogrfica. Los principales halogrupos de ADNmt son: frica: L, L1, L2, L3. Oriente
prximo: J, N. Europa meridional: J, K. Europa (general): H, V. Europa septentrional:
T, U, X. Asia: A, B, C, D, E, F, G (en el dibujo: M est compuesta por C, D, E, y G).
Nativos Americanos: A, B, C, D y a menudo X. Vase el artculo: Haplogrupos de ADN
mitocondrial humano.
Proyecto proteoma humano (PPH): Tras descifrar el cdigo del genoma humano, de
20.000 a 25.000 genes que componen la secuencia de ADN humano, se ha
ampliado la bsqueda, intentando descifrar ahora el proteoma humano, es decir, se
necesita saber el funcionamiento y accin de cada protena, cuya secuencia,
plegamiento y doblamiento viene determinado por cada uno de los genes
determinados mediante el anterior Proyecto Genoma Humano. Adems, el PPH
permite conocer los mecanismos de modificacin postraduccionales de las
protenas, cmo afectan la fosforilacin, glicosilacin, polimerizacin, etc., a los
aspectos fundamentales de su funcionalidad. Tambin se detectan a la funcionalidad
de las protenas aspectos relacionados con la influencia medioambiental o las
relaciones multignicas que se establecen en la mayora de las enfermedades.