Monografia de Geneoma Humano

GENOMA Y
PROTEOMA
HUMANO
Monografa elaborado por :

Loayza Pichardo Xiomara
Miranda Roca Guisel
Laura Bonifacio Jorge
Balbn Meja Karem
Gamarra Puchoc Guadalupe
Curso de Bioqumica
HUANCAYO,
2013
DEDICATORIA
Agradecemos a Dios porque de l siempre sentimos esa fuerza interior que

nos motiv a seguir adelante apartando las espinas de nuestro sendero para
culminar con xito lo que nos propusimos.
A nuestros padres porque en ellos encontramos la fortaleza y proteccin

necesaria para transcurrir el camino de la vida con valores y aspiraciones
para encontrar el xito en nuestro presente y futuro. A nuestra profesora
porque de ella adquirimos todos los conocimientos necesarios para poder
realizar esta monografa.
indice
INTRODUCCION
La gentica molecular y los diversos aspectos derivados (clonacin, investigacin
con clulas madre) es una de las reas de investigacin ms emergentes en los
ltimos aos. No obstante es bastante amplio el desconocimiento real sobre su
significado y, sobre todo, de las verdaderas posibilidades de dicho campo de
investigacin. El presente trabajo supone una puesta al da sobre gentica general,
gentica molecular y sobre los diversos aspectos de la clonacin y de las
posibilidades futuras que de todo ello se deriva.
Asimismo tampoco debemos ser en la actualidad desmesuradamente optimistas en

relacin al estado actual de las investigaciones en este campo. Queda todava
mucho que recorrer (y muchos aos de investigacin) para poder iniciar siquiera la
teraputica y la curacin de enfermedades que se derivarn de dichos estudios.
Para apoyar las posibles aplicaciones futuras de la gentica molecular describir

algunas enfermedades de origen parcial o totalmente gentico y expondr las
aplicaciones teraputicas que algn da podrn resolver dichas alteraciones. Estas
enfermedades citadas anteriormente son el autismo y la enfermedad de Huntington.
HISTORIA DE LA GENETICA
4. GREGOR MENDEL
El ncleo de sus trabajos le permiti descubrir las tres leyes de la herencia o

leyes de Mendel, gracias a las cuales es posible describir los mecanismos de la
herencia y que fueron explicadas con posterioridad por el padre de la gentica
experimental moderna, el bilogo estadounidense Thomas Hunt Morgan (1866-
1945).
Estas tres leyes son:
1. PRIMERA LEY:
Cuando se cruzan dos variedades puras de una misma especie, los

descendientes sern todos iguales y pueden parecerse a alguno de sus
progenitores.
2. SEGUNDA LEY:
Al cruzar entre s los hbridos de la segunda generacin, los descendientes

se dividen en cuatro grupos, de los cuales uno se parece a su abuela, otro a
su abuelo y las otras dos restantes a sus progenitores.
3. TERCERA LEY:
Concluye diciendo que si se cruzan razas distintas en uno o ms alelos

(cada una de las modificaciones de un gen producidas por mutacin), estos
son independientes o ligados y siguen las dos primeras leyes de Mendel.
Cada uno de los caracteres hereditarios se transmite al hijo con total
independencia de los restantes. En el cuadro que tenemos a continuacin
se puede observar la descendencia de cruzar dos semillas iguales
(amarillas y lisas). 1
1 AUFFRAY Charles. EL GENOMA HUMANO, 2004

Al observar el resultado de sus experimentos, Mendel pudo deducir que si se
cruzan dos razas diferentes al menos en dos caracteres, se pueden crear
nuevas razas estables (combinaciones nuevas homocigticas).
4.2 ROSALIND FRANKLIN
En 1953, la revista britnica Nature publica un artculo elaborado por cuatro

cientficos notables: Francis Crick, James B. Watson, Maurice Wilkins y Rosalind
Franklin. En ese artculo, sus autores explican el funcionamiento del cido
desoxirribonucleico (ADN), donde est contenida toda la informacin gentica.
Este trabajo se tendr en cuenta luego, a la hora de otorgar el Nobel de
Fisiologa y Medicina. Pero cuando esto ocu rre, el galardn slo consider a los
tres cientficos varones. El nombre de Rosalind Franklin no figur en el grupo
premiado. Para entonces, ella haba muerto de cncer, en 1958, a la edad de 38
aos.
Rosalind Franklin fue la primera mujer que contribuy en el descubrimiento del

cido desoxirribonucleico, a pesar de eso no fue reconocida hasta muchos aos
despus. Actualmente todava no se ha reconocido del todo la gran labor de esta
mujer, ya que cuando pensamos en los descubridores del ADN siempre
pensamos en Watson y Crick.2
2 APARISI MIRALLES, ngela - 1997

4.3 JAMES WATSON Y FRANCIS CRICK
4.3.1 JAMES WATSON
Fue uno de los mayores impulsores del proyecto Genoma Humano que
representa un importante avance para la curacin de enfermedades de
origen gentico. Sus trabajos se basan mayormente en el estudio del
ADN, campo en el que colabor con Crick en el descubrimiento de la
estructura de la doble hlice del ADN y en el estudio de la replicacin de
ste. Cuando volvi a estados Unidos, colabor en trabajos que le
permitieron descifrar el cdigo gentico y descubrir la presencia del ARN
mensajero, que hace la funcin de intermediario entre el ADN y la sntesis
de las protenas. Gan un Premio Nobel (compartido con Crick y Wilkins).
4.3.2 FRANCIS CRACK
Se especializ en el estudio de los genes y desarroll un mtodo para

saber si una imagen de rayos X remita a una estructura helicoidal. Junto
con James Watson se especializ en el estudio del ADN. Consiguieron
sentar las bases de diversos estudios posteriores al conocer el modo en
el que se replican los genes, adems de confirmar que son portadores de
informacin. Juntos descubrieron el principio molecular de doble hlice
para el ADN. Consigui el Premio Nobel. Luego sus investigaciones
siguieron encaminadas hacia el estudio de los cidos nucleicos
relacionados con el cdigo de la herencia.
4.3.3 EL MODELO DE WATSON Y CRACK
En 1953, Watson y Crick propusieron el modelo que establece las bases

de la molcula responsable de contener toda la informacin gentica de
cualquier ser vivo, esto es una estructura tridimensional llamada cido
desoxirribonucleico (ADN).
La doble hlice propuesta por James Watson y Francis Crick, permiti dar
la respuesta a los interrogantes que de la estructura y los mecanismos de
la herencia.
Descubrieron que el ADN est formado por unidades qumicas, llamadas
nucletidos, formados por cuatro bases nitrogenadas distintas, las cuales
son, Adenina (A), Guanina (G), Citosina (C) y Timina (T), por un azcar
(ribosa o desoxirribosa) y por una molcula de cido fosfrico. Las bases
nitrogenadas se alinean para luego juntarse con la otra cadena igual para
formar la doble hlice (A se junta con T y G con C). Es mucha la
importancia del orden de los nucletidos ya que determina las protenas,
responsables de la estructura y funcionamiento de cada clula de todos y
cada uno de los seres vivos de este planeta. Cuando estas dos cadenas
se separan, cada una sirve como molde para la construccin de una
complementaria; as, una molcula de ADN dividida puede formar dos de
su mismo tipo. Gracias a esta duplicacin de las molculas de ADN se
puede transmitir la informacin gentica a los siguientes descendentes, y
as sucesivamente.
Para poder definir el modelo se apoyaron en gran parte en los rayos X

que haba obtenido Rosalind Franklin anteriormente.
Gracias al descubrimiento de todos los cientficos que han trabajado en el

genoma humano podemos encontrar textos, los cuales nos hablan de
quienes somos, de dnde venimos y tal vez tambin a dnde vamos. 3
LA GENTICA : ADN Y ARN
DEFINICION Y ESTRUCTURA DEL ADN:
3 Rafael Oliva Virgili, Jos Manuel Vidal Taboada - 2006

La molcula de ADN (cido desoxirribonucleico) est formada por dos largas
cadenas de nucletidos (compuestos formados por una base nitrogenada, un
azcar y un fosfato y forman los cidos nucleicos) unida entre s formando una
doble hlice. Estas dos cadenas de nucletidos, que forman una molcula de
ADN, quedan unidas entre s, gracias a los enlaces que se forman entre las
bases nitrogenadas (A, G, T, C) de ambas cadenas que quedan enfrentadas .
La unin se realiza mediante puentes de hidrgeno (se forman cuando un

tomo de hidrgeno se encuentra entre dos tomos ms electronegativos,
estableciendo un vnculo entre ellos). Y est condicionado qumicamente de
forma que la Adenina slo se puede unir con la Timina, y la Guanina slo con la
Citosina.
La estructura de un ADN est definida por la "secuencia" de las bases

nitrogenadas, estando precisamente en esta secuencia de bases nitrogenadas
la informacin gentica del ADN. Un cierto nmero de secuencias de bases
nitrogenadas constituirn los distintos genes que regirn la formacin de
protenas y otras actividades estructurales y enzimticas necesarias para la
vida. El orden en el que aparecen las cuatro bases es muy importante para la
clula ya que es el que constituye las instrucciones del programa gentico de
cada organismo.4
3.2REPLICACIN DEL ADN
4 AUFFRAY Charles. EL GENOMA HUMANO: Una explicacin para comprender.

2004.
Es la capacidad que tiene el ADN de hacer copias o rplicas de su molcula.
Este proceso es imprescindible para la transferencia de la informacin gentica
de generacin en generacin.
El procedimiento que se sigue es el siguiente: la doble hlice se separa y cada

una de las cadenas sirve de molde para la creacin de una nueva cadena
complementaria. El resultado final de este proceso son dos molculas idnticas
a la original.5
3.3 DEFINICIN Y ESTRUCTURA DEL ARN
El ARN es prcticamente igual que el ADN, pero se diferencia qumicamente

del ADN en:
a. La molcula del ARN contiene como azcar la ribosa (ADN desoxirribosa)
b. El ARN contiene la base uracilo en lugar de la timina del ADN.
Hay tres tipos distintos de ARN, estos son:
ARN mensajero (ARNm)
Participa en el transporte de la informacin de una cadena del ADN,

desde el ncleo, para generar una cadena de ARN (en el citoplasma). A
este proceso se le llama TRANSCRIPCIN. La nueva cadena de ARN
es complementaria a la de ADN, substituyendo la timina por el uracilo.
ARN ribosmico (ARNr):
5 Rafael Oliva Virgili, Jos Manuel Vidal Taboada. GENOMA HUMANO - 2006
Participa en la constitucin de unos orgnulos citoplasmticos
(ribosomas) y en el paso de la informacin del ARN a protena, llamado
TRADUCCIN. La protena se elabora segn la secuencia de
nucletidos asociada al cdigo gentico.
ARN de transferencia (ARNt)
Participa en el transporte de aminocidos que corresponden a los

diversos nucletidos segn el cdigo gentico, incorporndolos en el
orden correcto. Una mala lectura o un error en la serie de nucletidos es
lo que origina las mutaciones. La secuencia de aminocidos constituirn
las protenas.
Los tres tipos de ARN se forman a medida que son necesarios, utilizando
como plantilla secciones determinadas del ADN celular.
Normalmente las bases del ARN se juntan de la siguiente manera: A-U y G-

C, aunque de vez en cuando tambin se pueden juntar de la manera G-U. 6
EL GENOMA HUMANO
6 Jean Franois Mattei - 2002

El genoma humano es toda la informacin que cada individuo tiene almacenado en
el ADN de las clulas. Cada persona es diferente respecto a las dems y cada una
tiene su propio genoma, el cual tiene una gran similitud (99,8%) respecto a los de su
propia especie y tan solo se diferencia en el del chimpanc en un 1%. El genoma es
el que nos hace ser nicos e independientes de todos los dems.
Contiene las instrucciones que caracterizan el aspecto fsico de cada persona y, en

gran parte, las psicolgicas e intelectuales.
Actualmente se ha conseguido descifrar el 99% de este cdigo, gracias a dos

grandes empresas; una pblica (Proyecto Genoma Humano, subvencionada con
fondos pblicos de diversos pases), y otra privada (Celera Genomics, San
Francisco).
El genoma humano es el genoma del Homo sapiens, es decir, la secuencia de ADN

contenida en 23 pares de cromosomas en el ncleo de cada clula humana diploide.
De los 23 pares, 22 son cromosomas autosmicos y un par determinante del sexo

(dos cromosomas X en mujeres y uno X y uno Y en hombres). El genoma haploide
(es decir, con una sola representacin de cada par) tiene una longitud total
aproximada de 3200 millones de pares de bases de ADN (3200 Mb) que contienen
unos 20.000-25.000 genes[] (las estimaciones ms recientes apuntan a unos
20.500). De las 3200 Mb unas 2950 Mb corresponden a eucromatina y unas 250 Mb
a heterocromatina. El Proyecto Genoma Humano produjo una secuencia de
referencia del genoma humano eucromtico, usado en todo el mundo en las ciencias
biomdicas.
La secuencia de ADN que conforma el genoma humano contiene codificada la

informacin necesaria para la expresin, altamente coordinada y adaptable al
ambiente, del proteoma humano, es decir, del conjunto de las protenas del ser
humano. Las protenas, y no el ADN, son las principales biomolculas efectoras;
poseen funciones estructurales, enzimticas, metablicas, reguladoras,
sealizadoras, organizndose en enormes redes funcionales de interacciones.
En definitiva, el proteoma fundamenta la particular morfologa y funcionalidad de

cada clula. Asimismo, la organizacin estructural y funcional de las distintas clulas
conforma cada tejido y cada rgano, y, finalmente, el organismo vivo en su conjunto.
As, el genoma humano contiene la informacin bsica necesaria para el desarrollo
fsico de un ser humano completo.
El genoma humano presenta una densidad de genes muy inferior a la que

inicialmente se haba predicho, con slo en torno al 1,5% [] de su longitud compuesta
por exones codificantes de protenas. Un 70% est compuesto por ADN extragnico
y un 30 % por secuencias relacionadas con genes. Del total de ADN extragnico,
aproximadamente un 70% corresponde a repeticiones dispersas, de manera que,
ms o menos, la mitad del genoma humano corresponde a secuencias repetitivas de
ADN. Por su parte, del total de ADN relacionado con genes se estima que el 95%
corresponde a ADN no codificante: pseudogenes, fragmentos de genes, intrones o
secuencias UTR, entre otros.
En el genoma humano se detectan ms de 280.000 elementos reguladores,

aproximadamente un total de 7Mb de secuencia, que se originaron por medio de
inserciones de elementos mviles. Estas regiones reguladoras se conservan en
elementos no exnicos (CNEEs), fueron nombrados como: SINE, LINE, LTR. Se
sabe que al menos entre un 11% y un 20% de estas secuencias reguladoras de
genes, y que estn conservados entre especies, fue formado por elementos mviles.
Contenido en genes y tamao del genoma de varios organismo
Tamao del Nmero

Especie
genoma (Mb) de genes
Candidatus Carsonella ruddii 0,15 182
Streptococcus pneumoniae 2,2 2300
Escherichia coli 4,6 4.400
Saccharomyces cerevisiae 12 5.800
Caenorhabditis elegans 97 19.000
Arabidopsis thaliana 125 25.500
Drosophila melanogaster (mosca) 180 13.700
Oryza sativa (arroz) 466 45-55.000
Mus musculus (ratn) 2500 29.000
Homo sapiens (ser humano) 2900 27.000
COMPONENTES:
Cromosomas
El genoma humano (como el de cualquier organismo eucariota) est formado por

cromosomas, que son largas secuencias continuas de ADN altamente organizadas
espacialmente (con ayuda de protenas histnicas y no histnicas) para adoptar una
forma ultra condensada en metafase. Son observables con microscopa ptica
convencional o de fluorescencia mediante tcnicas de citogentica y se ordenan
formando un cariotipo.
El cariotipo humano normal contiene un total de 23 pares de cromosomas distintos:

22 pares de autosomas ms 1 par de cromosomas sexuales que determinan el sexo
del individuo. Los cromosomas 1-22 fueron numerados en orden decreciente de
tamao en base al cariotipo. Sin embargo, posteriormente pudo comprobarse que el
cromosoma 22 es en realidad mayor que el 21.
Representacin grfica del cariotipo humano normal.
Las clulas somticas de un organismo poseen en su ncleo un total de 46

cromosomas (23 pares): una dotacin de 22 autosomas procedentes de cada
progenitor y un par de cromosomas sexuales, un cromosoma X de la madre y un X o
un Y del padre. Los gametos -vulos y espermatozoides- poseen una dotacin
haploide de 23 cromosomas.
Cromosoma Genes Nmero de bases Bases secuenciadas

1 4.220 247.199.719 224.999.719
2 1.491 242.751.149 237.712.649
3 1.550 199.446.827 194.704.827
4 446 191.263.063 187.297.063
5 609 180.837.866 177.702.766
6 2.281 170.896.993 167.273.993
7 2.135 158.821.424 154.952.424
8 1.106 146.274.826 142.612.826
9 1.920 140.442.298 120.312.298
10 1.793 135.374.737 131.624.737
11 379 134.452.384 131.130.853
12 1.430 132.289.534 130.303.534
Cromosoma Genes Nmero de bases Bases secuenciadas
13 924 114.127.980 95.559.980
14 1.347 106.360.585 88.290.585
15 921 100.338.915 81.341.915
16 909 88.822.254 78.884.754
17 1.672 78.654.742 77.800.220
18 519 76.117.153 74.656.155
19 1.555 63.806.651 55.785.651
20 1.008 62.435.965 59.505.254
21 578 46.944.323 34.171.998
22 1.092 49.528.953 34.893.953
X (cromosoma sexual) 1.846 154.913.754 151.058.754
Y (cromosoma sexual) 454 57.741.652 25.121.652
Total 32.185 3.079.843.747 2.857.698.560
ADN intragnico
Genes
Un gen es la unidad bsica de la herencia, y porta la informacin gentica necesaria
para la sntesis de una protena (genes codificantes) o de un ARN no codificante
(genes de ARN). Est formado por una secuencia promotora, que regula su
expresin, y una secuencia que se transcribe, compuesta a su vez por: secuencias
UTR (regiones flanqueantes no traducidas), necesarias para la traduccin y la
estabilidad del ARN, exones (codificantes) e intrones, que son secuencias de ADN
no traducidas situadas entre dos exones que sern eliminadas en el procesamiento
del ARN (ayuste).
Actualmente se estima que el genoma humano contiene entre 20.000 y 25.000

genes codificantes de protenas, estimacin muy inferior a las predicciones iniciales
que hablaban de unos 100.000 genes o ms. Esto implica que el genoma humano
tiene menos del doble de genes que organismos eucariotas mucho ms simples,
como la mosca de la fruta o el nematodo Caenorhabditis elegans. Sin embargo, las
clulas humanas recurren ampliamente al splicing (ayuste) alternativo para producir
varias protenas distintas a partir de un mismo gen, como consecuencia de lo cual el
proteoma humano es ms amplio que el de otros organismos mucho ms simples.
En la prctica, el genoma tan slo porta la informacin necesaria para una expresin
perfectamente coordinada y regulada del conjunto de protenas que conforman el
proteoma, siendo ste el encargado de ejecutar la mayor parte de las funciones
celulares.
Con base en los resultados iniciales arrojados por el proyecto ENCODE[] (acrnimo
de Enciclopedia Of DNA Elements), algunos autores han propuesto redefinir el
concepto actual de gen. Las observaciones ms recientes hacen difcilmente
sostenible la visin tradicional de un gen, como una secuencia formada por las
regiones UTRs, los exones y los intrones. Estudios detallados han hallado un
nmero de secuencias de inicio de transcripcin por gen muy superior a las
estimaciones iniciales, y algunas de estas secuencias se sitan en regiones muy
alejadas de la traducida, por lo que los UTR 5' pueden abarcar secuencias largas
dificultando la delimitacin del gen. Por otro lado, un mismo transcrito puede dar
lugar a ARN maduros totalmente diferentes (ausencia total de solapamiento), debido
a una gran utilizacin del splicing alternativo. De este modo, un mismo transcrito
primario puede dar lugar a protenas de secuencia y funcionalidad muy dispar. En
consecuencia, algunos autores han propuesto una nueva definicin de gen: [] [] la
unin de secuencias genmicas que codifican un conjunto coherente de productos
funcionales, potencialmente solapantes. De este modo, se identifican como genes
los genes ARN y los conjuntos de secuencias traducidas parcialmente solapantes
(se excluyen, as, las secuencias UTR y los intrones, que pasan a ser considerados
como "regiones asociadas a genes", junto con los promotores). De acuerdo con esta
definicin, un mismo transcrito primario que da lugar a dos transcritos secundarios (y
dos protenas) no solapantes debe considerarse en realidad dos genes diferentes,
independientemente de que estos presenten un solapamiento total o parcial de sus
transcritos primarios.
Las nuevas evidencias aportadas por ENCODE, segn las cuales las regiones UTR
no son fcilmente delimitables y se extienden largas distancias, obligaran a re
identificar nuevamente los genes que en realidad componen el genoma humano. De
acuerdo con la definicin tradicional (actualmente vigente), sera necesario
identificar como un mismo gen a todos aquellos que muestren un solapamiento
parcial (incluyendo las regiones UTR y los intrones), con lo que a la luz de las
nuevas observaciones, los genes incluiran mltiples protenas de secuencia y
funcionalidad muy diversa. Colateralmente se reducira el nmero de genes que
componen el genoma humano. La definicin propuesta, en cambio, se fundamenta
en el producto funcional del gen, por lo que se mantiene una relacin ms coherente
entre un gen y una funcin biolgica. Como consecuencia, con la adopcin de esta
nueva definicin, el nmero de genes del genoma humano aumentar
significativamente.
Genes de ARN
Adems de los genes codificantes de protenas, el genoma humano contiene varios
miles de genes ARN, cuya transcripcin reproduce ARN de transferencia (ARNt),
ARN ribosmico (ARNr), microARN (miARN), u otros genes ARN no codificantes.
Los ARN ribosmico y de transferencia son esenciales en la constitucin de los
ribosomas y en la traduccin de las protenas. Por su parte, los microARN tienen
gran importancia en la regulacin de la expresin gnica, estimndose que hasta un
20-30% de los genes del genoma humano puede estar regulado por el mecanismo
de interferencia por miARN. Hasta el momento se han identificado ms de 300
genes de miARN y se estima que pueden existir unos 500-
Distribucin de genes
A continuacin se muestran algunos valores promedio del genoma humano. Cabe
advertir, sin embargo, que la enorme heterogeneidad que presentan estas variables
hace poco representativos a los valores promedio, aunque tienen valor orientativo.
La densidad media de genes es de 1 gen cada 100 kb, con un tamao medio de 20-
30 kb, y un nmero de exones promedio de 7-8 por cada gen, con un tamao medio
de 150 nucletidos. El tamao medio de un ARNm es de 1,8-2,2 kb, incluyendo las
regiones UTR (regiones no traducidas flanqueantes), siendo la longitud media de la
regin codificante de 1,4 kb.
Isocoros. Frecuencia y riqueza en G+C y genes, en el genoma humano.
El genoma humano se caracteriza por presentar una gran heterogeneidad en su

secuencia. En particular, la riqueza en bases de guanina (G) y citosina (C) frente a
las de adenina (A) y timina (T) se distribuye heterogneamente, con regiones muy
ricas en G+C flanqueadas por regiones muy pobres, siendo el contenido medio de
G+C del 41%, menor al tericamente esperado (50%). Dicha heterogeneidad esta
correlacionada con la riqueza en genes, de manera que los genes tienden a
concentrarse en las regiones ms ricas en G+C. Este hecho era conocido ya desde
hace aos gracias a la separacin mediante centrifugacin en gradiente de densidad
de regiones ricas en G+C (que recibieron el nombre de iscoros H; del ingls High) y
regiones ricas en A+T
Secuencias reguladoras
El genoma tiene diversos sistemas de regulacin de la expresin gnica, basados
en la regulacin de la unin de factores de transcripcin a las secuencias
promotoras, en mecanismos de modificacin epigentica (metilacin del ADN o
metilacin-acetilacin de histonas) o en el control de la accesibilidad a los
promotores determinada por el grado de condensacin de la cromatina; todos ellos
muy interrelacionados. Adems hay otros sistemas de regulacin a nivel del
procesamiento, estabilidad y traduccin del ARNm, entre otros. Por lo tanto, la
expresin gnica est intensamente regulada, lo cual permite desarrollar los
mltiples fenotipos que caracterizan los distintos tipos celulares de un organismo
eucariota multicelular, al mismo tiempo que dota a la clula de la plasticidad
necesaria para adaptarse a un medio cambiante. No obstante, toda la informacin
necesaria para la regulacin de la expresin gnica, en funcin del ambiente celular,
est codificada en la secuencia de ADN al igual que lo estn los genes.
Las secuencias reguladoras son tpicamente secuencias cortas presentes en las

proximidades o en el interior (frecuentemente en intrones) de los genes. En la
actualidad, el conocimiento sistemtico de estas secuencias y de cmo actan en
complejas redes de regulacin gnica, sensibles a seales exgenas, es muy
escaso y est comenzando a desarrollarse mediante estudios de genmica
comparada, bioinformtica y biologa de sistemas. La identificacin de secuencias
reguladoras se basa en parte en la bsqueda de regiones no codificantes
evolutivamente conservadas.[] Por ejemplo, la divergencia evolutiva entre el ratn y
el ser humano ocurri hace 70-90 millones de aos. [] Mediante estudios de
genmica comparada, alineando secuencias de ambos genomas pueden
identificarse regiones con alto grado de coincidencia, muchas correspondientes a
genes y otras a secuencias no codificantes de protenas pero de gran importancia
funcional, dado que han estado sometidas a presin selectiva.
Elementos ultra conservados

Reciben este nombre regiones que han mostrado una constancia evolutiva casi total,
mayor incluso que las secuencias codificantes de protenas, mediante estudios de
genmica comparada. Estas secuencias generalmente se solapan con intrones de
genes implicados en la regulacin de la transcripcin o en el desarrollo embrionario
y con exones de genes relacionados con el procesamiento del ARN. Su funcin es
generalmente poco conocida, pero probablemente de extrema importancia dado su
nivel de conservacin evolutiva, tal y como se ha expuesto en el punto anterior.
En la actualidad se han encontrado unos 500 segmentos de un tamao mayor a 200

pares de bases totalmente conservados (100% de coincidencia) entre los genomas
de humano, ratn y rata, y casi totalmente conservados en perro (99%) y pollo
(95%).[]
Pseudogenes
En el genoma humano se han encontrado asimismo unos 19.000 pseudogenes, que
son versiones completas o parciales de genes que han acumulado diversas
mutaciones y que generalmente no se transcriben. Se clasifican en pseudogenes no
procesados (~30%) y pseudogenes procesados (~70%) []
Los pseudogenes no procesados son copias de genes generalmente

originadas por duplicacin, que no se transcriben por carecer de una
secuencia promotora y haber acumulado mltiples mutaciones, algunas de las
cuales sin sentido (lo que origina codones de parada prematuros). Se
caracterizan por poseer tanto exones como intrones.
Los pseudogenes procesados, por el contrario, son copias de ARN mensajero

retro transcritas e insertadas en el genoma. En consecuencia carecen de
intrones y de secuencia promotora.
ADN intergnico
Las regiones intergnicas o extragnicas comprenden la mayor parte de la

secuencia del genoma humano, y su funcin es generalmente desconocida. Buena
parte de estas regiones est compuesta por elementos repetitivos, clasificables
como repeticiones en tndem o repeticiones dispersas, aunque el resto de la
secuencia no responde a un patrn definido y clasificable. Gran parte del ADN
intergnico puede ser un artefacto evolutivo sin una funcin determinada en el
genoma actual, por lo que tradicionalmente estas regiones han sido denominadas
ADN "basura" (Junk DNA), denominacin que incluye tambin las secuencias
intrnicas y pseudogenes. No obstante, esta denominacin no es la ms acertada
dado el papel regulador conocido de muchas de estas secuencias. Adems el
notable grado de conservacin evolutiva de algunas de estas secuencias parece
indicar que poseen otras funciones esenciales an desconocidas o poco conocidas.
Por lo tanto, algunos prefieren denominarlo "ADN no codificante" (aunque el llamado
"ADN basura" incluye tambin transposones codificantes) o "ADN repetitivo".
Algunas de estas regiones constituyen en realidad genes precursores para la
sntesis te microARN (reguladores de la expresin gnica y del silenciamiento
gnico).
Estudios recientes enmarcados en el proyecto ENCODE han obtenido resultados

sorprendentes, que exigen la reformulacin de nuestra visin de la organizacin y la
dinmica del genoma humano. Segn estos estudios, el 15% de la secuencia del
genoma humano se transcribe a ARN maduros, y hasta el 90% se transcribe al
menos a transcritos inmaduros en algn tejido: [] As, una gran parte del genoma
humano codifica genes de ARN funcionales. Esto es coherente con la tendencia de
la literatura cientfica reciente a asignar una importancia creciente al ARN en la
regulacin gnica. Asimismo, estudios detallados han identificado un nmero mucho
mayor de secuencias de inicio de transcripcin por gen, algunas muy alejadas de la
regin prxima a la traducida. Como consecuencia, actualmente resulta ms
complicado definir una regin del genoma como gnica o intergnica, dado que los
genes y las secuencias relacionadas con los genes se extienden en las regiones
habitualmente consideradas intergnicas.
ADN repetido en tndem
Son repeticiones que se ordenan de manera consecutiva, de modo que secuencias

idnticas, o casi, se disponen unas detrs de otras.
Satlites
El conjunto de repeticiones en tndem de tipo satlite comprende un total de 250 Mb
del genoma humano. Son secuencias de entre 5 y varios cientos de nucletidos que
se repiten en tndem miles de veces generando regiones repetidas con tamaos
que oscilan entre 100 kb (100.000 nucletidos) hasta varias megas bases.
Reciben su nombre de las observaciones iniciales de centrifugaciones en gradiente

de densidad del ADN genmico fragmentado, que reportaban una banda principal
correspondiente a la mayor parte del genoma y tres bandas satlite de menor
densidad. Esto se debe a que las secuencias satlite tienen una riqueza en
nucletidos A+T superior a la media del genoma y en consecuencia son menos
densas.
Hay principalmente 6 tipos de repeticiones de ADN satlite []
1. Satlite 1: secuencia bsica de 42 nucletidos. Situado en los centrmeros de

los cromosomas 3 y 4 y el brazo corto de los cromosomas acrocntricos (en
posicin distal respecto al clster codificante de ARNr).
2. Satlite 2: la secuencia bsica es ATTCCATTCG. Presente en las
proximidades de los centrmeros de los cromosomas 2 y 10, y en la
constriccin secundaria de 1 y 16.
3. Satlite 3: la secuencia bsica es ATTCC. Presente en la constriccin

secundaria de los cromosomas 9 e Y, y en posicin proximal respecto al
clster de ADNr del brazo corto de los cromosomas acrocntricos.
4. Satlite alfa: secuencia bsica de 171 nucletidos. Forma parte del ADN de
los centrmeros cromosmicos.
5. Satlite beta: secuencia bsica de 68 nucletidos. Aparece en torno al

centrmero en los cromosomas acrocntricos y en la constriccin secundaria
del cromosoma 1.
6. Satlite gamma: secuencia bsica de 220 nucletidos. Prximo al

centrmero de los cromosomas 8 y X.
Mini satlites
Estn compuestas por una unidad bsica de secuencia de 6-25 [] nucletidos que se
repite en tndem generando secuencias de entre 100 y 20.000 pares de bases. Se
estima que el genoma humano contiene unos 30.000 mini satlites.
Diversos estudios han relacionado los mini satlites con procesos de regulacin de
la expresin gnica. Asimismo, se han asociado con puntos de fragilidad
cromosmica dado que se sitan prximos a lugares preferentes de rotura
cromosmica, translocacin gentica y recombinacin meitica. Por ltimo, algunos
mini satlites humanos (-10%) son impermutables, presentando una tasa media de
mutacin entre el 0.5% y el 20% en las clulas de la lnea germinal, siendo as las
regiones ms inestables del genoma humano conocidas hasta la fecha.
En el genoma humano, aproximadamente el 90% de los mini satlites se sitan en

los telmeros de los cromosomas. La secuencia bsica de seis nucletidos TTAGGG
se repite miles de veces en tndem, generando regiones de 5-20 kb que conforman
los telmeros.
Algunos mini satlites por su gran inestabilidad presentan una notable variabilidad
entre individuos distintos. Se consideran polimorfismos multiallicos, dado que
pueden presentarse en un nmero de repeticiones muy variable, y se denominan
VNTR. Son marcadores muy utilizados en gentica forense, ya que permiten
establecer una huella gentica caracterstica de cada individuo, y son identificables
mediante hibridacin.
Micros satlites
Estn compuestos por secuencias bsicas de 2-4 nucletidos, cuya repeticin en
tndem origina frecuentemente secuencias de menos de 150 nucletidos. Algunos
ejemplos importantes son el di nucletido CA y el trinucletido CAG.
Los micro satlites son tambin polimorfismos multiallicos, denominados STR y
pueden identificarse mediante PCR, de modo rpido y sencillo. Se estima que el
genoma humano contiene unos 200.000 micro satlites, que se distribuyen ms o
menos homogneamente, al contrario que los mini satlites, lo que los hace ms
informativos como marcadores.
ADN repetido disperso

Son secuencias de ADN que se repiten de modo disperso por todo el genoma,
constituyendo el 45% del genoma humano. Los elementos cuantitativamente ms
importantes son los LINES y SINES, que se distinguen por el tamao de la unidad
repetida.
Estas secuencias tienen la potencialidad de auto propagarse al transcribirse a una

ARNm intermediario, retro transcribirse e insertarse en otro punto del genoma. Este
fenmeno se produce con una baja frecuencia, estimndose que 1 de cada 100-200
neonatos portan una insercin nueva de un Alu o un L1, que pueden resultar
patognicos por muta gnesis insercional, por desregulacin de la expresin de
genes prximos (por los propios promotores de los SINE y LINE) o por
recombinacin ilegtima entre dos copias idnticas de distinta localizacin
cromosmica (recombinacin intra o intercromosmica), especialmente entre
elementos Alu.
Frecuencias y tipos de repeticiones dispersas en el genoma de varios organismos []
Homo Drosophila Caenorhabditis Arabidopsis

Tipo repeticin
sapiens melanogaster elegans thaliana
LINE,SINE 33,4% 0,7% 0,4% 0,5%
LTR/HERV 8,1% 1,5% 0% 4,8%
Transposones ADN 2,8% 0,7% 5,3% 5,1%
Total 44,4% 3,1% 6,5% 10,4%
SINE
Elementos nucleares dispersos cortos. Son secuencias cortas, generalmente de
unos pocos cientos de bases, que aparecen repetidas miles de veces en el genoma
humano. Suponen el 13% del genoma humano, [] un 10% debido exclusivamente a la
familia de elementos Alu (caracterstica de primates).
LINE
Los elementos Alu son secuencias de 250-280 nucletidos presentes en

1.500.000[10] de copias dispersas por todo el genoma. Estructuralmente son dmeros
casi idnticos, excepto que la segunda unidad contiene un inserto de 32 nucletidos,
siendo mayor que la primera. En cuanto a su secuencia, tienen una considerable
riqueza en G+C (56%),[] por lo que predominan en las bandas R, y ambos
monmeros presentan una cola poli A (secuencia de adeninas) vestigio de su origen
de ARNm. Adems poseen un promotor de la ARN polimerasa III para transcribirse.
Se consideran retrotransposones no autnomos, ya que dependen para propagarse
de la retro transcripcin de su ARNm por una retro transcriptasa presente en el
medio.
Elementos nucleares dispersos largos. Constituyen el 20% del genoma humano,

contiene unos 100.000-500.000 copias de retrotransposones L1 que es la familia de
mayor importancia cuantitativa, es una secuencia de 6 kb repetida unas 800.000
veces de modo disperso por todo el genoma, aunque la gran mayora de las copias
es incompleta al presentar el extremo 5' truncado por una retro transcripcin
incompleta. As, se estima que hay unas 5.000 copias completas de L1, slo 90 de
las cuales son activas,[] estando el resto inhibidas por metilacin de su promotor.
Su riqueza en G+C es del 42%, prxima a la media del genoma (41%) y se localizan
preferentemente en las bandas G de los cromosomas. Poseen adems un promotor
de la ARN polimerasa II.
Los elementos LINE completos son codificantes. En concreto LINE-1 codifica dos
protenas:
1. Protena de unin a ARN (RNA-binding protein): codificada por el marco de

lectura abierto 1 ORF1
2. Enzima con actividad retro transcriptasa y endonucleasa: codificada por el

ORF2. Ambas protenas son necesarias para la retro transposicin.
Estos elementos mviles estn flanqueados por 2 regiones no codificantes,

denominados como 5UTR y 3UTR.
Por lo tanto, se consideran retrotransopsones autnomos, ya que codifican las

protenas que necesitan para propagarse. La ARN polimerasa II presente en el
medio transcribe el LINE, y este ARNm se traduce en ambos marcos de lectura
produciendo una retro transcriptasa que acta sobre el ARNm generando una copia
de ADN del LINE, potencialmente capaz de insertarse en el genoma. Asimismo
estas protenas pueden ser utilizadas por pseudogenes procesados o elementos
SINE para su propagacin.
La transcripcin se inicia en un promotor interno del extremo 5UTR. La

endonucleasa de L1 genera una mella en una nica cadena del ADN genmico, en
una secuencia consenso 5TTTTT/A3.
Diversos estudios han mostrado que las secuencias LINE pueden tener importancia
en la regulacin de la expresin gnica, habindose comprobado que los genes
prximos a LINE presentan un nivel de expresin inferior. Esto es especialmente
relevante porque aproximadamente el 80% de los genes del genoma humano
contiene algn elemento L1 en sus intrones. [
Se ha visto que la insercin aleatoria de L1 activos en el genoma humano ha dado
lugar a enfermedades genticas, ya que interfiere en la expresin normal. Tambin
se observa una predileccin de L1 por regiones ricas en AT.
HERV
Retrovirus endgenos humanos. Los retrovirus son virus cuyo genoma est
compuesto por ARN, capaces de retro transcribirse e integrar su genoma en el de la
clula infectada. As, los HERV son copias parciales del genoma de retrovirus
integrados en el genoma humano a lo largo de la evolucin de los vertebrados,
vestigios de antiguas infecciones retrovirales que afectaron a clulas de la lnea
germinal. Algunas estimaciones establecen que hay unas 98.000 secuencias HERV,
mientras que otras afirman que son ms de 400.000. En cualquier caso, se acepta
que en torno al 5-8% del genoma humano est constituido por genomas
antiguamente virales. El tamao de un genoma retroviral completo es de en torno a
6-11 kb, pero la mayora de los HERV son copias incompletas.
A lo largo de la evolucin estas secuencias sin inters para el genoma hospedador

han ido acumulando mutaciones sin sentido y de lesiones que los han inactivado.
Aunque la mayora de las HERV tienen millones de aos de antigedad, al menos
una familia de retrovirus se integr durante la divergencia evolutiva de humanos y
chimpancs, la familia HERV-K(HML2), que supone en torno al 1% de los HERV.
Transposones de ADN
Bajo la denominacin de transposones a veces se incluyen los retrotransposones,
tales como los pseudogenes procesados, los SINES y los LINES. En tal caso se
habla de transposones de clase I para hacer referencia a los retrotransposones, y de
clase II para referirse a transposones de ADN, a los que se dedica el presente
apartado.
Los transposones de ADN completos poseen la potencialidad de auto propagarse

sin un intermediario de ARNm seguido de retro transcripcin. Un transposn
contiene en gen de una enzima transposasa, flanqueado por repeticiones invertidas.
Su mecanismo de transposicin se basa en cortar y pegar, moviendo su secuencia a
otra localizacin distinta del genoma. Los distintos tipos de transposasas actan de
modo diferente, habiendo algunas capaces de unirse a cualquier parte del genoma
mientras que otras se unen a secuencias diana especficas. La transposasa
codificada por el propio transposn lo extrae realizando dos cortes flanqueantes en
la hebra de ADN, generando extremos cohesivos, y lo inserta en la secuencia diana
en otro punto del genoma. Una ADN polimerasa rellena los huecos generados por
los extremos cohesivos y una ADN ligasa restablece los enlaces fosfodister,
recuperando la continuidad de la secuencia de ADN. Esto conlleva una duplicacin
de la secuencia diana en torno al transposn, en su nueva localizacin.
Se estima que el genoma humano contiene unas 300.000 copias de elementos

repetidos dispersos originados por transposones de ADN, constituyendo un 3% del
genoma. Hay mltiples familias, de las que cabe destacar por su importancia
patognica por la generacin de reordenaciones cromosmicas los elementos
mariner, as como las familias MER1 y MER2.
Variabilidad
Si bien dos seres humanos del mismo sexo comparten un porcentaje elevadsimo
(en torno al 99,9%) de su secuencia de ADN, lo que nos permite trabajar con una
nica secuencia de referencia, pequeas variaciones genmicas fundamentan
buena parte de la variabilidad fenotpica interindividual. Una variacin en el genoma,
por sustitucin, de lesin o insercin, se denomina polimorfismo o alelo gentico. No
todo polimorfismo gentico provoca una alteracin en la secuencia de una protena o
de su nivel de expresin, es decir, muchos son silenciosos y carecen de expresin
fenotpica.
SNPs
La principal fuente de variabilidad en los genomas de dos seres humanos procede
de las variaciones en un slo nucletido, conocidas como SNPs, en las cuales se
han centrado la mayor parte de los estudios. Dada su importancia, en la actualidad
existe un proyecto internacional (International HapMap Project) para catalogar a
gran escala los SNPs del genoma humano. En este contexto, la denominacin de
SNP frecuentemente se restringe a aquellos polimorfismos de un slo nucletido en
los que el alelo menos frecuente aparece en al menos el 1% de la poblacin.
Los SNP son marcadores tetrallicos, dado que en teora en una posicin puede
haber cuatro nucletidos distintos, cada uno de los cuales identificara un alelo; sin
embargo, en la prctica suelen presentar slo dos alelos en la poblacin. Se estima
que la frecuencia de SNPs en el genoma humano es de un SNP cada 500-100 pares
de bases, de los que una parte relevante son polimorfismos codificantes, que
causan la sustitucin de un aminocido por otro en una protena.
Gracias a su abundancia y a que presentan una distribucin aproximadamente

uniforme en el genoma, han tenido gran utilidad como marcadores para los mapas
de ligamiento, herramienta fundamental del Proyecto Genoma Humano. Adems son
fcilmente detectables a gran escala mediante el empleo de chips de ADN
Variacin estructural
Este tipo de variaciones se refiere a duplicaciones, inversiones, inserciones o
variantes en el nmero de copias de segmentos grandes del genoma (por lo general
de 1000 nucletidos o ms). Estas variantes implican a una gran proporcin del
genoma, por lo que se piensa que son, al menos, tan importantes como los SNPs.
Variacin estructural es el trmino general para abarcar un grupo de alteraciones

genmicas que implican segmentos de ADN mayores de 1Kb. La variacin
estructural puede ser cuantitativa (variante en nmero de copia, que comprende:
deleciones, inserciones y duplicaciones), posicional (translocaciones) y orientacional
(inversiones).
A pesar de que este campo de estudio es relativamente nuevo (los primeros
estudios a gran escala se publicaron en los aos 2004 y 2005), ha tenido un gran
auge, hasta el punto de que se ha creado un nuevo proyecto para estudiar este tipo
de variantes en los mismos individuos en los que se bas el Proyecto HapMap.
Aunque an quedan dudas acerca de las causas de este tipo de variantes, cada vez
existe ms evidencia a favor de que es un fenmeno recurrente que todava
continua moldeando y creando nuevas variantes del genoma.
Este tipo de variaciones han potenciado la idea de que el genoma humano no es

una entidad esttica, sino que se encuentra en constante cambio y evolucin.
Evolucin
Los estudios de genmica comparada se basan en comparacin de secuencias
genmicas a gran escala, generalmente mediante herramientas bioinformticas.
Dichos estudios permiten ahondar en el conocimiento de aspectos evolutivos de
escala temporal y espacial muy diversa, desde el estudio de la evolucin de los
primeros seres vivos hace miles de millones de aos o las radiaciones filogenticas
en mamferos, hasta el estudio de las migraciones de seres humanos en los ltimos
100.000 aos, que explican la actual distribucin de las distintas razas humanas.
Genmica comparada entre distintas especies
Los estudios de genmica comparada con genomas de mamferos sugieren que

aproximadamente el 5% del genoma humano se ha conservado evolutivamente en
los ltimos 200 millones de aos; lo cual incluye la gran mayora de los genes y
secuencias reguladoras. Sin embargo, los genes y las secuencias reguladoras
actualmente conocidas suponen slo el 2% del genoma, lo que sugiere que la mayor
parte de la secuencia genmica con gran importancia funcional es desconocida. Un
porcentaje importante de los genes humanos presenta un alto grado de
conservacin evolutiva. La similitud entre el genoma humano y el del chimpanc
(Pan troglodytes) es del 98,77%. En promedio, una protena humana se diferencia
de su ortloga de chimpanc en tan slo dos aminocidos, y casi un tercio de los
genes tiene la misma secuencia. Una diferencia importante entre los dos genomas
es el cromosoma 2 humano, que es el producto de una fusin entre los cromosomas
12 y 13 del chimpanc[]
Otra conclusin de la comparacin del genoma de distintos primates es la notable

prdida de genes de receptores olfativos que se ha producido paralelamente al
desarrollo de la visin en color (tricrmica) durante la evolucin de primates.
Genmica comparada entre genomas humanos
Mapa de las migraciones humanas creado a partir de genmica comparada con los
genomas mitocondriales de individuos actuales. Los nmeros de la leyenda
representan miles de aos antes del presente. La lnea azul rayada delimita el rea
cubierta de hielo o de tundra durante la ltima glaciacin. Las letras englobadas por
crculos indican los halo grupos de ADN mitocondrial; los halo grupos se usan para
definir subpoblaciones genticas, que frecuentemente tienen una correlacin
geogrfica. Los principales halogrupos de ADNmt son: frica: L, L1, L2, L3. Oriente
prximo: J, N. Europa meridional: J, K. Europa (general): H, V. Europa septentrional:
T, U, X. Asia: A, B, C, D, E, F, G (en el dibujo: M est compuesta por C, D, E, y G).
Nativos Americanos: A, B, C, D y a menudo X. Vase el artculo: Haplogrupos de ADN
mitocondrial humano.
Durante dcadas las nicas evidencias que permitan profundizar en el conocimiento

del origen y la expansin del Homo sapiens han sido los escasos hallazgos
arqueolgicos. Sin embargo, en la actualidad, los estudios de genmica comparada
a partir de genomas de individuos actuales de todo el mundo, estn aportando
informacin muy relevante. Su fundamento bsico consiste en identificar un
polimorfismo, una mutacin, que se asume que se origin en un individuo de una
poblacin ancestral, y que ha heredado toda su descendencia hasta la actualidad.
Adems, dado que las mutaciones parecen producirse a un ritmo constante, puede
estimarse la antigedad de una determinada mutacin en base al tamao del
haplotipo en el que se sita, es decir, el tamao de la secuencia conservada que
flanquea la mutacin. Esta metodologa se ve complicada por el fenmeno de
recombinacin entre los pares de cromosomas de un individuo, procedentes de sus
dos progenitores. Sin embargo, hay dos regiones en las que no existe dicho
inconveniente porque presentan una herencia uniparental: el genoma mitocondrial
(de herencia matrilineal), y el cromosoma Y (de herencia patrilineal).
En las ltimas dcadas, los estudios de genmica comparada basada en el genoma

mitocondrial, y en menor medida en el cromosoma Y, han reportado conclusiones de
gran inters. En diversos estudios se ha trazado la filogenia de estas secuencias,
estimndose que todos los seres humanos actuales comparten un antepasado
femenino comn que vivi en frica hace unos 150.000 aos. Por su parte, por
razones an poco conocidas, la mayor convergencia del ADN del cromosoma Y
establece que el antepasado masculino comn ms reciente data de hace unos
60.000 aos. Estos individuos han sido bautizados como Eva mitocondrial e Y-
cromosoma Adn.
La mayor diversidad de marcadores genticos y en consecuencia, los haplotipos de

menor longitud, se han hallado en frica. Todo el resto de la poblacin mundial
presenta slo una pequea parte de estos marcadores, de modo que la composicin
genmica del resto de la poblacin humana actual es slo un subconjunto de la que
puede apreciarse en frica. Esto induce a afirmar que un pequeo grupo de seres
humanos (quiz en torno a un millar) emigr del continente africano hacia las costas
de Asia occidental, hace unos 50.000-70.000 aos, segn estudios basados en el
genoma mitocondrial. Hace unos 50.000 aos alcanzaron Australia y hace en torno a
40.000-30.000 aos otras subpoblaciones colonizaron Europa occidental y el centro
de Asia. Asimismo, se estima que hace 20.000-15.000 aos alcanzaron el continente
americano a travs del estrecho de Bering (el nivel del mar era menor durante la
ltima glaciacin, o glaciacin de Wrm o Wisconsin), poblando Sudamrica hace
unos 15.000-12.000 aos. No obstante, estos datos slo son estimaciones, y la
metodologa presenta ciertas limitaciones. En la actualidad, la tendencia es
combinar los estudios de genmica comparada basados en el ADN mitocondrial con
anlisis de la secuencia del cromosoma Y.
PROYECTO PROTEOMA HUMANO
Proyecto proteoma humano (PPH): Tras descifrar el cdigo del genoma humano, de
20.000 a 25.000 genes que componen la secuencia de ADN humano, se ha
ampliado la bsqueda, intentando descifrar ahora el proteoma humano, es decir, se
necesita saber el funcionamiento y accin de cada protena, cuya secuencia,
plegamiento y doblamiento viene determinado por cada uno de los genes
determinados mediante el anterior Proyecto Genoma Humano. Adems, el PPH
permite conocer los mecanismos de modificacin postraduccionales de las
protenas, cmo afectan la fosforilacin, glicosilacin, polimerizacin, etc., a los
aspectos fundamentales de su funcionalidad. Tambin se detectan a la funcionalidad
de las protenas aspectos relacionados con la influencia medioambiental o las
relaciones multignicas que se establecen en la mayora de las enfermedades.
Objetivos del PPH
Los objetivos principales y generales de este proyecto, se determinaron por la

"Organizacin del proteoma humano" (HUPO) en el primer
Dificultades del Proyecto Proteoma Humano
El campo de la protemica ha emergido con la meta de desarrollar y aplicar los

conocimientos obtenidos de la secuencia gentica para conocer el comportamiento y
la funcionalidad de las protenas, y con esto surgi el PPH. Sin embargo, realizar el
PPH es ms complicado que el Proyecto Genoma Humano ya que tienen que
superar dificultades como las siguientes:
Las protenas, aunque pueden ser fcilmente aisladas, no pueden ser

amplificadas con mtodos similares a la PCR, por lo que la cantidad de stas
presente en una muestra es la cantidad de protenas que se va a poder
estudiar. Con esto surge la dificultad de detectar, identificar, y caracterizar
numerosos casos de protenas minoritarias en las concentraciones celulares
naturales.
A diferencia del ARN o ADN, las protenas no poseen propiamente

complementos de unin o hibridacin de alta afinidad.
Las protenas exhiben un rango de propiedades bioqumicas que exceden

ampliamente el comportamiento homogneo de los oligonucletidos, y
adems, estas propiedades dependen de la estructura tridimensional precisa
de los poli pptidos plegados. La diversidad de cualidades que presentan las
protenas exige un mayor nivel de complejidad a la hora de utilizar mtodos
para manipularlas y procesarlas.
A pesar de todo esto, el Proyecto Proteoma Humano, al igual que la protemica,

alcanzar un gran esplendor en un perodo no muy lejano de tiempo, cuando se
disponga de los conocimientos y mtodos de estudio necesarios para comprender
los mecanismos proteicos
BIBLIOGARFIA
BARTOLOM YANKOVIC, Nola. EL GENOMA HUMANO AL ALCANCE DE

TODOS. Santiago: RIL editores, 2007.
AUFFRAY Charles. EL GENOMA HUMANO: Una explicacin para

comprender. 1 ed. Buenos Aires: Siglo XXI editores Argentina, 2004.
OLIVA VIRGILI, Rafael; VIDAL TABOADA, Jos Manuel. GENOMA

HUMANO: Avances en investigacin, diagnstico y tratamiento. 1 ed.
Barcelona: Universidad de Barcelona, 2006.
FRANCOIS MATTEI, Jean. LAMIRADA DE LA CIENCIA. 1 ed. Madrid:

Editorial Complutense, 2002.
APARISI MIRALLES, ngela. EL PROYECTO GENOMA HUMANO. 1 ed.

Valencia: Universidad de Valencia, 1997.
Nombela Can, Csar; Simn Valls, Carlos. CELULAS MADRE. Madrid:

CSIC, 2010.

Monografia de Geneoma Humano

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Monografia de Geneoma Humano

Hochgeladen von

Copyright:

Verfügbare Formate

GENOMA Y

Monografa elaborado por :

Agradecemos a Dios porque de l siempre sentimos esa fuerza interior que

A nuestros padres porque en ellos encontramos la fortaleza y proteccin

Asimismo tampoco debemos ser en la actualidad desmesuradamente optimistas en

Para apoyar las posibles aplicaciones futuras de la gentica molecular describir

El ncleo de sus trabajos le permiti descubrir las tres leyes de la herencia o

Estas tres leyes son:

Cuando se cruzan dos variedades puras de una misma especie, los

Al cruzar entre s los hbridos de la segunda generacin, los descendientes

Concluye diciendo que si se cruzan razas distintas en uno o ms alelos

1 AUFFRAY Charles. EL GENOMA HUMANO, 2004

4.2 ROSALIND FRANKLIN

En 1953, la revista britnica Nature publica un artculo elaborado por cuatro

Rosalind Franklin fue la primera mujer que contribuy en el descubrimiento del

2 APARISI MIRALLES, ngela - 1997

4.3.1 JAMES WATSON

4.3.2 FRANCIS CRACK

Se especializ en el estudio de los genes y desarroll un mtodo para

4.3.3 EL MODELO DE WATSON Y CRACK

En 1953, Watson y Crick propusieron el modelo que establece las bases

Para poder definir el modelo se apoyaron en gran parte en los rayos X

Gracias al descubrimiento de todos los cientficos que han trabajado en el

LA GENTICA : ADN Y ARN

DEFINICION Y ESTRUCTURA DEL ADN:

3 Rafael Oliva Virgili, Jos Manuel Vidal Taboada - 2006

La unin se realiza mediante puentes de hidrgeno (se forman cuando un

La estructura de un ADN est definida por la "secuencia" de las bases

3.2REPLICACIN DEL ADN

4 AUFFRAY Charles. EL GENOMA HUMANO: Una explicacin para comprender.

El procedimiento que se sigue es el siguiente: la doble hlice se separa y cada

3.3 DEFINICIN Y ESTRUCTURA DEL ARN

El ARN es prcticamente igual que el ADN, pero se diferencia qumicamente

a. La molcula del ARN contiene como azcar la ribosa (ADN desoxirribosa)

b. El ARN contiene la base uracilo en lugar de la timina del ADN.

Hay tres tipos distintos de ARN, estos son:

ARN mensajero (ARNm)

Participa en el transporte de la informacin de una cadena del ADN,

ARN ribosmico (ARNr):

ARN de transferencia (ARNt)

Participa en el transporte de aminocidos que corresponden a los

Normalmente las bases del ARN se juntan de la siguiente manera: A-U y G-

6 Jean Franois Mattei - 2002

Contiene las instrucciones que caracterizan el aspecto fsico de cada persona y, en

Actualmente se ha conseguido descifrar el 99% de este cdigo, gracias a dos

El genoma humano es el genoma del Homo sapiens, es decir, la secuencia de ADN

De los 23 pares, 22 son cromosomas autosmicos y un par determinante del sexo

La secuencia de ADN que conforma el genoma humano contiene codificada la

En definitiva, el proteoma fundamenta la particular morfologa y funcionalidad de

El genoma humano presenta una densidad de genes muy inferior a la que

En el genoma humano se detectan ms de 280.000 elementos reguladores,

Contenido en genes y tamao del genoma de varios organismo

Tamao del Nmero

Candidatus Carsonella ruddii 0,15 182

Streptococcus pneumoniae 2,2 2300

Escherichia coli 4,6 4.400

Saccharomyces cerevisiae 12 5.800

Caenorhabditis elegans 97 19.000

Arabidopsis thaliana 125 25.500

Drosophila melanogaster (mosca) 180 13.700

Oryza sativa (arroz) 466 45-55.000

Mus musculus (ratn) 2500 29.000

Homo sapiens (ser humano) 2900 27.000

El genoma humano (como el de cualquier organismo eucariota) est formado por