Sie sind auf Seite 1von 27

Genoma humano

El genoma humano es el genoma del Homo sapiens, es decir, la secuencia de ADN contenida en 23 pares de cromosomas en el ncleo de cada clula humana diploide. De los 23 pares, 22 son cromosomas autosmicos y un par determinante del sexo (dos cromosomas X en mujeres y uno X y uno Y en hombres). El genoma haploide (es decir, con una sola representacin de cada par) tiene una longitud total aproximada de 3200 millones de pares de bases de ADN (3200 Mb) que contienen unos 20.000-25.000 genes1 (las estimaciones ms recientes apuntan a unos 20.500). De las 3200 Mb unas 2950 Mb corresponden a eucromatina y unas 250 Mb a heterocromatina. El Proyecto Genoma Humanoprodujo una secuencia de referencia del genoma humano eucromtico, usado en todo el mundo en las ciencias biomdicas. La secuencia de ADN que conforma el genoma humano contiene codificada la informacin necesaria para la expresin, altamente coordinada y adaptable al ambiente, del proteomahumano, es decir, del conjunto de las protenas del ser humano. Las protenas, y no el ADN, son las principales biomolculas efectoras; poseen funciones estructurales, enzimticas,metablicas, reguladoras, sealizadoras..., organizndose en enormes redes funcionales de interacciones. En definitiva, el proteoma fundamenta la particular morfologa y funcionalidad de cada clula. Asimismo, la organizacin estructural y funcional de las distintas clulas conforma cada tejido y cada rgano, y, finalmente, el organismo vivo en su conjunto. As, el genoma humano contiene la informacin bsica necesaria para el desarrollo fsico de un ser humano completo. El genoma humano presenta una densidad de genes muy inferior a la que inicialmente se haba predicho, con slo en torno al 1,5%2 de su longitud compuesta por exones codificantes de protenas. Un 70% est compuesto por ADN extragnico y un 30 % por secuencias relacionadas con genes. Del total de ADN extragnico, aproximadamente un 70% corresponde a repeticiones dispersas, de manera que, ms o menos, la mitad del genoma humano corresponde a secuencias repetitivas de ADN. Por su parte, del total de ADN relacionado con genes se estima que el 95% corresponde a ADN no codificante: pseudogenes, fragmentos de genes, intrones o secuencias UTR, entre otros.
Contenido en genes y tamao del genoma de varios organismos
3

Especie

Tamao del Nmero genoma (Mb) de genes 0,58 2,2 500 2300

Mycoplasma genitalium Streptococcus pneumoniae

Escherichia coli Saccharomyces cerevisiae Caenorhabditis elegans Arabidopsis thaliana

4,6 12 97 125

4.400 5.800 19.000 25.500 13.700 45-55.000 29.000 27.000

Drosophila melanogaster (mosca) 180 Oryza sativa (arroz) Mus musculus (ratn) Homo sapiens (ser humano) 466 2500 2900

Contenido
[ocultar]

1 Componentes

o o

1.1 Cromosomas 1.2 ADN intragnico

1.2.1 Genes

1.2.1.1 Genes de ARN 1.2.1.2 Distribucin de genes 1.2.1.3 Secuencias reguladoras 1.2.1.4 Elementos ultraconservados

1.2.2 Pseudogenes

1.3 ADN intergnico

1.3.1 ADN repetido en tndem

1.3.1.1 Satlites 1.3.1.2 Minisatlites 1.3.1.3 Microsatlites

1.3.2 ADN repetido disperso

1.3.2.1 SINE 1.3.2.2 LINE 1.3.2.3 HERV


2 Variabilidad

1.3.2.4 Transposones de ADN

o o

2.1 SNPs 2.2 Variacin estructural

3 Enfermedades genticas

3.1 Mutaciones

3.1.1 Trastornos de un slo gen 3.1.2 Trastornos polignicos y multifactoriales

3.2 Alteraciones cromosmicas


4 Evolucin

3.2.1 Numricas 3.2.2 Estructurales

o o

4.1 Genmica comparada entre distintas especies 4.2 Genmica comparada entre genomas humanos

5 Genoma mitocondrial 6 Vase tambin 7 Referencias 8 Enlaces externos

o o

8.1 En espaol 8.2 En ingls

[editar]Componentes [editar]Cromosomas
El genoma humano (como el de cualquier organismo eucariota) est formado por cromosomas, que son largas secuencias continuas de ADN altamente organizadas espacialmente (con ayuda de protenas histnicas y no histnicas) para adoptar una forma ultracondensada en metafase. Son observables con microscopa ptica convencional o de fluorescencia mediante tcnicas de citogentica y se ordenan formando un cariotipo. El cariotipo humano normal contiene un total de 23 pares de cromosomas distintos: 22 pares de autosomas ms 1 par de cromosomas sexuales que determinan el sexo del individuo. Los cromosomas 1-22 fueron numerados en orden decreciente de tamao en base al cariotipo. Sin embargo, posteriormente pudo comprobarse que el cromosoma 22 es en realidad mayor que el 21.

Representacin grfica del cariotipo humano normal.(Imagen 1).

Las clulas somticas de un organismo poseen en su ncleo un total de 46 cromosomas (23 pares): una dotacin de 22 autosomas procedentes de cada progenitor y un par de cromosomas sexuales, un cromosoma X de la madre y un X o un Y del padre. (Ver imagen 1). Los gametos vulos y espermatozoides- poseen una dotacin haploide de 23 cromosomas.

Cromosoma

Genes

Nmero de bases

Bases secuenciadas4

4.220

247.199.719

224.999.719

1.491

242.751.149

237.712.649

1.550

199.446.827

194.704.827

446

191.263.063

187.297.063

609

180.837.866

177.702.766

2.281

170.896.993

167.273.993

Cromosoma

Genes

Nmero de bases

Bases secuenciadas4

2.135

158.821.424

154.952.424

1.106

146.274.826

142.612.826

1.920

140.442.298

120.312.298

10

1.793

135.374.737

131.624.737

11

379

134.452.384

131.130.853

12

1.430

132.289.534

130.303.534

13

924

114.127.980

95.559.980

14

1.347

106.360.585

88.290.585

15

921

100.338.915

81.341.915

16

909

88.822.254

78.884.754

17

1.672

78.654.742

77.800.220

18

519

76.117.153

74.656.155

19

1.555

63.806.651

55.785.651

20

1.008

62.435.965

59.505.254

Cromosoma

Genes

Nmero de bases

Bases secuenciadas4

21

578

46.944.323

34.171.998

22

1.092

49.528.953

34.893.953

X (cromosoma sexual)

1.846

154.913.754

151.058.754

Y (cromosoma sexual)

454

57.741.652

25.121.652

Total [editar]ADN

32.185

3.079.843.747

2.857.698.560

intragnico

[editar]Genes
Un gen es la unidad bsica de la herencia, y porta la informacin gentica necesaria para la sntesis de una protena (genes codificantes) o de un ARN no codificante (genes de ARN). Est formado por una secuencia promotora, que regula su expresin, y una secuencia que se transcribe, compuesta a su vez por: secuencias UTR (regiones flanqueantes no traducidas), necesarias para la traduccin y la estabilidad del ARNm, exones (codificantes) e intrones, que son secuencias de ADN no traducidas situadas entre dos exones que sern eliminadas en el procesamiento del ARNm (ayuste).

Este diagrama esquemtico muestra un gen en relacin a su estructura fsica (doble hlice de ADN) y a un cromosoma (derecha). Los intrones son regiones frecuentemente encontradas en los genes de eucariotas, que se transcriben, pero son eliminadas en el procesamiento del ARN (ayuste) para producir unARNm formado slo

por exones, encargados detraducir una protena. Este diagrama es en exceso simplificado ya que muestra un gen compuesto por unos 40 pares de bases cuando en realidad su tamao medio es de 20.000-30.000 pares de bases).

Actualmente se estima que el genoma humano contiene entre 20.000 y 25.000 genes codificantes de protenas, estimacin muy inferior a las predicciones iniciales que hablaban de unos 100.000 genes o ms. Esto implica que el genoma humano tiene menos del doble de genes que organismos eucariotas mucho ms simples, como la mosca de la fruta o el nematodo Caenorhabditis elegans. Sin embargo, las clulas humanas recurren ampliamente al splicing (ayuste) alternativo para producir varias protenas distintas a partir de un mismo gen, como consecuencia de lo cual el proteoma humano es ms amplio que el de otros organismos mucho ms simples. En la prctica, el genoma tan slo porta la informacin necesaria para una expresin perfectamente coordinada y regulada del conjunto de protenas que conforman el proteoma, siendo ste el encargado de ejecutar la mayor parte de las funciones celulares. Con base en los resultados iniciales arrojados por el proyecto ENCODE5 (acrnimo de ENCyclopedia Of DNA Elements), algunos autores han propuesto redefinir el concepto actual de gen. Las observaciones ms recientes hacen difcilmente sostenible la visin tradicional de un gen, como una secuencia formada por las regiones UTRs, los exones y los intrones. Estudios detallados han hallado un nmero de secuencias de inicio de transcripcin por gen muy superior a las estimaciones iniciales, y algunas de estas secuencias se sitan en regiones muy alejadas de la traducida, por lo que los UTR 5' pueden abarcar secuencias largas dificultando la delimitacin del gen. Por otro lado, un mismo transcrito puede dar lugar a ARN maduros totalmente diferentes (ausencia total de solapamiento), debido a una gran utilizacin del splicing alternativo. De este modo, un mismo transcrito primario puede dar lugar a protenas de secuencia y funcionalidad muy dispar. En consecuencia, algunos autores han propuesto una nueva definicin de gen,:6 7la unin de secuencias genmicas que codifican un conjunto coherente de productos funcionales, potencialmente solapantes. De este modo, se identifican como genes los genes ARN y los conjuntos de secuencias traducidas parcialmente solapantes (se excluyen, as, las secuencias UTR y los intrones, que pasan a ser considerados como "regiones asociadas a genes", junto con los promotores). De acuerdo con esta definicin, un mismo transcrito primario que da lugar a dos transcritos secundarios (y dos protenas) no solapantes debe considerarse en realidad dos genes diferentes, independientemente de que estos presenten un solapamiento total o parcial de sus transcritos primarios. Las nuevas evidencias aportadas por ENCODE, segn las cuales las regiones UTR no son fcilmente delimitables y se extienden largas distancias, obligaran a reidentificar nuevamente los genes que en realidad componen el genoma humano. De acuerdo con la definicin tradicional (actualmente vigente), sera necesario identificar como un mismo gen a todos aquellos que muestren un solapamiento parcial (incluyendo las regiones UTR y los intrones), con lo que a la luz de las nuevas observaciones, los genes

incluiran mltiples protenas de secuencia y funcionalidad muy diversa. Colateralmente se reducira el nmero de genes que componen el genoma humano. La definicin propuesta, en cambio, se fundamenta en el producto funcional del gen, por lo que se mantiene una relacin ms coherente entre un gen y una funcin biolgica. Como consecuencia, con la adopcin de esta nueva definicin, el nmero de genes del genoma humano aumentar significativamente.

[editar]Genes de ARN
Adems de los genes codificantes de protenas, el genoma humano contiene varios miles de genes ARN, cuya transcripcin reproduce ARN de transferencia (ARNt), ARN ribosmico(ARNr), microARN (miARN), u otros genes ARN no codificantes. Los ARN ribosmico y de transferencia son esenciales en la constitucin de los ribosomas y en la traduccin de las protenas. Por su parte, los microARN tienen gran importancia en la regulacin de la expresin gnica, estimndose que hasta un 20-30% de los genes del genoma humano puede estar regulado por el mecanismo de interferencia por miARN. Hasta el momento se han identificado ms de 300 genes de miARN y se estima que pueden existir unos 500-

[editar]Distribucin de genes
A continuacin se muestran algunos valores promedio del genoma humano. Cabe advertir, sin embargo, que la enorme heterogeneidad que presentan estas variables hace poco representativos a los valores promedio, aunque tienen valor orientativo. La densidad media de genes es de 1 gen cada 100 kb, con un tamao medio de 20-30 kb, y un nmero de exones promedio de 7-8 por cada gen, con un tamao medio de 150 nucletidos. El tamao medio de un ARNm es de 1,8-2,2 kb, incluyendo las regiones UTR (regiones no traducidas flanqueantes), siendo la longitud media de la regin codificante de 1,4 kb.

Isocoros. Frecuencia y riqueza en G+C y genes, en el genoma humano.

El genoma humano se caracteriza por presentar una gran heterogeneidad en su secuencia. En particular, la riqueza en bases de guanina (G) y citosina (C) frente a las de adenina (A) y timina (T) se distribuye heterogneamente, con regiones muy ricas en G+C flanqueadas por regiones muy pobres,

siendo el contenido medio de G+C del 41%, menor al tericamente esperado (50%). Dicha heterogeneidad esta correlacionada con la riqueza en genes, de manera que los genes tienden a concentrarse en las regiones ms ricas en G+C. Este hecho era conocido ya desde hace aos gracias a la separacin mediante centrifugacin en gradiente de densidad de regiones ricas en G+C (que recibieron el nombre de iscoros H; del ingls High) y regiones ricas en A+T (iscoros L; del ingls Low).

[editar]Secuencias reguladoras
El genoma tiene diversos sistemas de regulacin de la expresin gnica, basados en la regulacin de la unin de factores de transcripcin a las secuencias promotoras, en mecanismos de modificacin epigentica (metilacin del ADN o metilacin-acetilacin de histonas) o en el control de la accesibilidad a los promotores determinada por el grado de condensacin de la cromatina; todos ellos muy interrelacionados. Adems hay otros sistemas de regulacin a nivel del procesamiento, estabilidad y traduccin del ARNm, entre otros. Por lo tanto, la expresin gnica est intensamente regulada, lo cual permite desarrollar los mltiples fenotipos que caracterizan los distintos tipos celulares de un organismo eucariota multicelular, al mismo tiempo que dota a la clula de la plasticidad necesaria para adaptarse a un medio cambiante. No obstante, toda la informacin necesaria para la regulacin de la expresin gnica, en funcin del ambiente celular, est codificada en la secuencia de ADN al igual que lo estn los genes. Las secuencias reguladoras son tpicamente secuencias cortas presentes en las proximidades o en el interior (frecuentemente en intrones) de los genes. En la actualidad, el conocimiento sistemtico de estas secuencias y de cmo actan en complejas redes de regulacin gnica, sensibles a seales exgenas, es muy escaso y est comenzando a desarrollarse mediante estudios de genmica comparada, bioinformtica y biologa de sistemas. La identificacin de secuencias reguladoras se basa en parte en la bsqueda de regiones no codificantes evolutivamente conservadas.8 Por ejemplo, la divergencia evolutiva entre el ratn y el ser humano ocurri hace 70-90 millones de aos.9 Mediante estudios de genmica comparada, alineando secuencias de ambos genomas pueden identificarse regiones con alto grado de coincidencia, muchas correspondientes a genes y otras a secuencias no codificantes de protenas pero de gran importancia funcional, dado que han estado sometidas a presin selectiva.

[editar]Elementos ultraconservados
Reciben este nombre regiones que han mostrado una constancia evolutiva casi total, mayor incluso que las secuencias codificantes de protenas, mediante estudios de genmica comparada. Estas secuencias generalmente se solapan con intrones de genes implicados en la regulacin de la transcripcin o en el desarrollo embrionario y con exones de genes relacionados con el procesamiento del ARN. Su funcin

es generalmente poco conocida, pero probablemente de extrema importancia dado su nivel de conservacin evolutiva, tal y como se ha expuesto en el punto anterior. En la actualidad se han encontrado unos 500 segmentos de un tamao mayor a 200 pares de bases totalmente conservados (100% de coincidencia) entre los genomas de humano, ratn y rata, y casi totalmente conservados en perro (99%) y pollo (95%).10

[editar]Pseudogenes
En el genoma humano se han encontrado asimismo unos 19.000 pseudogenes, que son versiones completas o parciales de genes que han acumulado diversas mutaciones y que generalmente no se transcriben. Se clasifican en pseudogenes no procesados (~30%) y pseudogenes procesados (~70%)11

Los pseudogenes no procesados son copias de genes generalmente originadas por duplicacin, que no se transcriben por carecer de una secuencia promotora y haber acumulado mltiples mutaciones, algunas de las cuales sin sentido (lo que origina codones de parada prematuros). Se caracterizan por poseer tanto exones como intrones.

Los pseudogenes procesados, por el contrario, son copias de ARN mensajero retrotranscritas e insertadas en el genoma. En consecuencia carecen de intrones y de secuencia promotora.

[editar]ADN

intergnico

Como se ha dicho, las regiones intergnicas o extragnicas comprenden la mayor parte de la secuencia del genoma humano, y su funcin es generalmente desconocida. Buena parte de estas regiones est compuesta por elementos repetitivos, clasificables como repeticiones en tndem o repeticiones dispersas, aunque el resto de la secuencia no responde a un patrn definido y clasificable. Gran parte del ADN intergnico puede ser un artefacto evolutivo sin una funcin determinada en el genoma actual, por lo que tradicionalmente estas regiones han sido denominadas ADN "basura" (Junk DNA), denominacin que incluye tambin las secuencias intrnicas y pseudogenes. No obstante, esta denominacin no es la ms acertada dado el papel regulador conocido de muchas de estas secuencias. Adems el notable grado de conservacin evolutiva de algunas de estas secuencias parece indicar que poseen otras funciones esenciales an desconocidas o poco conocidas. Por lo tanto, algunos prefieren denominarlo "ADN no codificante" (aunque el llamado "ADN basura" incluye tambin transposones codificantes) o "ADN repetitivo". Algunas de estas regiones constituyen en realidad genes precursores para la sntesis te microARN (reguladores de la expresin gnica y del silenciamiento gnico).

Frecuencia de las diversas regiones intergnicas e intragnicas del cromosoma 22. Adaptado de: Dunham, I., et al., 1999. The DNA sequence of human chromosome 22, Nature 402(6761):489495.

Estudios recientes enmarcados en el proyecto ENCODE han obtenido resultados sorprendentes, que exigen la reformulacin de nuestra visin de la organizacin y la dinmica del genoma humano. Segn estos estudios, el 15% de la secuencia del genoma humano se transcribe a ARN maduros, y hasta el 90% se transcribe al menos a transcritos inmaduros en algn tejido:7 As, una gran parte del genoma humano codifica genes de ARN funcionales. Esto es coherente con la tendencia de la literatura cientfica reciente a asignar una importancia creciente al ARN en la regulacin gnica. Asimismo, estudios detallados han identificado un nmero mucho mayor de secuencias de inicio de transcripcin por gen, algunas muy alejadas de la regin prxima a la traducida. Como consecuencia, actualmente resulta ms complicado definir una regin del genoma como gnica o intergnica, dado que los genes y las secuencias relacionadas con los genes se extienden en las regiones habitualmente consideradas intergnicas.

[editar]ADN repetido en tndem


Son repeticiones que se ordenan de manera consecutiva, de modo que secuencias idnticas, o casi, se disponen unas detrs de otras.

[editar]Satlites

El conjunto de repeticiones en tndem de tipo satlite comprende un total de 250 Mb del genoma humano. Son secuencias de entre 5 y varios cientos de nucletidos que se repiten en tndem miles de veces generando regiones repetidas con tamaos que oscilan entre 100 kb (100.000 nucletidos) hasta varias megabases. Reciben su nombre de las observaciones iniciales de centrifugaciones en gradiente de densidad del ADN genmico fragmentado, que reportaban una banda principal correspondiente a la mayor parte del genoma y tres bandas satlite de menor densidad. Esto se debe a que las secuencias satlite tienen una riqueza en nucltidos A+T superior a la media del genoma y en consecuencia son menos densas. Hay principalmente 6 tipos de repeticiones de ADN satlite10 1. Satlite 1: secuencia bsica de 42 nucletidos. Situado en los centrmeros de los cromosomas 3 y 4 y el brazo corto de los cromosomas acrocntricos (en posicin distal respecto al cluster codificante de ARNr). 2. Satlite 2: la secuencia bsica es ATTCCATTCG. Presente en las proximidades de los centrmeros de los cromosomas 2 y 10, y en la constriccin secundaria de 1 y 16. 3. Satlite 3: la secuencia bsica es ATTCC. Presente en la constriccin secundaria de los cromosomas 9 e Y, y en posicin proximal respecto al cluster de ADNr del brazo corto de los cromosomas acrocntricos. 4. Satlite alfa: secuencia bsica de 171 nucletidos. Forma parte del ADN de los centrmeros cromosmicos. 5. Satlite beta: secuencia bsica de 68 nucletidos. Aparece en torno al centrmero en los cromosomas acrocntricos y en la constriccin secundaria del cromosoma 1. 6. Satlite gamma: secuencia bsica de 220 nucletidos. Prximo al centrmero de los cromosomas 8 y X.

[editar]Minisatlites
Estn compuestas por una unidad bsica de secuencia de 6-2510 nucletidos que se repite en tndem generando secuencias de entre 100 y 20.000 pares de bases. Se estima que el genoma humano contiene unos 30.000 minisatlites. Diversos estudios han relacionado los minisatlites con procesos de regulacin de la expresin gnica, como el control del nivel de transcripcin, el ayuste (splicing) alternativo o laimpronta (imprinting). Asimismo, se han asociado con puntos de fragilidad cromosmica dado que se sitan prximos a lugares preferentes de rotura cromosmica, translocacingentica y recombinacin meitica. Por ltimo, algunos minisatlites humanos (~10%) son hipermutables, presentando una tasa media de mutacin

entre el 0.5% y el 20% en las clulas de la lnea germinal, siendo as las regiones ms inestables del genoma humano conocidas hasta la fecha. En el genoma humano, aproximadamente el 90% de los minisatlites se sitan en los telmeros de los cromosomas. La secuencia bsica de seis nucletidos TTAGGG se repite miles de veces en tndem, generando regiones de 5-20 kb que conforman los telmeros. Algunos minisatlites por su gran inestabilidad presentan una notable variabilidad entre individuos distintos. Se consideran polimorfismos multiallicos, dado que pueden presentarse en un nmero de repeticiones muy variable, y se denominan VNTR (acrnimo de Variable number tandem repeat). Son marcadores muy utilizados en gentica forense, ya que permiten establecer una huella gentica caracterstica de cada individuo, y son identificables mediante Southern blot e hibridacin.

[editar]Microsatlites
Estn compuestos por secuencias bsicas de 2-4 nucletidos, cuya repeticin en tndem origina frecuentemente secuencias de menos de 150 nucletidos. Algunos ejemplos importantes son el dinucletido CA y el trinucletido CAG. Los microsatlites son tambin polimorfismos multiallicos, denominados STR (acrnimo de Short Tandem Repeats) y pueden identificarse mediante PCR, de modo rpido y sencillo. Se estima que el genoma humano contiene unos 200.000 microsatlites, que se distribuyen ms o menos homogneamente, al contrario que los minisatlites, lo que los hace ms informativos como marcadores.

[editar]ADN repetido disperso


Son secuencias de ADN que se repiten de modo disperso por todo el genoma, constituyendo el 45% del genoma humano. Los elementos cuantitativamente ms importantes son los LINEs y SINEs, que se distinguen por el tamao de la unidad repetida. Estas secuencias tienen la potencialidad de autopropagarse al transcribirse a una ARNm intermediario, retrotranscribirse e insertarse en otro punto del genoma. Este fenmeno se produce con una baja frecuencia, estimndose que 1 de cada 100-200 neonatos portan una insercin nueva de un Alu o un L1, que pueden resultar patognicos por mutagnesis insercional, por desregulacin de la expresin de genes prximos (por los propios promotores de los SINE y LINE) o por recombinacin ilegtima entre dos copias idnticas de distinta localizacin cromosmica (recombinacin intra o intercromosmica), especialmente entre elementos Alu.
Frecuencias y tipos de repeticiones dispersas en el genoma de varios organismos
10

Tipo repeticin

Homo sapiens 33,4% 8,1%

Drosophila melanogaster 0,7% 1,5% 0,7% 3,1%

Caenorhabditis elegans 0,4% 0% 5,3% 6,5%

Arabidopsis thaliana 0,5% 4,8% 5,1% 10,4%

LINE,SINE LTR/HERV

Transposones ADN 2,8% Total [editar]SINE 44,4%

Acrnimo del ingls Short Interspersed Nuclear Elements (Elementos nucleares dispersos cortos). Son secuencias cortas, generalmente de unos pocos cientos de bases, que aparecen repetidas miles de veces en el genoma humano. Suponen el 13% del genoma humano,10 un 10% debido exclusivamente a la familia de elementos Alu (caracterstica de primates). Los elementos Alu son secuencias de 250-280 nucletidos presentes en 1.500.00010 de copias dispersas por todo el genoma. Estructuralmente son dmeros casi idnticos, excepto que la segunda unidad contiene un inserto de 32 nucletidos, siendo mayor que la primera. En cuanto a su secuencia, tienen una considerable riqueza en G+C (56%),10 por lo que predominan en las bandas R, y ambos monmeros presentan una cola poliA (secuencia de adeninas) vestigio de su origen de ARNm. Adems poseen un promotor de la ARN polimerasa III para transcribirse. Se consideran retrotransposones no autnomos, ya que dependen para propagarse de la retrotranscripcin de su ARNm por una retrotranscriptasa presente en el medio.

[editar]LINE

Esquema simplificado del mecanismo de retrotransposicin de un elemento LINE y un SINE. Un elemento LINE es transcrito produciendo un ARNm que sale del ncleo celular. En el citoplasma se traduce en sus dos marcos de lectura abiertos generando ambas protenas (vase el texto), que para simplificar se han representado como ORF1p y ORF2p. Ambas permiten retrotranscribir el ARNm del LINE y de otros retrotransposones no autnomos, como SINEs y pseudogenes procesados. Durante la retrotranscripcin la nueva secuencia de ADN se integra en otro punto del genoma.

Acrnimo del ingls Long Interspersed Nuclear Elements (Elementos nucleares dispersos largos). Constituyen el 20% del genoma humano. La familia de mayor importancia cuantitativa es LINE-1 o L1 que es una secuencia de 6 kb repetida unas 800.000 veces de modo disperso por todo el genoma, aunque la gran mayora de las copias es incompleta al presentar el extremo 5' truncado por una retrotranscripcin incompleta. As, se estima que hay unas 5.000 copias completas de L1, slo 90 de las cuales son activas,10 estando el resto inhibidas por metilacin de su promotor. Su riqueza en G+C es del 42%,10 prxima a la media del genoma (41%) y se localizan preferentemente en las bandas G de los cromosomas. Poseen adems un promotor de la ARN polimerasa II. Los elementos LINE completos son codificantes. En concreto LINE-1 codifica dos protenas: 1. Protena de unin a ARN (RNA-binding protein): codificada por el marco de lectura abierto 1 (ORF1, acrnimo del ingls Open reading Frame 1) 2. Enzima con actividad retrotranscriptasa y endonucleasa: codificada por el ORF2. Por lo tanto, se consideran retrotransopsones autnomos, ya que codifican las protenas que necesitan para propagarse. La ARN polimerasa II presente en el medio transcribe el LINE, y este ARNm se

traduce en ambos marcos de lectura produciendo una retrotranscriptasa que acta sobre el ARNm generando una copia de ADN del LINE, potencialmente capaz de insertarse en el genoma. Asimismo estas protenas pueden ser utilizadas por pseudogenes procesados o elementos SINE para su propagacin. Diversos estudios han mostrado que las secuencias LINE pueden tener importancia en la regulacin de la expresin gnica, habindose comprobado que los genes prximos a LINE presentan un nivel de expresin inferior. Esto es especialmente relevante porque aproximadamente el 80% de los genes del genoma humano contiene algn elemento L1 en sus intrones.10

[editar]HERV
Acrnimo de Human endogenous retrovirus (retrovirus endgenos humanos). Los retrovirus son virus cuyo genoma est compuesto por ARN, capaces de retrotranscribirse e integrar su genoma en el de la clula infectada. As, los HERV son copias parciales del genoma de retrovirus integrados en el genoma humano a lo largo de la evolucin de los vertebrados, vestigios de antiguas infecciones retrovirales que afectaron a clulas de la lnea germinal. Algunas estimaciones establecen que hay unas 98.00012 secuencias HERV, mientras que otras afirman que son ms de 400.000.10 En cualquier caso, se acepta que en torno al 5-8% del genoma humano est constituido por genomas antiguamente virales. El tamao de un genoma retroviral completo es de en torno a 6-11 kb, pero la mayora de los HERV son copias incompletas. A lo largo de la evolucin estas secuencias sin inters para el genoma hospedador han ido acumulando mutaciones sin sentido y deleciones que los han inactivado. Aunque la mayora de las HERV tienen millones de aos de antigedad, al menos una familia de retrovirus se integr durante la divergencia evolutiva de humanos y chimpancs, la familia HERV-K(HML2), que supone en torno al 1% de los HERV.

[editar]Transposones de ADN
Bajo la denominacin de transposones a veces se incluyen los retrotransposones, tales como los pseudogenes procesados, los SINEs y los LINEs. En tal caso se habla de transposones de clase I para hacer referencia a los retrotransposones, y de clase II para referirse a transposones de ADN, a los que se dedica el presente apartado. Los transposones de ADN completos poseen la potencialidad de autopropagarse sin un intermediario de ARNm seguido de retrotranscripcin. Un transposn contiene en gen de una enzima transposasa, flanqueado por repeticiones invertidas. Su mecanismo de transposicin se basa en cortar y pegar, moviendo su secuencia a otra localizacin distinta del genoma. Los distintos tipos de transposasas actan de modo diferente, habiendo algunas capaces de unirse a cualquier parte del genoma mientras

que otras se unen a secuencias diana especficas. La transposasa codificada por el propio transposn lo extrae realizando dos cortes flanqueantes en la hebra de ADN, generando extremos cohesivos, y lo inserta en la secuencia diana en otro punto del genoma. Una ADN polimerasa rellena los huecos generados por los extremos cohesivos y una ADN ligasa restablece los enlaces fosfodister, recuperando la continuidad de la secuencia de ADN. Esto conlleva una duplicacin de la secuencia diana en torno al transposn, en su nueva localizacin. Se estima que el genoma humano contiene unas 300.000 copias 10 de elementos repetidos dispersos originados por transposones de ADN, constituyendo un 3% del genoma. Hay mltiples familias, de las que cabe destacar por su importancia patognica por la generacin de reordenaciones cromosmicas los elementos mariner, as como las familias MER1 y MER2.

[editar]Variabilidad
Si bien dos seres humanos del mismo sexo comparten un porcentaje elevadsimo (en torno al 99,9%)10 de su secuencia de ADN, lo que nos permite trabajar con una nica secuencia de referencia, pequeas variaciones genmicas fundamentan buena parte de la variabilidad fenotpica interindividual. Una variacin en el genoma, por sustitucin, delecin o insercin, se denomina polimorfismo o alelo gentico. No todo polimorfismo gentico provoca una alteracin en la secuencia de una protena o de su nivel de expresin, es decir, muchos son silenciosos y carecen de expresin fenotpica.

[editar]SNPs
La principal fuente de variabilidad en los genomas de dos seres humanos procede de las variaciones en un slo nucletido, conocidas como SNPs (Single nucleotide polimorphisms), en las cuales se han centrado la mayor parte de los estudios. Dada su importancia, en la actualidad existe un proyecto internacional (International HapMap Project) para catalogar a gran escala los SNPs del genoma humano. En este contexto, la denominacin de SNP frecuentemente se restringe a aquellos polimorfismos de un slo nucletido en los que el alelo menos frecuente aparece en al menos el 1% de la poblacin. Los SNP son marcadores tetrallicos, dado que en teora en una posicin puede haber cuatro nucletidos distintos, cada uno de los cuales identificara un alelo; sin embargo, en la prctica suelen presentar slo dos alelos en la poblacin. Se estima que la frecuencia de SNPs en el genoma humano es de un SNP cada 500-100 pares de bases,10 de los que una parte relevante son polimorfismos codificantes, que causan la sustitucin de un aminocido por otro en una protena. Gracias a su abundancia y a que presentan una distribucin aproximadamente uniforme en el genoma, han tenido gran utilidad como marcadores para los mapas de ligamiento, herramienta fundamental del

Proyecto Genoma Humano. Adems son fcilmente detectables a gran escala mediante el empleo de chips de ADN (comnmente conocidos comomicroarrays).

[editar]Variacin

estructural

Este tipo de variaciones se refiere a duplicaciones, inversiones, inserciones o variantes en el nmero de copias de segmentos grandes del genoma (por lo general de 1000 nuclotidos o ms). Estas variantes implican a una gran proporcin del genoma, por lo que se piensa que son, al menos, tan importantes como los SNPs.13 A pesar de que este campo de estudio es relativamente nuevo (los primeros estudios a gran escala se publicaron en los aos 2004 y 2005), ha tenido un gran auge, hasta el punto de que se ha creado un nuevo proyecto para estudiar este tipo de variantes en los mismos individuos en los que se bas el Proyecto HapMap. Aunque an quedan dudas acerca de las causas de este tipo de variantes, cada vez existe ms evidencia a favor de que es un fenmeno recurrente que todava continua moldeando y creando nuevas variantes del genoma. Este tipo de variaciones han potenciado la idea de que el genoma humano no es una entidad esttica, sino que se encuentra en constante cambio y evolucin.

[editar]Enfermedades

genticas

La alteracin de la secuencia de ADN que constituye el genoma humano puede causar la expresin anormal de uno o ms genes, originando un fenotipo patolgico. Las enfermedades genticas pueden estar causadas por mutacin de la secuencia de ADN, con afectacin de la secuencia codificante (produciendo protenas incorrectas) o de secuencias reguladoras (alterando el nivel de expresin de un gen), o por alteraciones cromosmicas, numricas o estructurales. La alteracin del genoma de las clulas germinales de un individuo se transmite frecuentemente a su descendencia. Actualmente el nmero de enfermedades genticas conocidas es aproximadamente de 4.000, siendo la ms comn la fibrosis qustica. El estudio de las enfermedades genticas frecuentemente se ha englobado dentro de la gentica de poblaciones. Los resultados del Proyecto Genoma Humano son de gran importancia para la identificacin de nuevas enfermedades genticas y para el desarrollo de nuevos y mejores sistemas de diagnstico gentico, as como para la investigacin en nuevos tratamientos, incluida la terapia gnica.

[editar]Mutaciones
Las mutaciones gnicas pueden ser:

Sustituciones (cambios de un nucletido por otro): Las sustituciones se denominan transiciones si suponen un cambio entre bases del mismo tipo qumico, o transversiones si son un cambio purina (A, G)pirimidina (C, T) o pirimidinapurina.

Deleciones o inserciones: son respectivamente la eliminacin o adicin de una determinada secuencia de nucletidos, de longitud variable. Las grandes deleciones pueden afectar incluso a varios genes, hasta el punto de ser apreciables a nivel cromosmico con tcnicas de citogentica. Inserciones o deleciones de unas pocas pares de bases en una secuencia codificante pueden provocar desplazamiento del marco de lectura (frameshift), de modo que la secuencia de nucletidos del ARNm se lee de manera incorrecta.

Las mutaciones gnica pueden afectar a:

ADN codificante: Si el cambio en un nucletido provoca en cambio de un aminocido de la protena la mutacin se denomina no sinnima. En caso contrario se denominan sinnimas o silenciosas (posible porque el cdigo gentico es degenerado). Las mutaciones no sinnimas asimismo se clasifican en mutaciones con cambio de sentido (missense) si provocan el cambio de un aminocido por otro, mutaciones sin sentido (non-sense) si cambian un codn codificante por un codn de parada (TAA, TAG, TGA) o con ganancia de sentido si sucede a la inversa.

ADN no codificante: Pueden afectar a secuencias reguladoras, promotoras o implicadas en el ayuste (splicing). Estas ltimas pueden causar un errneo procesamiento del ARNm, con consecuencias diversas en la expresin de la protena codificada por ese gen.

[editar]Trastornos de un slo gen


Son enfermedades genticas causadas por mutacin en un slo gen, que presentan una herencia de tipo mendeliano, fcilmente predecible. En la tabla se resumen los principales patrones de herencia que pueden mostrar, sus caractersticas y algunos ejemplos.

Patrn hereditario

Descripcin

Ejemplos

Autosmico dominante

Enfermedades que se manifiestan en individuos heterocigticos. Es suficiente con una mutacin en una de las dos copias (recurdese que cada individuo posee un par de cada cromosoma) de un gen para que se manifieste la enfermedad. Los individuos enfermos generalmente tienen uno de sus dos

Enfermedad de Huntington,Neurofibromatosis 1, Sndrome de Marfan, Cncer colorrectal hereditario no polipsico

progenitores enfermos. La probabilidad de tener descendencia afectada es del 50% dado que cada progenitor aporta uno de los cromosomas de cada par. Frecuentemente corresponden a mutaciones con ganancia de funcin (de modo que el alelo mutado no es inactivo sino que posee una nueva funcin que provoca el desarrollo de la enfermedad) o por prdida de funcin del alelo mutado con efecto de dosis gnica tambin conocido como haploinsuficiencia. Frecuentemente son enfermedades con baja penetrancia, es decir, slo una parte de los individuos que portan la mutacin desarrollan la enfermedad.

Autosmico recesivo

La enfermedad slo se manifiesta en individuos homocigticos recesivos, es decir, aquellos en los que ambas copias de un gen estn mutadas. Son mutaciones que causan prdida de funcin, de modo que la causa de la enfermedad es la ausencia de la accin de un gen. La mutacin slo en una de las dos copias es Fibrosis qustica,Anemia compensada por la existencia de la otra (cuando una falciforme,Enfermedad de Taysola copia no es suficiente se origina Sachs,Atrofia muscular espinal haploinsuficiencia, con herencia autosmica dominante). Habitualmente un individuo enfermo tiene ambos progenitores sanos pero portadores de la mutacin (genotipo heterocigtico: Aa). En tal caso un 25% de la descendencia estar afectada.

Dominante ligado al X

Las enfermedades dominantes ligadas al cromosoma X estn causadas por mutaciones en dicho cromosoma, y presentan un patrn hereditario especial. Slo unas pocas enfermedades hereditarias presentan este patrn. Las mujeres tienen mayor prevalencia de la enfermedad que los hombres, dado que reciben un cromosoma X de su madre y otro de su padre, cualquiera de los cuales puede portar la mutacin. Los varones en cambio siempre reciben el cromosoma Y de Hipofosfatemia,Sndrome de Aicardi su padre. As, un varn enfermo (xY) tendr todos sus hijos varones sanos (XY) y todas las hijas enfermas (Xx), mientras que una mujer enferma (Xx) tendr un 50% de su descendencia enferma, independientemente del sexo. Algunas de estas enfermedades son letales en varones (xY), de modo que slo existen mujeres enfermas (y varones con Sndrome de Klinefelter, XxY).

Recesivo ligado al X

Las enfermedades recesivas ligadas al X tambin estn Hemofilia A,Distrofia Muscular de causadas por mutaciones en el cromosoma X. Los Duchenne,Daltonismo,Distrofia varones estn ms frecuentemente afectados. Un varn muscularAlopecia andrognica portador siempre ser enfermo (xY) dado que slo

posee un cromosoma X, que est mutado. Su descendencia sern varones sanos (XY) e hijas portadoras (Xx). Una mujer portadora, tendr una descendencia compuesta por un 50% de hijas portadoras y un 50% de varones enfermos.

Ligado a Y

Son enfermedades causadas por mutacin en el cromosoma Y. En consecuencia, slo puede manifestarse en varones, cuya descendencia ser del 100% de hijas sanas y el 100% de hijos varones Infertilidad masculina hereditaria enfermos. Dadas las funciones del cromosoma Y, frecuentemente estas enfermedades slo causan infertilidad, que a menudo puede ser superada teraputicamente.

Enfermedades causadas por mutacin en genes del genoma mitocondrial. Dadas la particularidades de dicho genoma, su transmisin es matrilineal (el genoma mitocondrial se transfiere de madres a hijos). Neuropata ptica Mitocondrial La gravedad de una mutacin depende del porcentaje Leber (LHON) de genomas afectados en la poblacin de mitocondrias, fenmeno denominado heteroplasmia (en contraste con heterocigosis), que vara por segregacin mittica asimtrica.

hereditaria

de

[editar]Trastornos polignicos y multifactoriales


Otras alteraciones genticas pueden ser mucho ms complejas en su asociacin con un fenotipo patolgico. Son las enfermedades multifactoriales o polignicas, es decir, aquellas que estn causadas por la combinacin de mltiples alelos genotpicos y de factores exgenos, tales como el ambiente o el estilo de vida. En consecuencia no presentan un patrn hereditario claro, y la diversidad de factores etiolgicos y de riesgo dificulta la estimacin del riesgo, el diagnstico y el tratamiento. Algunos ejemplos de enfermedades multifactoriales con etiologa parcialmente gentica son:

autismo enfermedad cardiovascular hipertensin diabetes obesidad cncer

[editar]Alteraciones

cromosmicas

Las alteraciones genticas pueden producirse tambin a escala cromosmica (cromosomopatas), causando severos trastornos que afectan a mltiples genes y que en muchas ocasiones son letales provocando abortos prematuros. Frecuentemente estn provocadas por un error durante la divisin celular, que sin embargo no impide su conclusin. Las alteraciones cromosmicas reflejan una anormalidad en el nmero o en la estructura de los cromosomas, por lo que se clasifican en numricas y estructurales. Provocan fenotipos muy diversos, pero frecuentemente presentan unos rasgos comunes:

Retraso mental y retraso del desarrollo. Alteraciones faciales y anomalas en cabeza y cuello. Malformaciones congnitas, con afectacin preferente de extremidades, corazn, etc.

[editar]Numricas
Frecuencias de aneuploidas por cada 1000 nacidos vivos.
10

Aneuploida

Frecuencia (/1000) 1,5 0,12 0,07

Sndrome

Trisoma 21 Trisoma 18 Trisoma 13

de Down de Edwards de Patau de Turner de Klinefelter del XYY

Monosoma X 0,4 XXY XYY 1,5 1,5

Es una alteracin del nmero normal de cromosomas de un individuo, que normalmente presenta 23 pares de cromosomas (46 en total), siendo cada dotacin cromosmica de un progenitor (diploida). Si la alteracin afecta a un slo par de cromosomas se habla deaneuploida, de manera que puede haber un slo cromosoma (monosoma) o ms de dos (trisoma, tetrasoma...). Un ejemplo de granprevalencia es la trisoma 21, responsable del Sndrome de Down. Si por el contrario la alteracin afecta a todos los cromosomas se habla de euploidas, de manera que en teora el individuo tiene una sola dotacin cromosmica (haploida, 23 cromosomas en total) o ms de dos dotaciones (triploida: 69 cromosomas; tetraploida: 92 cromosomas...). En la prctica las euploidas causan letalidad embronaria (abortos) siendo muy pocos los nacidos vivos, y fallecen muy tempranamente. Las aneuploidas son mayoritariamente letales, salvo las trisomas de los cromosomas 13, 18, 21, X e Y (XXY, XYY), y la

monosoma del cromosoma X. En la tabla se muestran las frecuencias de nacidos vivos con estas alteraciones.

[editar]Estructurales
Se denominan as las alteraciones en la estructura de los cromosomas, tales como las grandes deleciones o inserciones, reordenaciones del material gentico entre cromosomas... detectables mediante tcnicas de citogentica.

Deleciones: eliminacin de una porcin del genoma. Algunos trastornos conocidos son el Sndrome de Wolf-Hirschhorn por delecin parcial del brazo corto del cromosoma 4 (4p), y el Sndrome de Jacobsen o delecin 11q terminal.

Duplicaciones: una regin considerable de un cromosoma se duplica. Un ejemplo es la enfermedad de Charcot-Marie-Tooth tipo 1A, que puede ser causada por duplicacin del gen codificante de la protena mielnica perifrica 22 (PMP22) en el cromosoma 17.

Translocaciones: cuando una porcin de un cromosoma se transfiere a otro cromosoma. Hay dos tipos principales de translocaciones: la translocacin recproca, en la que se intercambian segmentos de dos cromosomas distintos, y la translocacin Robertsoniana, en la que dos cromosomas acrocntricos (13, 14, 15, 21, 22) se fusionan por suscentrmeros (fusin cntrica).

Inversiones: una parte del genoma se rompe y se reorienta en direccin opuesta antes de reasociarse, con lo que dicha secuencia aparece invertida. Pueden ser paracntricas (si afectan slo a una brazo) o pericntricas (si la secuencia invertida incluye el centrmero).

Cromosomas en anillos: una porcin del genoma se rompe y forma un anillo por circularizacin. Esto puede ocurrir con prdida de material o sin prdida de material.

Isocromosomas: cromosomas simtricos, con sus dos brazo idnticos por delecin de uno de los brazos y duplicacin del otro. El ms habitual es el isocromosoma X, en el que se pierde el brazo corto del cromosoma X, originando fenotipos de Sndrome de Turner.

Los sndromes de inestabilidad cromosmica son un grupo de trastornos caracterizados por una gran inestabilidad de los cromosomas, que sufren con gran frecuencia alteraciones estructurales. Estn asociados con un aumento de la malignidad de neoplasias.

[editar]Evolucin

Los estudios de genmica comparada se basan en comparacin de secuencias genmicas a gran escala, generalmente mediante herramientas bioinformticas. Dichos estudios permiten ahondar en el conocimiento de aspectos evolutivos de escala temporal y espacial muy diversa, desde el estudio de la evolucin de los primeros seres vivos hace miles de millones de aos o las radiaciones filogenticas en mamferos, hasta el estudio de las migraciones de seres humanos en los ltimos 100.000 aos, que explican la actual distribucin de las distintas razas humanas.

[editar]Genmica

comparada entre distintas especies

Los estudios de genmica comparada con genomas de mamferos sugieren que aproximadamente el 5% del genoma humano se ha conservado evolutivamente en los ltimos 200 millones de aos; lo cual incluye la gran mayora de los genes y secuencias reguladoras. Sin embargo, los genes y las secuencias reguladoras actualmente conocidas suponen slo el 2% del genoma, lo que sugiere que la mayor parte de la secuencia genmica con gran importancia funcional es desconocida. Un porcentaje importante de los genes humanos presenta un alto grado de conservacin evolutiva. La similitud entre el genoma humano y el del chimpanc (Pan troglodytes) es del 98,77%. En promedio, una protena humana se diferencia de suortloga de chimpanc en tan slo dos aminocidos, y casi un tercio de los genes tiene la misma secuencia. Una diferencia importante entre los dos genomas es el cromosoma 2 humano, que es el producto de una fusin entre los cromosomas 12 y 13 del chimpanc14 Otra conclusin de la comparacin del genoma de distintos primates es la notable prdida de genes de receptores olfativos que se ha producido paralelamente al desarrollo de la visin en color (tricrmica) durante la evolucin de primates.15

[editar]Genmica

comparada entre genomas humanos

Mapa de las migraciones humanas creado a partir de genmica comparada con los genomas mitocondriales de individuos actuales. Los nmeros de la leyenda representan miles de aos antes del presente. La lnea azul rayada delimita el rea cubierta de hielo o de tundra durante la ltima glaciacin. Las letras englobadas por crculos indican los halogrupos de ADN mitocondrial; los halogrupos se usan para definir subpoblaciones genticas, que frecuentemente tienen una correlacin geogrfica. Los principales halogrupos de ADNmt son: Africa: L, L1, L2, L3. Oriente prximo: J, N. Europa meridional: J, K. Europa (general): H, V. Europa septentrional: T, U, X. Asia: A, B, C, D, E, F, G (en el dibujo: M est compuesta por C, D, E, y G). Nativos Americanos: A, B, C, D y a menudo X. Vase el artculo: Haplogrupos de ADN mitocondrial humano.

Durante dcadas las nicas evidencias que permitan profundizar en el conocimiento del origen y la expansin del Homo sapiens han sido los escasos hallazgos arqueolgicos. Sin embargo, en la actualidad, los estudios de genmica comparada a partir de genomas de individuos actuales de todo el mundo, estn aportando informacin muy relevante. Su fundamento bsico consiste en identificar un polimorfismo, una mutacin, que se asume que se origin en un individuo de una poblacin ancestral, y que ha heredado toda su descendencia hasta la actualidad. Adems, dado que las mutaciones parecen producirse a un ritmo constante, puede estimarse la antigedad de una determinada mutacin en base al tamao del haplotipo en el que se sita, es decir, el tamao de la secuencia conservada que flanquea la mutacin. Esta metodologa se ve complicada por el fenmeno de recombinacin entre los pares de cromosomas de un individuo, procedentes de sus dos progenitores. Sin embargo, hay dos regiones en las que no existe dicho inconveniente porque presentan una herencia uniparental: el genoma mitocondrial (de herencia matrilineal), y el cromosoma Y (de herencia patrilineal). En las ltimas dcadas, los estudios de genmica comparada basada en el genoma mitocondrial, y en menor medida en el cromosoma Y, han reportado conclusiones de gran inters. En diversos estudios se ha trazado la filogenia de estas secuencias, estimndose que todos los seres humanos actuales comparten un antepasado femenino comn que vivi en frica hace unos 150.000 aos. Por su parte, por razones an poco conocidas, la mayor convergencia del ADN del cromosoma Y establece que el antepasado masculino comn ms reciente data de hace unos 60.000 aos. Estos individuos han sido bautizados como Eva mitocondrial e Y-cromosoma Adan. La mayor diversidad de marcadores genticos y en consecuencia, los haplotipos de menor longitud, se han hallado en frica. Todo el resto de la poblacin mundial presenta slo una pequea parte de estos marcadores, de modo que la composicin genmica del resto de la poblacin humana actual es slo un subconjunto de la que puede apreciarse en frica. Esto induce a afirmar que un pequeo grupo de seres humanos (quiz en torno a un millar) emigr del continente africano hacia las costas de Asia occidental, hace unos 50.000-70.000 aos, segn estudios basados en el genoma mitocondrial. Hace unos 50.000 aos alcanzaron Australia y hace en torno a 40.000-30.000 aos otras subpoblaciones colonizaron Europa occidental y el centro de Asia. Asimismo, se estima que hace 20.000-15.000 aos alcanzaron el

continente americano a travs del estrecho de Bering (el nivel del mar era menor durante la ltima glaciacin, oglaciacin de Wrm o Wisconsin), poblando Sudamrica hace unos 15.000-12.000 aos. No obstante, estos datos slo son estimaciones, y la metodologa presenta ciertas limitaciones. En la actualidad, la tendencia es combinar los estudios de genmica comparada basados en el ADN mitocondrial con anlisis de la secuencia del cromosoma Y.

[editar]Genoma

mitocondrial

Es el genoma propio de las mitocondrias de clulas eucariotas. La mitocondria es un orgnulo subcelular esencial en el metabolismo aerobio u oxidativo de las clulas eucariotas. Su origen es endosimbionte, es decir, antiguamente fueron organismos procariotas independientes captados por una clula eucariota ancestral, con la que desarrollaron una relacin simbitica. Las caractersticas de su genoma, por tanto, son muy semejantes a las de un organismo procariota actual, y su cdigo gentico es ligeramente distinto al consideradouniversal. Para adaptarse al nicho intracelular y aumentar su tasa de replicacin, el genoma mitocondrial se ha ido reduciendo sustancialmente a lo largo de su coevolucin, presentando en la actualidad un tamao de 16.569 pares de bases. As, la gran mayora de las protenas localizadas en las mitocondrias (~1500 en mamferos) estn codificadas por el genoma nuclear (al que hacen referencia todos los apartados anteriores), de modo que muchos de estos genes fueron transferidos de la mitocondria al ncleo celular durante la coevolucin de la clula eucariota. En la mayora de mamferos, slo la hembra transmite al zigoto sus mitocondrias, por lo que presentan, como ya se ha dicho, un patrn hereditario matrilineal. En general una clula humana media contiene 100-10.000 copias del genoma mitocondrial por cada clula, a razn de unas 2-10 molculas de ADN por mitocondria.

Diagrama simplificado del genoma mitocondrial. Pueden apreciarse los 37 genes y la secuencia origen de replicacin no codificante. En este esquema no se seala la cadena ligera y la pesada.

El genoma mitocondrial posee 37 genes:10

13 genes codificantes de protenas: codifican 13 polipptidos que forman parte de los complejos multienzimticos de la fosforilacin oxidativa (sistema OXPHOS). Son 7 subunidades del Complejo I (NADH deshidrogenasa), una subunidad del complejo III (citocromo b), 3 subunidades del Complejo IV (citocromo oxidasa) y 2 subunidades del Complejo V (ATPsintasa).

2 genes ARNr, que codifican las dos subunidades del ARN ribosmico de la matriz mitocondrial. 22 genes ARNt, que codifican los 22 ARN transferentes necesarios para la sntesis proteica en la matriz mitocondrial.

Al contrario de lo que suceda con el genoma nuclear, donde slo el 1,5% era codificante, en el genoma mitocondrial el 97% corresponde a secuencias codificantes. Es una nica molcula de ADN doble hebra circular. Una de las hemihebras recibe el nombre de cadena pesada o cadena H, y contiene 28 de los 37 genes (2 ARNr, 14 ARNt y 12 polipptidos). La hemihebra complementaria (cadena ligera o L) codifica los 9 genes restantes. En ambas cadenas, los genes de los ARNt aparecen distribuidos entre dos genes ARNr o codificantes de protenas, lo cual es de gran importancia para el procesamiento del ARN mitocondrial.

Das könnte Ihnen auch gefallen