El Proyecto Genoma Humano (1990-2003) ha sido uno de los
desafos cientfficos ms grandes desarrollados en la historia. Fue un esfuerzo de colaboracin internacional cuyo principal objetivo fue secuenciar y mapear el genoma humano.
El Proyecto Genoma Humano fue desarrollado por un consorcio
internacional llamado Organizacin del Genoma Humano (HUGO), el que secuenci el ADN de un grupo annimo de donantes que representaban a distintos grupos tnicos. Luego, en 1998 una iniciativa privada desarrollada por la empresa Celera Genomics inici la secuenciacin del genoma de cinco etnias diferentes. En enero del ao 2001, ambos grupos publicaron simultneamente el primer borrador de la secuencia correspondiente al 90% de genoma humano, y en abril del ao 2003, se public la secuencia final. Una vez finalizada la secuenciacin del genoma humano, la tecnologa desarrollada ha sido aprovechada para secuenciar el genoma de distintas especies, desde bacterias hasta mamferos. Ya han sido secuenciados ms de 500 genomas completos, y varios cientos de otros genomas estn en proceso. La mayorfa de los genomas secuenciados son de bacterias, debido a que poseen menor tamao y es ms fcil completarlos. Otras especies de mamferos cuyos proyecto genoma estn ms o menos finalizados son el ratn (Mus musculus), la rata (Rattus norvegicus), el chimpanc (Pan troglodites) y la vaca (Bos taurus).
Informacin contenida en el genoma humano
El anlisis de la secuencia del genoma ha arrojado resultados
sorprendentes. El primero de ellos es que el nmero total de genes presentes en nuestro genoma (30.000) es inferior a lo que se esperaba. Las estimaciones preliminares pronosticaban que existan al menos 100.000 genes en nuestras clulas.
Otro resultado est relacionado con las secuencias codificantes (exones).
Un gen humano contiene, en promedio, 8 a 9 exones cada uno, con una secuencia de 1.350 pares de bases, aunque ambos valores presentan una enorme diversidad entre los distintos genes. Considerando el nmero total de genes y el tamao promedio de las secuencias codificantes, se estima que menos del 2% de nuestro genoma corresponde a secuencias que codifican protenas.
Tambin se revel que la densidad de genes vara en los distintos
cromosomas, siendo el cromosoma 19 el ms denso, con 30 genes/milln de pares de bases, y el cromosoma 13 el menos denso, con solamente 5 genes/milln de pares de bases.
Otra observacin interesante es que alrededor del 50% del genoma
corresponde a distintas secuencias repetitivas que no contienen genes, algunas de las cuales pueden movilizarse a otras partes del genoma.
Existen adems diversas familias de genes que presentan una alta
similitud de secuencias entre s y que se han generado durante la evolucin por duplicacin gnica. Algunos ejemplos destacables son los cientos de genes que codifican para los receptores que permiten percibir distintos olores y las protenas que forman parte de la hemoglobina.
Finalmente, se registraron variaciones en la secuencia del ADN que
cambian un nucletido por otro distinto. Estas variantes se conocen como SNP (polimorfismos de un solo nucletido o Single Nucleotide Polymorphisms). Por ejemplo, la secuencia CCTATA cambia una citosina (C) por una timina (T), generando la secuencia CITATA. Si una de estas variaciones est presente en al menos en un 1% de la poblacin se considera que es un SNP. Los SNP constituyen alrededor del 90% de todas las variaciones genmicas humanas, y existe un SNP cada 100 a 300 bases a lo largo del genoma humano, lo que equivale a 10 millones de SNP en total. Dos tercios de los SNP corresponden a la sustitucin de una C por una T. Estas variaciones en la secuencia del ADN son las ms importantes en la determinacin de las diferencias fenotpicas entre los individuos, y probablemente estn involucradas en el desarrollo de enfermedades hereditarias.
Aunque la secuenciacin del genoma ya se complet, el anlisis de las
secuencias y de la expresin de los genes es una tarea que continuar por muchos aos ms.