La Biología Por Otros Medios

BIOINFORMTICA,
la biologa por otros medios.
Alberto Labarga
Responsable de proyectos bioinformticos de Navarrabiomed
Fundacin Miguel Servet
Quines somos?
Navarrabiomed es la plataforma cientfica al servicio de todo aquel
profesional del Servicio Navarro de Salud que desee iniciar o consolidar
su carrera investigadora.
El centro, gestionado por
la
Fundacin
Miguel
Servet, se integra en el
recinto del Complejo
Hospitalario de Navarra lo
que permite una mayor
cercana con el entorno
clnico
y
asistencial
facilitando el desarrollo de
proyectos, ensayos y
tratamientos
experimentales.
reas
Neurociencias, Oncologa, Patologas de Grandes Sistemas y nuevos
desarrollos, Salud Mental y Vigilancia Epidemiolgica, Salud Pblica y
Servicios Sanitarios constituyen las las cinco reas de investigacin que
agrupan a un total de 27 grupos.
BIOINFORMTICA,
la biologa por otros medios.
BIOLOGA Y BIOINFORMTICA
Qu papel juega un informtico en un laboratorio
biomdico?
La vida puede verse como un proceso de almacenamiento y

transmisin de informacin biolgica.
El ADN es la molcula portadora de esta informacin.
Para entender la vida debemos identificar estas molculas y

descifrar el cdigo
We wish to propose a structure for the salt of desoxyribose

nucleic acid (DNA). This structure has novel features which are
of considerable biological interest
It has not escaped our attention that the specific pairing we

have postulated immediately suggests a possible copying
mechanism for the genetic material.
Cuando Perutz lleg a Cambridge la estructura molecular ms

grande que se haba resuelto era la del pigmento natural
ficocianina, de 58 tomos.
El tema escogido por Perutz para su tesis fue otra protena, la

hemoglobina, el transportador de oxgeno que da color rojo a
nuestra sangre.
La hemoglobina tiene
11.000
tomos.
Tard
23
aos.
Sanger determin la secuencia de los aminocidos de la insulina

en 1955. Al hacerlo, demostr que las protenas tienen
estructuras especficas.
Este resultado le vali su primer Premio Nobel de qumica en 1958
En 1955 Ochoa publica en Journal of the American Chemical

Society el descubrimiento de la polinucletido-fosforilasa
En 1959 recibe el premio Nobel junto a su discpulo Arthur

Kornberg.
Wilkins, Perutz, Crick, Steinbeck, Watson, Kendrew
En 1966 se presenta el cdigo gentico. Este cdigo asocia

a cada triplete de bases del ADN, llamado codn, un
aminocido concreto.
El primer Atlas of Protein Sequence and Structure, contena

informacin de 65 proteinas
papain
myoglobin
hemoglobin
carboxypeptidase A
ribonuclease
lactate dehydrogenase
En 1971 se crea el Protein Data Bank.

En 1974 tiene 12 estructuras
Frederick Sanger publica en 1975 un mtodo para la

"Secuenciacin del ADN mediante sntesis enzimtica".
El primer genoma de ADN completamente secuenciado fue

el del bacterifago X174, en 1977
5,386 bases
11 genes
En 1984 el DoE invita a 20 investigadores a Alta, Utah, para

discutir los efectos de la radiacin en el ADN.
Por la noche, entre cerveza y cerveza, alguien comenta,

por que no dedican el dinero a algo util, como secuenciar
el genoma humano?
Andre Marion y Sam Eletr de Hewlett Packard crean Applied

Biosystems En 1987 comercializan la primera mquina de
secuenciacin automatizada, el modelo ABI 370.
en
Ejercicio 1: Imagine varias copias

de un libro, cortadas en 10 millones
de trocitos cada una, de manera
que los trocitos se solapan.
Supongamos que 1 milln de
trocitos se han perdido, y que los
otros 9 millones estn manchados
de tinta.
Recupere el texto original.
1995.- El primer genoma completo de un organismo vivo,

Hemophilus influenzae. 1.8Mb, 3000 genes x 00
1996.- El genoma de la levadura (eukaryota). 12.000.000 de

bases y 6000 genes
1997.- El genoma de la bacteria E. Coli. 4.500.000 de bases

y 4600 genes
1998.- El genoma del gusano C. Elegans. 100.000.000 de

bases y 18.000 genes
1999.- Se consigue la secuencia completa del cromosoma 22.

49,000,000 bp. (slo 300 genes) (en realidad, 673)
2000.- La mosca de la fruta; 170 millones de nucleotidos y

13,000 genes
2000.- Arabidopsis thaliana. Tiene 100 millones de nucletidos, y

unos 20,000 genes
15 de Febrero de 2001: se publica el borrador de la

secuencia del genoma humano
3,000,830,137
bases
600.000x
11 aos
3,000,000,000 $
20,000 genes
What makes you

think you can do a
better job with life
and genetics than
God?
We have computers!
1953: IBM presenta su primera computadora electrnica

comercial, la IBM 701 con una memoria total de una memoria
total de 2048 palabras de 36 bits
1977: No hay necesidad de tener un ordenador en cada

casa", Ken Olsen, fundador de Digital Equipment
1981: IBM PC A Intel 8088 processor running at 4.77 MHz.

Basic in ROM. 16K RAM. MS-DOS 1.0
"Nadie va a necesitar ms de 640 Kb de memoria en su

ordenador personal"
En 1981 se crea EMBL Nucleotide Sequence Data Library.

Version 2 contenia 811 secuencias, cerca de un milln de
bases que fueron introducidas a mano.
S.F. Altschul, et al. (1990), "Basic Local Alignment Search

Tool," J. Molec. Biol., 215(3): 403-10, 1990. 15,306 citations
J. Thompson, T. Gibson, D. Higgins (1994), CLUSTAL W:

improving the sensitivity of progressive multiple sequence
alignment. Nuc. Acids. Res. 22, 4673 - 4680
http://www.flickr.com/photos/jpf/152611490/
Ley de Moore: el nmero de transistores en un chip se duplica

cada 18 meses
La capacidad de almacenamiento se duplica cada 2 aos
El ancho de banda se duplica cada 18 meses
una memoria principal de 100 Terabytes, una posibilidad de

almacenamiento en disco de 2 Petabytes y est conectado a un
sistema de almacenamiento de ficheros que supera los 11
Petabytes, 1.100 billones de operaciones cada segundo
30.000
genes
1500
genes
150
genes
50
elements
10
targets
Golub et. al. Science 286:531-537. (1999
16,000 cancer patients and

more than 25 cancer types
http://www.flickr.com/photos/nic221/391536867/
Y esto no ha hecho
ms que empezar!!
2002: mus musculus
2003: gallus gallus
2005: pan troglodytes
2006: opposum
2007: platypus
2008: mammoth
2008: homo neardenthalensis
2008: Watson personal genome
Roche / 454
Genome Sequencer FLX
100 Mb / run
Applied Biosystems
ABI 3730XL
1 Mb / day
Illumina / Solexa
Genetic Analyzer
2000 Mb / run
Applied Biosystems
SOLiD
3000 Mb / run
Google quiere almacenar tu genoma

Por 25 dlares al ao (20 euros), Google
Genomics guardar una copia de cualquier
genoma en la nube.
Google est presentado a hospitales y
universidades su nueva oferta: Tenis
genomas? Almacenadlos con nosotros.
Google Genomics podra tener ms
relevancia que estos otros proyectos de mayor
dificultad. Conectar y comparar miles de
genomas, y muy pronto millones, es lo que
impulsar los descubrimientos mdicos de la
prxima dcada. La cuestin sobre quin va a
almacenar los datos ya es un punto lgido de
competencia entre Amazon, Google, IBM y
Microsoft.
Hay cientficos que creen que los datos del genoma siguen siendo demasiado complejos
como para que Google pueda servir de ayuda. Pero otros creen que se avecina un gran
cambio. Cuando el experto en bioinformtica en Stanford (EEUU) Atul Butte asisti a la
presentacin que hizo Google de sus planes para este ao, coment que ahora entenda
"cmo se sintieron las agencias de viajes cuando descubrieron Expedia".
Maximilien Brice, CERN
Muchas gracias
por su atencin
Alberto Labarga
alberto.labarga.gutierrez@navarra.es
@alabarga
Quires conocer ms sobre nuestra actividad investigadora o estar al da de las novedades del
centro (cursos, seminarios, ofertas de empleo...)?
www.navarrabiomed.es
info.navarrabiomed@navarra.es

La Biología Por Otros Medios

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

La Biología Por Otros Medios

Hochgeladen von

Copyright:

Verfügbare Formate

BIOINFORMTICA,

la biologa por otros medios.

La vida puede verse como un proceso de almacenamiento y

El ADN es la molcula portadora de esta informacin.

Para entender la vida debemos identificar estas molculas y

We wish to propose a structure for the salt of desoxyribose

It has not escaped our attention that the specific pairing we

Cuando Perutz lleg a Cambridge la estructura molecular ms

El tema escogido por Perutz para su tesis fue otra protena, la

Sanger determin la secuencia de los aminocidos de la insulina

Este resultado le vali su primer Premio Nobel de qumica en 1958

En 1955 Ochoa publica en Journal of the American Chemical

En 1959 recibe el premio Nobel junto a su discpulo Arthur

Wilkins, Perutz, Crick, Steinbeck, Watson, Kendrew

En 1966 se presenta el cdigo gentico. Este cdigo asocia

El primer Atlas of Protein Sequence and Structure, contena

En 1971 se crea el Protein Data Bank.

Frederick Sanger publica en 1975 un mtodo para la

El primer genoma de ADN completamente secuenciado fue

En 1984 el DoE invita a 20 investigadores a Alta, Utah, para

Por la noche, entre cerveza y cerveza, alguien comenta,

Andre Marion y Sam Eletr de Hewlett Packard crean Applied

Ejercicio 1: Imagine varias copias

1995.- El primer genoma completo de un organismo vivo,

1996.- El genoma de la levadura (eukaryota). 12.000.000 de

1997.- El genoma de la bacteria E. Coli. 4.500.000 de bases

1998.- El genoma del gusano C. Elegans. 100.000.000 de

1999.- Se consigue la secuencia completa del cromosoma 22.

2000.- La mosca de la fruta; 170 millones de nucleotidos y

2000.- Arabidopsis thaliana. Tiene 100 millones de nucletidos, y

15 de Febrero de 2001: se publica el borrador de la

What makes you

1953: IBM presenta su primera computadora electrnica

1977: No hay necesidad de tener un ordenador en cada

1981: IBM PC A Intel 8088 processor running at 4.77 MHz.

"Nadie va a necesitar ms de 640 Kb de memoria en su

En 1981 se crea EMBL Nucleotide Sequence Data Library.

S.F. Altschul, et al. (1990), "Basic Local Alignment Search

J. Thompson, T. Gibson, D. Higgins (1994), CLUSTAL W:

Ley de Moore: el nmero de transistores en un chip se duplica

La capacidad de almacenamiento se duplica cada 2 aos

El ancho de banda se duplica cada 18 meses

una memoria principal de 100 Terabytes, una posibilidad de

Golub et. al. Science 286:531-537. (1999

16,000 cancer patients and

2002: mus musculus

2003: gallus gallus

2005: pan troglodytes

2008: homo neardenthalensis

2008: Watson personal genome

Google quiere almacenar tu genoma

Maximilien Brice, CERN

Das könnte Ihnen auch gefallen