Sie sind auf Seite 1von 10

UNIVERSIDAD DE NARIÑO

FACULTAD DE CIENCIAS DE LA SALUD


BIOLOGÍA CELULAR Y MOLECULAR
EJERCICIO BIOINFORMATICO PARA REFORZAR LOS CONCEPTOS DE
ESTRUCTURA Y EXPRESIÓN GÉNICA Y ANALIZAR LA RELACIÓN ENTRE
SECUENCIA GÉNICA Y PROTEICA.
Bairon Pantoja & Fabián Campiño1
Elizabeth Portilla 2
1. Estudiantes de Medicina; 2. Docente Universidad de Nariño, Pasto, Colombia,
Departamento de Medicina

INTRODUCCION.
La Biología Molecular ha revelado en el último siglo varios de los mecanismos
fundamentales que sustentan el funcionamiento de la célula. Hoy en día, el papel de las
biomoléculas poliméricas -el ácido desoxirribonucleico (ADN), el ácido ribonucléico (ARN)
y las proteínas en la salud y en las aplicaciones biotecnológicas se estudia en todos los
niveles. Algunos de los conocimientos más populares derivados de la biología molecular
son la codificación química de información en el ADN, la secuenciación de los genomas de
los organismos, la posibilidad de las terapias génicas, el diagnóstico molecular de
enfermedades y la clonación de genes(Peña et al. 2013).
Recientemente, la secuenciación de ácidos nucleicos se ha colocado de nueva cuenta en
la frontera de la investigación. ADN, ARN y Proteínas forman el orden del flujo de la
información genética en todas las células y los tres son polímeros lineares. El objetivo de la
secuenciación es conocer exactamente el orden de sus monómeros. Del orden de los
nucleótidos en el ADN y ARN se puede inferir su evolución y su función (al menos en teoría),
lo mismo ocurre con los aminoácidos de las proteínas.
Debido a la gran capacidad de obtención de información que permiten los estudios de
secuenciación, un reto moderno muy importante es optimizar los métodos bioinformáticos
necesarios para analizar estos datos de las secuencias estudiadas y obtener de ellos la
mayor cantidad de información biológica posible de manera intuitiva (Boyle et al., 2012).
Objetivo general.

 Reforzar los conceptos de estructura y expresión génica.


Objetivos específicos.

 Analizar la relación entre secuencia génica y proteica.


Materiales y métodos.
1. Consecución y almacenamiento de las secuencias del ADN.
Inicialmente se procedió a buscar en bases de datos las secuencias completas de
nucleótidos y aminoácidos del gene silvestre unc-22 (No acceso: X15423.1) y de la
proteína resultante “Twitchin”. Además se obtuvo la posición de los exones y los intrones
del unc-22 y la secuencia nucleotidica de Tc5 (No acceso: U12433.1). Estas se
procedieron a guardar para su posterior uso.
Imagen 1. Secuencias de interés almacenadas en formato fasta.

Con las secuencias de interés disponibles para ser manipuladas se procedió a realizar el
splicing correspondiente para trabajar con una secuencia corta.
2. Construcción del cDNA silvestre de unc-22 y determinación de su ORF.
Seguidamente se utilizó las secuencias anteriores y se procedió a obtener un cDNA
silvestre de unc-22 el cual es un producto de la manipulación de una secuencia de DNA
que es complementaria al mRNA que es procesado del gene unc-22. Esto se logró
siguiendo detalladamente los pasos de la guía de trabajo, además se determinó el ORF
dentro del cDNA marcando el primer nucleótido del codón de inicio. Para procesar la
secuencia de unc-22 cada una de las secuencias intronicas fuero removidas en orden
reverso, una vez eliminado el primer intron se eliminó la secuencia antes del primer exón
correspondientes a las posiciones 1 a 14069.

Imagen 2. cDNA unc-22 silvestre y ORF.

Imagen 3. Proteína silvestre, Twitchin.

Al obtener esta secuencia molde, se procedió a realizar la construcción de su mutante la


cual ocasionara que C. elegans presente una contracción muscular no regulada que le
ocasionara un tick corporal distintivo.
Este resultado se lo guardo en formato de texto en una carpeta denominada edición de
secuencias con el nombre de unc-22 cDNA. Para la determinación del ORF dentro del
cDNA se colocó el cursor a la derecha del nucleótido 14070 y se dio clic en
“Sequence/Nucleica cid/ Find next ORF, se copió la secuencia y se la pego en una nueva
ventana.
- Construcción del cDNA unc-22 mutado por Tc5 y determinación de su ORF.
Mediante una serie sucesiva de pasos se dio click en abrir el archivo Tc5, donde se procedió
a copiar toda la secuencia, posteriormente se abrió una ventana de alineamiento en Bioedit,
donde se abrió el archivo unc-22 ORF, donde se procedió a insertar el Tc5 al interior del
marco de lectura abierto, para ello se digito en la ventana de dialogo la secuencia
TAAAGTTGGAGAGAC que es el sitio de inserción del Tc5. Para realizar la inserción se
colocó el cursor al final de la C marcada y se pegó la secuencia del Tc5. Seguidamente se
posiciono el cursor a la izquierda del primer nucleótido de la secuencia y se dio clic en
“Sequence/Nucleica cid/ Find next ORF se copió la secuencia y se la guardo con el nombre
de unc-22/Tc5 ORF.

Imagen 4. cDNA unc-22 mutado por Tc5 y determinación de su ORF

3. Traducción del mRNA del unc-22


Después de la remoción de las secuencias intronicas se procedió a traducir la secuencia
nucleotidica restante, para ellos e abrió el archivo unc-22 ORF, se seleccionó en la ventana
mode “Edit” y se dio clic en la secuencia, posterior a esto se escogió la opción “Trasnlate in
select frame (permanent)”, se guardó la secuencia como “proteína silvestre Twitchin,
posterior a ello se abrió el archivo unc-22/Tc5 ORF, se selecciojo la ventana edit y se dio
clic en la secuencia. Posterior a esto se escogió la opción “Trasnlate in select frame
(permanent)”, donde la nueva ventana contiene la secuencia de aminoácidos en el código
de una sola letra especificado por el mRNA del unc-22 posee la secuencia del Tc5. Se
guardó y se cerró todas las ventanas.
Imagen 5. Secuencia de aminoácidos en el código de una sola letra especificado por mRNA

Esta secuencia completa nos permitirá realizar el respectivo alineamiento y así poder
comprobar si existe homología entre esta secuencia y las secuencias de la proteína
Twitchin silvestre y mutada por Tc5 que se ha construido.

4. Alineamiento y comparación de las secuencias Twitchin.


Normalmente dos secuencias tienen una alta similitud porque son homólogas, es decir
comparten un ancestro común. A diferencia de la similitud, la homología no es un término
cuantitativo, dos secuencias o son homólogas o no lo son. La acumulación de mutaciones
en el ADN a lo largo del tiempo es la causa de que las secuencias de un mismo gen en dos
especies distintas no sean idénticas, cuanto más tiempo pase desde el último antecesor
común más diferentes serán las secuencias.
Para comprobar si estas secuencias son homologas, se procedió a abrir los archivos
“proteina silvestre Twitchin”, “proteína mutante Tc5” y “Twitchin”, se copió cada una de las
secuencias y se las pego en la ventana denominada alineamiento de proteínas,
posteriormente se creó una secuencia consenso dando clic en “Aignment/Create
Consensus Sequence”. Se dio clic en “Shade Idientities and similarities in alignment
window” y para observar el porcentaje se dio clic en la ventana “shade threshold” y se
seleccionó comparación al 100%.
Imagen 6. Alineamiento de proteína silvestre y mutante.

Discusión.
El análisis de la secuencia de ADN, es el descubrimiento de similitudes funcionales y
estructurales, y las diferencias entre múltiples secuencias biológicas. Este análisis incluye
la alineación de secuencias, la búsqueda en la base de datos de secuencias, el
descubrimiento de patrones, la reconstrucción de las relaciones evolutivas, y la formación
y la comparación del genoma. Se ha encontrado que dos secuencias similares poseen el
mismo papel funcional. La comparación se puede hacer desde aspectos de comportamiento
bioquímico o de acuerdo a la estructura de la proteína. Si hay dos secuencias de diferentes
organismos son similares, se dice que son secuencias homologas.

La comparación de la secuencia de ADN es el primer paso hacia el análisis estructural y


funcional de las secuencias recientemente determinadas. El proceso más fundamental en
este tipo de comparación es la alineación de secuencias, proceso por el cual, se comparan
las secuencias mediante la búsqueda de patrones de caracteres comunes y el
establecimiento de los residuos de correspondencia entre las secuencias relacionadas. El
alineamiento de pares de secuencias es fundamental en la búsqueda de similitudes dentro
de la base de datos y el alineamiento de secuencias homólogas.

C. elegans es un nematodo de vida libre que habita en el suelo, sobre todo en frutas y raíces
en descomposición donde se alimenta de bacterias, y que se encuentra distribuido a lo largo
de casi todo el planeta. Este pequeño organismo de poco más de un milímetro de largo fue
propuesto como organismo modelo en la década de los 60 por Sydney Brenner por su
simplicidad para realizar estudios genéticos, por su ciclo de vida corto con progenie
numerosa, por el bajo costo y la sencillez para la manipulación experimental, además de
contar con una anatomía simple y ser transparente. Una gran ventaja que presenta C.
elegans, es la facilidad para generar mutaciones que induce modificaciones químicas en
los nucleótidos que lleva a desapareamientos y cambios en las bases nucleotídicas,

En C. elegans, unc-22 es uno de los ∼40 genes que producen nematodos adultos lentos o
paralizados y una estructura sarcomérica desorganizada, la secuencia de C.
elegans twitchin reveló que era la primera proteína intracelular en unirse a la superfamilia
de Ig y ayudó a definir la rama intracelular, principalmente muscular, de esta
superfamilia. Los mutantes unc-22 muestran una característica "contracción" de la
superficie del animal, que se origina en el músculo subyacente, y también muestran
sarcómeros desorganizados de forma variable. Los datos genéticos sugieren fuertemente
la interacción de twitchin con miosina: un alelo nulo unc-22 muestra desorganización de
filamentos gruesos y los alelos raros de sentido erróneo de unc-54 que residen en el
dominio de la cabeza de la cadena pesada de miosina B suprimen la contracción de
mutantes de unc-22 y también mejoran su locomoción y estructura muscular (Moerman et
al., 1982).

Unc-22 es una mutación sin sentido en el séptimo dominio Ig de twitchin, que cambia una
glicina altamente conservada a una arginina, y da como resultado twitchin normalmente
localizado por inmunotinción. Estudios en Aplysia y Mytilus.sugieren que la función normal
de twitchin es inhibir la tasa de relajación (Probst et al., 1994). Si esta misma función
fisiológica para twitchin pertenece al músculo C. elegans, entonces en unc-22, la inhibición
reducida de la relajación (es decir, un tiempo de relajación más rápido) podría dar como
resultado un ciclo general de contracción/relajación más rápido y, por lo tanto, una
locomoción más rápida del gusano.

En este laboratorio se pudo corroborar que tanto la proteína como la mutante poseen
similitudes en algunas partes de la cadena pero que no son totalmente homologas, esto
debido a que se está cambiando aminoácidos de la cadena, generando así que C. elegans
presente alteraciones en la proteína que le permite su locomoción, además se puco
clarificar cual es la relación entre las secuencias de aminoácidos y la función de la proteína,
y la de los aminoácidos y los nucleótidos.

Conclusiones.

 La proteína como la mutante poseen similitudes en algunas partes de la cadena


pero que no son totalmente homologas, esto debido a que se está cambiando
aminoácidos de la cadena, generando así que C. elegans presente alteraciones en
la proteína que le permite su locomoción.
 El proceso más fundamental en este tipo de comparación es la alineación de
secuencias, proceso por el cual, se comparan las secuencias mediante la búsqueda
de patrones de caracteres comunes y el establecimiento de los residuos de
correspondencia entre las secuencias relacionadas

Cuestionario.

1. Como determinar la referencia apropiada de las secuencias entre las muchas


obtenidas de tu búsqueda usando Entrez? Delimita a través de las palabras
claves.
Entrez Gene se puede acceder a toda la información relacionada con el gen que buscamos,
ese archivo contiene información relacionada con la secuencia incluyendo, quien la mandó
a la base de datos, donde se publicó y la secuencia completa del DNA y la proteína
correspondientes al fragmento clonado, secuenciado e incluido en la base de datos.
También da acceso a la secuencia mRNA, a la secuencia fuente (source sequence) que
contiene la secuencia del fragmento genómicoy que por tanto incluirá regiones 5’
“upstream”, 3’ “downstream” y en algunos casos intrones de la que se ha obtenido la
secuencia de proteína (esta secuencia puede ser interesante para diseñar plasmado que
permitan clonar la región codificante). Y a la secuencia de aminoácidos de la proteína
(product)
2. ¿Cuál es la utilidad de cada una de las herramientas del software empleadas
durante el desarrollo de este ejercicio?
NCBI tiene el banco de secuencias biológicas más grande del mundo denominado
GenBank, al cual se accede haciendo clic en el icono Genbank en el menú izquierdo (azul)
de la página principal. Además tiene una barra de búsqueda en la parte superior, con un
primer menú ubicado al lado de serch, donde escogemos el sitio de NCBI donde se desea
que se realice el procedimiento, el cual nos da la opción de ubicar secuencias de proteínas,
nucleótidos, estructuras o en Entrez (búsqueda combinada), entre otros; luego se procede
a colocar el criterio de búsqueda (por medio de palabras clave, o con numero de accesión
si se conoce).
3. ¿Cuantos aminoácidos son codificados por el ORF del gene unc-22 silvestre?
El ORF codifica 6.049 aminoácidos.
4. ¿En cuál codón del ORF de unc-22, es insertado Tc5? ¿Qué efectos tiene la
inserción del Tc5 sobre este codón? Cuantos aminoácidos son codificados por el
ORF del gene unc-22 mutante Tc5?
El trasposón Tc5 será insertado en el tercer exón del gene unc-22 entre los nucleótidos
16.114 y 16.115. Esto ocasionara que el ORF sea alterado dentro del mRNA. Son
codificados 7106 aminoácidos por el ORF del gene mutante.
5. ¿Cómo difiere la proteína producto Twitchin obtenida del gene unc-22 resulta en el
fenotipo mutante twitcher?
Cuando se da esta mutación, la relajación de los músculos de la pared corporal no es
regulada apropiadamente, resultando el temblor de todo el cuerpo. El fenotipo twitcher
podrá ser fácilmente visto al observar mutantes unc-22 jóvenes de C.elegans bajo un
microscopio de disección.
6. Plantee una explicación del porque la inserción del Tc5 en el gene unc-22 resulta
en el fenotipo mutante twitcher.
La inserción del Tc5 en el gene unc-22 resulta en el fenotipo mutante twitcher,porque al
intoducir la secuencia del Tc5, el ORF será alterado dentro del mRNA generando así una
mutación sin sentido en el séptimo dominio Ig de twitchin, que cambia una glicina altamente
conservada a una arginina.
7. En un diagrama detallado ilustre cada uno de los procesos abajo descritos y donde
ocurrirían en una célula eucariota.

 Inserción del trasposon al interior del gene


 Transcripción del gen mutado por el trasposon
 Procesamiento postranscripcional del mRNA y traducción del mRNA
Bibliografía.

 Boyle J., Kreisberg R., Bressler R., Killcoyne S. Methods for visual mining of genomic
and proteomic data atlases BMC Bioinformatics, 13 (2012), p. 58
 Benian GM, Kiff JE, Neckelmann N, Moerman DG, Waterston RH. Secuencia de una
proteína inusualmente grande implicada en la regulación de la actividad de miosina
en C. elegans. Naturaleza. 1989; 342: 45-50.
 Benian GM, L'Hernault SW, Morris ME. Complejidad de secuencia adicional en el
gen muscular, unc-22, y su proteína codificada, twitchin, de Caenorhabditis elegans.
Genética. 1993; 134: 1097–1104.
 Benian GM, Tinley TL, Tang X, Borodovsky M. El gen de Caenorhabditis elegans
unc-89, requerido para el ensamblaje de la línea M muscular, codifica una proteína
modular gigante compuesta de Ig y dominios de transducción de señales. J Cell Biol.
1996; 132: 835–848.
 Peña j, Ramírez O, Barrera B. “los métodos experimentales que permiten el estudio
de las macromoléculas de la vida: historia, fundamentos y perspectivas. Revista
Science Direct. Volumen 24. 2013
 Peña C., 2011, Métodos de inferencia filogenética, Facultad de Ciencias Biológicas
UNMSM, Rev. peru. biol. 18(2): 265 - 267, revisado: 6/12/16 3:40 p.m, recuperado
de: http://sisbib.unmsm.edu.pe/bvrevistas/biologia/v18n2/pdf/a23v18n2.pdf
 Siegman MJ, Funabara D, Kinoshita S, Watabe S, Hartshorne DJ, Butler TM. La
fosforilación de una proteína relacionada con la twitchina controla la captura y la
sensibilidad al calcio de la producción de fuerza en el músculo liso de
invertebrados. Proc Natl Acad Sci Estados Unidos. 1998; 95 : 5383-5388
 Waterston RH, Thomson JN, Brenner S. Mutantes con estructura muscular alterada
de Caenorhabditis elegans. Dev Biol. 1980; 77 : 271–302
 Zengel JM, Epstein HF. Identificación de elementos genéticos asociados con la
estructura muscular en C. elegans. Cell Motil. 1980; 1 : 73–97

Das könnte Ihnen auch gefallen