Beruflich Dokumente
Kultur Dokumente
Ardala Breda, Napoleo Fonseca Valadares, Osmar Norberto de Souza, y Charles Richard Garratt. Informacin del Autor Creado: 1 de may de 2006; ltima actualizacin: 14 de septiembre de 2007.
inmunolgico, encargado de la defensa de nuestro cuerpo, se basa en la estructura de reconocimiento, en la diferenciacin del yo del no-yo, lo que slo puede ser posible a travs de clulas especializadas que se pueden unir e identificar lo que es ajeno al cuerpo. Tales procesos de reconocimiento se produce a travs de interacciones protena-protena en la superficie de las clulas del sistema inmune, donde la afinidad de unin se puede determinar si ser o no ser iniciada una respuesta inmune, y tambin donde no asignadosinteracciones protena o el reconocimiento puede causar enfermedades auto-inmunes ( 11 , 12 ). Las reacciones bioqumicas de la respiracin celular, el oxgeno y el transporte de gas carbnico, la absorcin de alimentos, el consumo de energa, almacenamiento de energa, el calor o reacciones fisiolgicas fros, o cualquier proceso de la vida uno puede imaginar, se lleva a cabo bsicamente por una protena o un complejo de protenas. Todos los procesos que tienen lugar en un organismo vivo tienen protenas que actan en alguna parte, de una manera precisa, desarrollado bajo la presin de la seleccin natural. Estos son slo algunos ejemplos de funcin de la protena. Un hecho notable es que todas las tareas que pueden realizar se basan en un principio comn, los veinte aminocidos que pueden formar una protena. Esa es la razn por la que el estudio de las protenas, su composicin, estructura, dinmica y funcin, es tan importante. Debemos entender cmo estas molculas veces, la forma en que se ensamblan para formar complejos, cmo funcionan, si queremos responder a preguntas como por qu tenemos cncer, por qu nos ponemos viejos, por qu nos enfermamos, cmo podemos encontrar la cura para muchas enfermedades, por qu la vida como la conocemos, ha evolucionado de esta manera y en este planeta y no en ningn otro lugar, al menos por el momento. Todas las protenas funciones dependen de su estructura, que, a su vez, depende de los parmetros fsicos y qumicos. Este es otro hecho importante en el estudio de estas molculas, clsica biolgica, fsica, qumica, matemticas y ciencias de la informtica han estado trabajando juntos en una nueva zona conocida como la bioinformtica para permitir un nuevo nivel de conocimiento de organizacin de la vida ( 13 ).
genomas completos publicados, 993 y 588 son de curso genomas procariotas y eucariotas, respectivamente, y el 28 de metagenomes ( www.genomesonline.org ( 15 )). Figura 1 Nmero de secuencias disponibles en el GenBank partir del 15 de diciembre de 2005. La explosin de datos biolgicos a mediados de los 90 se puede ver fcilmente con el crecimiento exponencial desde 1995. Para una descripcin detallada del conjunto completo de datos, consulte http://www.ncbi.nlm.nih.gov/Genbank/genbankstats.html. (ms. ..) Estos rea de datos almacenados en bases de datos o bancos de datos, cuyo nmero aumenta cada ao. Segn Galperin ( 16 ), hay 858 bases de datos, 139 ms que el ao anterior, a disposicin del pblico. La cantidad de datos producidos inst a la necesidad de formas rpidas y fiables de acceso, recuperacin, investigacin y comprensin de estos datos ( 13 , 17 ). Herramientas bioinformticas se utilizan para realizar estas tareas en todas las bases de datos biolgicos, de los cuales GenBank ( 18 ) en el NCBI y RCSB / AP ( 19 ) son los ms representativos de secuencias y estructuras, respectivamente.
La figura 2 Crecimiento del nmero total de estructuras en la base de datos RCSB / AP (Kouranov et al., 2006). El crecimiento exponencial sigue el mismo patrn de la figura 1. Al igual que en las secuencias de GenBank nr, si usamos un 90% secuencia de identidad de corte para eliminar la redundancia en el banco de datos de estructura de protenas que terminamos con 12.611 grupos o conjuntos distintos de estructuras [ Estadsticas actuales sobre la redundancia en el Protein Data Bank RCSB ]. Si ahora suponemos que este nmero representa los diferentes tipos de pliegues de protenas conocidas y compararlo con los diferentes tipos de secuencias de protenas conocidas, a partir de la base de datos del GenBank nr , se concluye que slo el 0,38% de las secuencias de protenas disponibles sabido pliegues. Uso de 1028, el nmero actual de pliegues determinados por la SCOP [ Como pliegues definidos por la SCOP , ( 21 , 22 )], el nmero de secuencias de protenas con pliegues conocidos, 0,03%, es considerablemente ms pequeo. Esto es en parte debido a la mayor velocidad con la que las secuencias de protenas se puede determinar (a partir de CDS) en comparacin con la determinacin de nuevas estructuras 3D de protenas. [Comentario: Tambin, muchas secuencias de protenas tienen pliegues 3D similares, y muchas de estas secuencias tienen poca similitud de secuencia con otras secuencias con el mismo pliegue 3D. Esta es una razn principal por la cual el nmero de pliegues SCOP es mucho menor que la predicha por simple secuencia similitud.] Claramente, los mtodos computacionales que son complementarios a los mtodos experimentales para la determinacin de estructuras de protenas son necesarios, y stos se pueden proporcionar por bioinformtica estructural esfuerzos [revisado por 23-25]. Segn el Diccionario Ingls de Oxford, Bioinformtica Estructural est conceptualizando la biologa en trminos de molculas, en el sentido de la qumica fsica y la aplicacin de tcnicas informticas, derivados de disciplinas como las matemticas, la ciencia y la estadstica equipo, comprender, organizar y explorar la informacin estructural asociada a estas molculas a gran escala ( 13 ). Hay varios mtodos de clculo para la determinacin de la estructura de protenas, incluyendo el modelado de homologa ( 26 ), el reconocimiento veces a travs de roscado ( 27 ), y los mtodos ab initio ( 28 ). El enorme incremento en la cantidad de secuencias y datos de estructura de protenas, junto con los avances en la bioinformtica, los mtodos experimentales y computacionales, estn mejorando nuestro conocimiento sobre la relacin entre la secuencia de la protena, la estructura, la dinmica y la funcin. Este conocimiento, a su vez, est siendo utilizado para entender cmo las protenas interactan con otras molculas tales como pequeas molculas o ligandos que pueden convertirse en un candidato a frmaco. En las secciones siguientes se describe la jerarqua de estructura de la protena y su aplicacin al diseo de frmacos en enfermedades tropicales. La ltima seccin es un ejercicio que le permita al lector o estudiante para aplicar varias herramientas bioinformticas a partir de una secuencia de ADN parcial o nmero de acceso de protena y produciendo un modelo de su estructura y funcin.
Cuando un tomo de todo el modelo de una estructura de la protena se ve por primera vez (ya sea una figura, un modelo tridimensional o una representacin de grficos de ordenador) puede parecer una tarea desalentadora para descifrar cualquier patrn subyacente dentro de ella. Despus de todo, estas estructuras suelen contener miles, si no decenas-o cientos-de-miles de tomos. Por esta razn, a menudo se considera conveniente para simplificar el problema mediante el uso de una descripcin jerrquica de la estructura de la protena en la que las capas sucesivas de la jerarqua describen cada vez ms complejos niveles de organizacin. Tpicamente cuatro niveles se utilizan y se utilizarn para la estructura primaria, secundaria, terciaria y cuaternaria de una protena. A menudo es til incluir dos niveles intermedios adicionales entre las estructuras secundaria y terciaria, que se conocen como estructuras secundarias sper y dominios. Existen muchos excelentes libros de texto sobre el tema que debe ser consultado para obtener informacin ms detallada ( 1 , 29 - 31 ). Aqu, vamos a tratar slo de dar un esquema para hacer hincapi en la importancia del estudio de la estructura tridimensional de las protenas para el proceso de diseo de frmacos que se describe al final de este captulo.
diferentes (D y L) para cada aminocido ( Fig. 3b ). Entre los aminocidos de origen natural, la nica excepcin es el aminocido glicina, cuyo grupo R es un tomo de hidrgeno, haciendo que el simtrica -carbono. Esto confiere una serie de propiedades conformacionales importantes en este aminocido que a menudo son esenciales para el mantenimiento de una estructura dada. Por esta razn, glicinas crticos a menudo se conservan entre los miembros de una familia de protenas dada. Los restantes aminocidos son (con muy pocas excepciones) siempre encontr que los L-aminocidos. Esto tiene consecuencias importantes para las estructuras quirales observados en las protenas en todos los niveles de la jerarqua. Slo existen otros dos centros quirales dentro de los veinte aminocidos, estas son las -carburos dentro de las cadenas laterales de los aminocidos treonina e isoleucina, que tambin existen, ya que slo uno de los dos enantimeros posibles. Una cadena de polipptido se genera por una serie de reacciones de condensacin entre el grupo carboxilo de un aminocido y el grupo amino de la siguiente, produciendo un enlace covalente ( . Fig. 4 ). Este es un enlace amida que se da el nombre trivial de un enlace peptdico en el caso de cadenas de polipptidos. La unin de dos cidos resultados amino en un dipptido, que posee un grupo amino libre (N-terminal) y el grupo carboxilo (Cterminal) permitiendo que la reaccin de condensacin para continuar ad infinitum, en principio, en ambas direcciones ( . Fig. 4 ). Despus de someterse a la condensacin, el aminocido se denomina un residuo (para denotar `lo que queda" despus de la condensacin). Teniendo en cuenta la existencia de la 20 aminocidos de origen natural, para un polipptido de longitud n hay 20 n posible secuencias de aminocidos. Dado que n es tpicamente del orden de cientos e incluso puede ser decenas-de-miles, el nmero de tericamente posibles secuencias de polipptidos es literalmente astronmica. No existen en la actualidad la gran mayora (de hecho, hay materia suficiente en el universo) y nunca han existido antes (ya que no ha habido tiempo suficiente para generarlos). Los polipptidos que observamos en las especies actuales son los productos seleccionados de entre una pequea fraccin de todas las combinaciones posibles que se expresan a lo largo del proceso evolutivo. Figura 4 Una cadena de polipptido se genera por una serie de reacciones de condensacin, in vivo que ocurren normalmente dentro del ribosoma durante la sntesis de protenas. Los aminocidos individuales se muestran en su forma de ion hbrido, en el que los grupos amino y cido carboxlico (Ms. ..) 3.1.1 Las propiedades conformacionales de una cadena polipeptdica Debido a la naturaleza qumica del enlace amida, el enlace peptdico entre dos aminocidos est sujeta al fenmeno de la resonancia, lo que significa que adquiere las caractersticas de un doble enlace parcial. La distancia CN (1.32A) es ms corto que un enlace sencillo normal y ms de un doble enlace normal. Adems, esta introduccin de una rigidez en la estructura como el vnculo ya no puede girar libremente. La consecuencia es que los tomos de -carbono de dos aminocidos adyacentes, junto con el carbonilo (C = O) y los grupos NH de la propia grupo de pptidos, se encuentran todos en el mismo plano ( . Fig. 5
). La torsin (diedro) ngulo asociado a este enlace se denomina , que con el fin de ser plana debe ser 180 o (trans) o 0 o (cis). Enlaces peptdicos cis son slo comn cuando los cidos mentiras prolina aminocidos en el C -terminal del lado de la fianza. Esto es debido a la naturaleza inusual de la cadena lateral de prolina que forma un enlace covalente con su propia cadena principal de generacin de nitrgeno un anillo cerrado. Como tal prolina es, estrictamente hablando, un cido amino secundario y ni trans ni cis son particularmente energticamente favorable. Aproximadamente un tercio adoptar la conformacin cis y stos se conservan con frecuencia entre los miembros de la familia de protenas ( 33 ). La figura 5 Una seccin corta de la cadena de polipptido que muestra los grupos de pptidos planas y la identificacin de la torsin ngulos y . Los polipptidos obedecen necesariamente estereoqumica estndar y por lo tanto todas las longitudes y ngulos de enlace estn efectivamente fijas, variando slo mnimamente en torno a sus valores normales. Por lo tanto, la nica fuente de la libertad conformacional que posee el polipptido proviene de la rotacin de torsin alrededor de sus enlaces simples. Ya hemos visto que el enlace peptdico no es libremente giratorio, por lo que es efectivamente fijado, normalmente en la configuracin trans. Slo hay dos enlaces sencillos restantes por residuo a lo largo de la cadena principal, y uno de estos bonos pueden asociar la torsin ngulos y ( . Fig. 5 ), que se define como 0 o cuando en la conformacin trans. La conformacin de la cadena principal de un residuo dado puede por lo tanto ser descrito en trminos de estos dos parmetros, que pueden ser representados convenientemente en trminos de un sistema de coordenadas de dos dimensiones (el grfico de Ramachandran), en el que tanto y varan entre -180 y 180 o.
importantes de la estructura secundaria y corresponden a pequeos tramos de residuos consecutivos. El valor de n negativo en el caso de la -hebra indica que es una hlice zurdo, mientras que la -hlice es diestro. El hecho de que el parmetro n es cerca de 2 para la captulos (el valor mnimo tericamente posible) significa que las hebras son de hecho muy extendida hlices con un dimetro cadena principal estrecho. Por consiguiente las cadenas laterales emergen alternativamente en lados opuestos de la cadena, dando lugar a un aspecto de zig-zag o plisada. La -hlice ( . Fig. 6 ) es particularmente abundante en tanto globular y algunas protenas fibrosas debido a su estabilidad inherente. Esto surge como consecuencia de varios factores, incluyendo la presencia de enlaces consecutivos de hidrgeno entre el carbonilo del residuo i y el NH de residuos i 4, el radio de la hlice que es compatible con el de Van de Waals contactos a travs del eje de la hlice y la posibilidad de formar pares de iones (puentes de sal) entre los residuos cargados opuestamente separados por 3 o 4 residuos a lo largo de la secuencia. Los enlaces de hidrgeno son particularmente fuertes debido a la separacin ideal entre donante (nitrgeno) y aceptor (oxgeno) tomos, as como debido a su linealidad y la alineacin dipolar. Alternativos pero similares hlices, tales como el 3 y 10 hlices son mucho menos comunes debido a la naturaleza ms dbil de las fuerzas estabilizadoras descritas anteriormente. Autnomas 3 10 hlices s existen, pero son mucho ms comnmente observado como la primera o ltima a su vez de una -hlice ( 35 ). -hlices pueden ser un poco ms comn de lo que se pensaba ( 36 ). La figura 6 Los tipos ms comunes de la estructura secundaria. -hlices en general presentan una serie de propiedades fisicoqumicas y estructurales comunes. Ellos tienden a ser anfipticos, con una cara hidrofbica apuntando hacia el ncleo de la protena y una cara hidrfila dirigida hacia disolvente acuoso (esto puede ser invertido en el caso de protenas de la membrana). La competencia entre el agua y los grupos de amida de la columna de la protena tiende a alargar los enlaces de hidrgeno en la cara hidrfila, lo que lleva a la curvatura de la hlice ( 37 ). La alineacin de los dipolos individuales de las unidades peptdicas conduce a un dipolo macroscpico asociado con toda la hlice, que es tpicamente del orden de 0,5 unidades de carga positiva en el extremo N-terminal y 0,5 unidades de carga negativa en el extremo C-terminal ( 38 ). Junto con los grupos NH libres dentro de la primera a su vez, esto hace que el N-terminales de -hlices sitios de unin ideales para aniones, tales como fosfato. En la ausencia de tal un anin, con frecuencia el extremo N-terminal est limitada por la cadena lateral del primer residuo helicoidal (la N-casquillo), que es muy a menudo una asparagina o cido asprtico ( 39 ). El aminocido ms comn que se encuentra en la segunda posicin es una prolina, lo que significa que la secuencia Asn-Pro sera, en principio, ser una seal de iniciacin de hlice fuerte. -captulos no son capaces de formar enlaces de hidrgeno internos. Se renen en lminas por la formacin de enlaces de hidrgeno entre hebras ( . Fig. 6 ). Hojas pueden ser paralelas, antiparalela o mixto en la naturaleza en funcin de la orientacin relativa de los hilos de los que estn compuestos. La ngulos y varan de un tipo a otro y -hojas son
capaces de asumir una amplia variedad de arquitecturas ( 40 ). Una caracterstica comn a casi todos los -hojas es que se tuercen. Cuando se ve perpendicular a las hebras, la hoja tiene un giro de la mano izquierda y cuando se mira en paralelo a los hilos que es diestro. Este ltimo puede aparecer una contradiccin dado el giro de la mano izquierda de las hebras individuales (vase ms arriba), pero resulta del hecho de que slo cada segundo residuo de (1, 3, 5, 7, etc, o 2, 4, 6, etc) contribuir enlaces de hidrgeno en el mismo lado de la hebra. Existen, pero son poco frecuentes en comparacin con los trenzados hojas planas (con n = 2). Figura 7 muestra ejemplos de los dos planos y retorcidos -hojas. La figura 7 Apartamento (n = 2) y retorcido -hojas (izquierda y derecha, respectivamente) Entre las diferentes arquitecturas que forman -hojas son paralelas (raro) y anti-paralela (comunes) bobinas en espiral, paralelos y monturas anti-paralelas (paraboloides hiperblicos), barriles paralelos 8 de cadena y barriles anti-paralelas con un nmero muy variable de hilos enrollados, helicoides de tres hilos, etc ( 40 ) En las protenas globulares, las -hlices y -captulos menudo atravesar la estructura. Dado que ambos tienen ejes aproximadamente lineales, claramente son necesarios otros tipos de estructura con el fin de causar la inversin de la cadena. Estos se denominan giros y bucles. Activa se componen de una serie bien definida de los residuos. -vueltas se componen de dos residuos, -cumple tres aos, -turnos cuatro, -cumple cinco aos y gira de seis ( 41 ). El ms conocido y ampliamente descrito son los -vueltas, que vienen en varias formas diferentes distinguibles por el y ngulos de los segundo y tercero residuos de la vuelta. En la mayora (pero no todas) las definiciones, existe un enlace de hidrgeno entre el carbonilo del primer residuo y el NH del cuarto. Varias clasificaciones se han propuesto para la -vueltas y tipos I y II son los ms comunes (ver 41 ). Sin embargo los tipos I 'y II' se observan en -horquillas (una estructura sper-secundaria compuesta de dos hebras -anti-paralelo) debido a la compatibilidad de la hoja de torsin con la de la propia (a su vez 42 ). En general, las vueltas no pueden ser representados por un nico punto en el espacio / (a diferencia de las hlices descritas ms arriba). De hecho muchas de las -vueltas requieren uno de los residuos internos (2 o 3) para adoptar `ngulos / prohibidas", imponiendo un requisito para una glicina en las posiciones especficas ( 41 ). El tipo de giro puede a veces por lo tanto, ser fcilmente predicho a partir de la secuencia de residuos de sus componentes. Los bucles son ms difciles de clasificar, ya que son ms grandes que gira y por lo tanto pueden adoptar una amplia variedad de conformaciones. Diferente a los giros, por lo general, presentan un ncleo hidrofbico y, al menos en el caso de -bucles, son tan compacto como otras partes de la estructura.
estructura terciaria estable, compacta y biolgicamente activa. Las formas en que las estructuras secundarias Pack ms comnmente ha sido ampliamente estudiada ( 43 - 45 ). Los modelos ms simples que tienen por objeto explicar las observaciones experimentales se basan en la interdigitacin de las cadenas laterales. Por ejemplo, el enfoque de las perillas-en-agujeros o modelo cordilleras-en-surcos ( 43 ) explican igualmente bien los ngulos de embalaje ms comnmente observadas entre los dos -hlices ( = -50 y 20 ). Un enfoque similar se puede utilizar para el embalaje de -hojas de una contra la otra o de las hlices en contra de hojas ( 44 , 45 ). El resultado final del proceso de plegado es la estructura tridimensional completa del polipptido. Claramente, esto depende de la secuencia de aminocidos y por lo tanto en los detalles atmicos de la estructura. Sin embargo, para las protenas solubles esto ser casi inevitablemente como resultado la generacin de un ncleo hidrfobo en el que los residuos apolares tienden a agruparse sus cadenas laterales dentro del interior de la protena, dejando residuos hidroflicos expuestos al disolvente. Para fines descriptivos es til para simplificar la estructura mediante la eliminacin del detalle atmico y teniendo en cuenta slo la traza de la cadena principal en el espacio (vase la fig. 8 ). Esto se conoce como el pliegue de la protena a menudo. Existen muchas clasificaciones de los pliegues de protenas y dos de los ms utilizados son SCOP ( 22 ) y el cateterismo ( 46 ), ya que ambos utilizan un enfoque jerrquico. El nivel ms alto de la jerarqua clasifica pliegues en clases, en base a su contenido de estructura secundaria global (principalmente , principalmente , / , irregular). En el caso de la clasificacin CATH ( . Fig. 9 ), la segunda capa de las ofertas de jerarqua con diferentes arquitecturas dentro de una clase dada, de los cuales hay actualmente aproximadamente 30 tipos principales. Por ejemplo, dentro de los pliegues de la clase puede ser clasificado en el nivel de arquitectura como -haces, -no-haces, herraduras, -solenoides y / barriles. Dentro de la clase , hay -rolls, -barriles, almejas, --sndwiches trboles, -prismas (paralelas y ortogonales) -hlices (con diferente nmero de hojas), diferentes tipos de -solenoides (o -hlices), etc Dentro de la / de clase nos encontramos con barriles / (barriles TIM), / (sndwiches con un nmero variable de capas y tipos), el / -box, / -herradura, / -hlice etc La arquitectura describe la disposicin general de los elementos estructurales secundarios pero sin preocupacin por su conectividad. Figura 8 Las diferentes representaciones de la misma estructura de la protena (protena precursora del amiloide de Alzheimer). Todos los tomos excepto hidrgenos (a la izquierda), Ctraza (centro) y la cinta (a la derecha). Figura 9 Parte de la clasificacin CATH. Se muestran ejemplos de los superiores mayora de los niveles de la jerarqua (clase, Arquitectura y topologa). A nivel de la topologa, una descripcin ms fina se da dentro de una arquitectura dada en la que se toma la conectividad de las estructuras secundarias en cuenta. Por ejemplo, incluso teniendo en cuenta una arquitectura relativamente simple, la de un -haz, por
ejemplo, un haz de cuatro hlices, hay un sorprendente nmero de diferentes topologas (formas de orientar las hlices con respecto a la otra y luego los conectan). De hecho, hay 48 diferentes topologas tericamente posible para un haz de cuatro hlices ( 47 ). Sin embargo, probablemente por razones de simplicidad de plegado, la naturaleza ha favorecido el todo paquete anti-paralelo en el que dos hlices diagonal relacionados son paralelas y orientada hacia el resto anti-paralelo. Estas topologas son ms comunes de lo que cabra esperar por azar. Hay una creencia general de que el nmero total de pliegues es relativamente limitada (quizs unos pocos miles) y se espera que a medida que el resultado de las iniciativas de genmica estructural, dentro de los prximos aos nuestro conocimiento del universo de posibles pliegues utilizado por las protenas solubles al menos ser razonablemente completa ( 48 ). Ya est claro que algunos pliegues son ms comunes que otros y estos se han denominado superfolds por algunos autores ( 49 ). Incluyen el barril TIM, la jalea-roll y de arriba a abajo paquete 4-hlice. Con la acumulacin de nuevas estructuras de protenas a un ritmo cada vez mayor, determinado por difraccin de rayos X y RMN multidimensional, que ha sido posible derivar una serie de reglas empricas que gobiernan las formas posibles en las que un polipptido se puede plegar. Aunque muchas de esas reglas son fundadas sobre una base puramente emprica, algunos de ellos probablemente pueden explicarse apelando a la necesidad de la cintica de plegamiento eficientes. La regla ms bien establecida es la que determina que las conexiones entre los elementos de la estructura secundaria del tipo x (donde se refiere a una hebra -y x puede ser cualquier cosa, una -hlice, un bucle u otro -cadena) deben estar la mano derecha ( 50 ). Hay muy pocas excepciones a esta regla, pero un ejemplo espectacular es el zurdo -hlice, como se ve por ejemplo en la UDP-Nacetilglucosamina aciltransferasa ( 51 ). Otras reglas de conectividad prohben el entrecruzamiento de las conexiones de bucle y la formacin de nudos, por ejemplo. Sin embargo, como con la mayora de las reglas empricas, las excepciones siempre se pueden encontrar, y recientemente se han descrito algunas estructuras dramticamente anudadas ( 52 ). Cabe sealar que las protenas son molculas quirales inherentemente y esto tiene consecuencias importantes para las interacciones que hacen. Muchas enzimas, por ejemplo, son estereoselectiva con respecto a sus sustratos debido a la asimetra inherente en sus sitios activos. Por ejemplo, cuando una proteasa de VIH artificial se sintetiza a partir de D en lugar de los aminocidos L, el resultado fue una proteasa activa que era especfica para un sustrato del enantimero opuesto ( 53 ). Las consecuencias del tomo -carbono asimtrico se puede ver en la mayora, si no todos los niveles de la estructura de la protena. No es por casualidad que los diestros -hlice est energticamente favorecida sobre su compaero zurdo, ni que los -captulos son zurdos (la mano derecha cuando slo cada segundo residuo es visto) o sus hojas zurdos ( cuando se ve perpendicular a las hebras). Adems, el embalaje de -hlices diestros utilizando la cadena de interdigitacin lado conduce a el ngulo de embalaje comn de 20 , lo que significa que cuando estas hlices bobina alrededor de la otra para formar bobinas en espiral (como se ve en la queratina, miosina y cremalleras de leucina, por ejemplo, ), inevitablemente, dichas estructuras se zurdos. En el siguiente nivel, las conexiones diestros que se encuentran en unidades x junto con el giro
en -captulos s significa que todos () 8 barriles de barriles (TIM) tienen la misma quiralidad. En efecto, el barril siempre `enrollar 'de la misma manera debido a la combinacin de la hebra de giro y de corte de hoja (el desplazamiento de una cadena con respecto a sus vecinos que se traduce en la inclinacin de los hilos con respecto al eje del can) ( 1 , 40 ).
(tales como la ferritina, por ejemplo) o como cpsides virales. Adems, la simetra de translacin se puede aadir a los ejes de rotacin para producir simetra helicoidal como se ve en microtbulos, virus del mosaico del tabaco y otra estructura filamentosa. Cules son las ventajas de la construccin de protenas oligomricas y por qu son tan comunes? Existen varias respuestas. A veces es slo una cuestin de ser grande, como por ejemplo en el caso de las protenas plasmticas que, con el fin de evitar la ultrafiltracin por los riones, debe ser mayor que 60 kDa. Ser grande puede a menudo tambin aumentar la estabilidad y reducir la relacin de rea superficial / volumen, con lo que la protena menos susceptible a la proteolisis. Ser oligomrica tambin da lugar a la posibilidad de cooperatividad en enzimas y molculas de transporte, adems de ser una forma eficiente de la construccin de grandes estructuras con material gentico limitado, tales como en los virus esfricos, por ejemplo. El potencial de tener mltiples sitios de unin idnticos dentro de una sola molcula (como en las inmunoglobulinas, por ejemplo) introduce la posibilidad de una actividad de reticulacin y como se menciona anteriormente muchas estructuras oligomricas sirven para generar cavidades con una funcin biolgica especfica.
Los qumicos medicinales tomaron ventaja inmediata de la rpida evolucin de la informtica y la computacin grfica, en particular, y desarrollaron tcnicas para visualizar, manipular y superponer estructuras 3D de compuestos activos con el fin de obtener rpidamente informacin acerca de la estructura y actividades de relacin de los compuestos activos conocidos. Distinto ordenador Estructura-Actividades Relacin aproximaciones cuantitativas (QSAR) como HQSAR, CoMFA y mtodos QSAR 3D relacionados con la base se convirti en popular entre los qumicos medicinales. Al mismo tiempo, los avances significativos en la biologa molecular y estructural y en la actualidad se hicieron decenas de miles de estructuras 3D de protenas que estn disponibles. Esto representa una enorme cantidad de informacin estructural de los receptores medicinalmente pertinentes, por otra parte las estructuras de complejos de protenas con pequeos ligandos son tambin una valiosa fuente de informacin sobre las interacciones favorables que estabilizan la asociacin del ligando con el bolsillo de unin de la protena ( 59 ). Recientemente, potentes computadoras de escritorio se han convertido en asequible, junto con una diversidad cada vez mayor de software libre para fines acadmicos, as como una notable mejora en la transferencia de datos a travs del acceso a Internet. Por lo tanto, ahora es posible trabajar en el pas en estaciones de trabajo de gran alcance, en estrecho contacto con los grupos de investigacin acadmica de todo el mundo, y aprovechar al mximo el software hasta al da de visualizacin de molculas, realizando el modelado molecular y hasta procesar datos cristalogrficos y resolver estructuras. A pesar de este progreso indiscutible, basado en la estructura de diseo ligando todava se enfrenta a varios retos importantes y limitaciones, como la falta de disponibilidad de las estructuras en 3D para muchos receptores importantes, receptores particularmente unidas a la membrana, los enfoques computacionales adecuados para hacer frente a inducido en forma de ligando interacciones o molculas de agua en el sitio de unin y selectividad entre diferentes isoformas del mismo receptor o enzima-receptor. Por otra parte, la colaboracin con los qumicos sintticos y los bilogos experimentales probablemente continuar siendo un factor determinante de xito ( 59 ). Las drogas son ligandos que no slo caben en el bolsillo de unin de la protena diana, pero tambin se absorben, transportan, distribuyen al compartimiento de cuerpo derecho, as como idealmente ser estable a la metabolizacin, no txico, libre de efectos secundarios y qumicamente estables en la formulacin. Por lo tanto, es claro que la etapa de diseo ligando del proceso de descubrimiento de frmacos es slo uno de los pasos iniciales en un esfuerzo multidisciplinario que requiere generalmente varias rondas de refinamiento entre la identificacin de un principio activo y la seleccin de un frmaco candidato viable. Diseo basado estructural puede ayudar a este proceso continua al identificar oportunidades para las modificaciones estructurales que no interfieren con la unin, pero puede mejorar la afinidad y selectividad, y que puede alterar favorablemente a las propiedades de la molcula, tales como la solubilidad, hidrofobicidad y estado de ionizacin ( 59 ) . Encontrar un compuesto de plomo, la optimizacin de sus propiedades y convertirla en un frmaco aprobado necesita una enorme cantidad de tiempo y dinero. Es una bsqueda que
requiere esfuerzo anintense y de cooperacin entre los equipos de descubrimiento multidisciplinarios ( 60 ). En algunos casos, el anlisis cuidadoso de una estructura de la protena-ligando puede ser suficiente para sugerir modificaciones en el ligando para mejorar la afinidad. Ms estructuras de la misma protena con diferentes ligandos pueden hacer que sea ms fcil. Herramientas de modelado molecular pueden modelar la estructura de una protena sobre la base de una estructura homloga conocida previamente, por lo que es posible usar la informacin estructural para el diseo de ligandos para las protenas para las que se conoce ninguna estructura. El cribado virtual puede proporcionar estructuras de ligando completamente diferentes de los ligandos ya conocidos. Modelos QSAR pueden ayudar al diseo de modificaciones para mejorar una propiedad biolgica de un ligando y pueden predecir las actividades con un error razonable. Procedimientos de acoplamiento se pueden utilizar para modelar modos de unin y estimar las energas de enlace.
programas se ocupan parcialmente flexibilidad protena. Las funciones de puntuacin desarrollado hasta la fecha suelen ser de un campo clsico de la mecnica molecular fuerza, una funcin emprica que describe los trminos tales como enlaces de hidrgeno y lipofilia, o un posible "basada en el conocimiento", derivado del anlisis de complejos protenaligando ( 62 , 63 ) . Otra caracterstica importante de un buen programa de acoplamiento es la capacidad de sus funciones de puntuacin para anotar y clasificar mltiples ligandos contra un solo objetivo en funcin de sus afinidades de unin experimentales ( 62 ). Esta tarea es ms problemtica ( 64 ), las funciones de puntuacin utilizados en los programas de conexin deben contener muchas aproximaciones, ya que tienen que ser lo suficientemente rpido para evaluar un nmero extremadamente grande de poses posible. Por ejemplo, no se toman en cuenta explcitamente por lo general de los cambios entrpicos debido al desplazamiento de las aguas desde el sitio activo o de la reduccin en los grados de libertad en el ligando. Por lo general, una funcin de la puntuacin que se puede seleccionar la correcta postura durante un ligando no se ubicar necesariamente una serie de ligandos potenciales en el orden correcto ( 63 ). Un uso importante de los programas de conexin para la protena-ligando es cribado virtual, en la que grandes bibliotecas de compuestos se acoplan en un sitio de unin a la diana y anot. Para este propsito, los atraques deben ser an ms rpido. La aceleracin de un protocolo de acoplamiento se hace a menudo a costa de un menor nmero de modos de toma de muestras de unin, y, como resultado, reduce las tasas de xito. Por lo tanto, es importante que los parmetros de bsqueda se eligen que dan velocidades de conexin til para aplicaciones de cribado virtual, con una prdida aceptable en la precisin de acoplamiento ( 63 ). Para superar el "problema" de rango investigadores han empleado diferentes mtodos que van desde la fuerza bruta, lo que significa el uso de clusters de ordenadores muy caros de hacer todo el trabajo pesado computacional, a la utilizacin de mtodos ms elegantes como marcador consenso. Este mtodo consiste en utilizar un programa de acoplamiento para realizar la bsqueda conformacional y clasificar los compuestos, y emplear funciones de puntuacin otras herramientas de conexin "para volver a evaluar los primeros resultados. Slo la parte superior anot compuestos comunes a cada funcin de puntuacin sern identificados como candidatos para bioensayo. En comparacin con los procedimientos individuales de puntuacin, se demostr que los falsos positivos en la deteccin biblioteca virtual se reducen en gran medida y las tasas de xito han mejorado. Hay muchas maneras diferentes de puntuacin consenso rendimiento ( 64 ). Algunas herramientas de conexin tambin tienen otra caracterstica til, la estimacin de la energa de enlace. Sin embargo, esta tcnica sigue exigiendo una alta potencia de clculo y la mayora de los proyectos no se lo puede permitir. Por lo general, slo los mejores ligandos se encuentran en el cribado virtual se someten a este procedimiento. Tenga en cuenta que a pesar de que estos clculos no son muy precisos, si se puede dar la clasificacin correcta de molculas candidatas, proporcionar informacin valiosa. 4.1.1 Primeros pasos con Virtual
Resultados de los exmenes virtuales son altamente dependientes de la base de datos y la preparacin de destino. Las bases de datos deben ser atentos, y eso significa un esfuerzo considerable se debe poner en el filtrado de molculas con propiedades fsicas indeseables y funcionalidades qumicas como de alto peso molecular, los grupos reactivos, demasiados bonos rotativos y lipofilia no adecuado ( 65 ). Estados tautomricos, ionizacin y cargos deben ser tambin observados, as como los enantimeros posibles que surgen de los centros quirales. Por ltimo, hay que decidir si se quiere una base de datos de compuestos similares a las drogas o el plomo-como. Antes de preparar el receptor, es necesario comprobar si es adecuada para un procedimiento de cribado virtual. Es comn disponer de ms de una estructura de la misma protena en el complejo con diferentes ligandos o sin cualquier ligando unido. Es hasta el qumico mdico a elegir entre estas diferentes opciones. Como pauta, la resolucin debe ser tan alta como sea posible. Otro paso importante es leer el archivo pdb del receptor. Informacin til se puede encontrar acerca de los parmetros cristalogrficos empleados, toma nota de que el autor acerca de los residuos de baja densidad de electrones e incluso mutaciones en la protena. Tambin los programas tales como Procheck y Whatcheck se pueden utilizar para analizar la estereoqumica y el entorno qumico de cada residuo de la protena. Despus de la eleccin de la estructura del receptor ms adecuado, por lo general se requiere la adicin de tomos de hidrgeno, seguido de minimizacin de la energa potencial para evitar choques estricos. Algunos de los cambios deben hacerse con cuidado en el sitio de unin, como asignar el estado de protonacin derecho de residuos ionizables, la comprobacin de los estados tautomricas de las histidinas, la posible voltea de las glutaminas y asparagines y las orientaciones de los tomos de hidrgeno de los grupos hidroxilo en la residuos de serina y treonina ( 65 ). Recuerde que los procedimientos de investigacin virtuales suelen tardar das para terminar y si se comete un error en la fase de preparacin, toda la obra puede verse comprometida. Tambin uno de los procedimientos ms importantes es la inspeccin visual de los mejores compuestos clasificados en el contexto del sitio de unin. Serendipity, el principio de que "azar slo favorece a la mente preparada", en palabras de Louis Pasteur, juega un papel importante en todo el proceso de cribado virtual, especialmente durante la etapa de inspeccin visual. 4.1.2 Estructura de las protenas y 3D-QSAR Estructuras de protenas se pueden utilizar en muchas maneras de mejorar los resultados de las tcnicas de relacin estructura-actividad cuantitativas (QSAR). Dos de las tcnicas ms comunes son el anlisis comparativo de campo Molecular (CoMFA) y el comparativo Similitud Molecular Indices Anlisis (CoMSIA). Ambos mtodos asumir que los ligandos tienen un modo de unin comn, sus estructuras 3D se modelan y superponen y anlisis Partial Least Square (PLS) se realiza para tratar de encontrar una correlacin entre las actividades biolgicas de los compuestos y de sus estructuras 3D ( 66 ). Estos mtodos se basan en gran medida de una superposicin correcta de las estructuras de ligandos y, si se conoce la estructura de la protena diana, es un enfoque vlido para acoplar
los ligandos en el sitio de presagiar protena y utilizar el resultado como una "alineacin estructural". La informacin estructural de protenas tambin se puede utilizar para ayudar a la interpretacin de los resultados. Otro mtodo QSAR, Energa de enlace comparativo (COMBINA) requiere al menos una estructura de un complejo ligando-protena y el enlace de datos experimentales para el conjunto de entrenamiento de los complejos ligando-protena. El conjunto de entrenamiento se utiliza para el desarrollo del modelo solamente y no para la evaluacin del modelo, que debe ser realizada utilizando un conjunto independiente de datos. La estructura del complejo ligando-protena conocida se utiliza para modelar todos los restantes complejos de el conjunto de entrenamiento (en caso de no hay datos estructurales disponibles bPLSeing), estos complejos se superponen y la energa se reduce al mnimo. La energa de interaccin entre el ligando y el receptor en cada complejo se calcula y se descompone sobre la base de las propiedades fsicas y la ubicacin en la molcula. Anlisis PLS se utiliza entonces para construir un modelo de correlacin de los datos de unin biolgicos con la suma de los componentes ponderados, seleccionados de la energa de interaccin ( 66 ).
ofrecen la posibilidad de desarrollar nuevos inhibidores con mayor potencia y selectividad, y estos datos seran tiles para DHFRs de modelado molecular de otras especies de parsitos para los que las estructuras no estn disponibles todava ( 72 ). Por otra parte, la resistencia generalizada a los medicamentos antipaldicos disponibles en la actualidad ha llevado a un aumento en la bsqueda de nuevos objetivos, algunos de ellos ya en las etapas de validacin ( 72 ). Inhibidores de la DHFR son en gran medida ineficaces para el control de infecciones trypanosomatid, en parte debido a la presencia de pteridina reductasa (PTR1), que est implicado en el metabolismo del folato / pterina. Las estructuras cristalinas de la PTR1 de Leishmania tarentolae y Trypanosoma cruzi, y una serie de anlisis cristalogrficos de la enzima de la Leishmania major en binario y complejos ternarios identifican interacciones importantes que pueden ser explotadas en un desarrollo basado en la estructura de inhibidores de la enzima nuevos con valor teraputico potencial ( 73 ). Adems, se estn estudiando otros mtodos para abordar el desarrollo de nuevos frmacos contra el tripanosomatides. La estructura cristalina y el mecanismo de trans-sialidasa, una enzima que parece ser crtica para T. supervivencia cruzi y la capacidad de invasin de las clulas ya est disponible. La estructura proporciona el primer paso para el diseo basado en la estructura de los nuevos inhibidores con potenciales aplicaciones teraputicas ( 74 ). Adems, la estructura de resolucin 2,0 A de la UDP-galactosa-4 'epimerasa de la parsito protozoario Trypanosoma Bruce, el agente causante de la enfermedad del sueo africana en los seres humanos, y la prdida de nagana la enfermedad en el ganado bovino, se determin recientemente. Una comparacin estructural con la enzima humana identific una diferencia potencialmente importante en la hendidura de unin al sustrato que podran ayudar a un enfoque basado en la estructura para el desarrollo de inhibidores especficos Gale Tb ( 68 ). Otras enzimas que han sido consideradas como buenas dianas para el desarrollo de frmacos antiparasitarios son las glutatin S-transferasa, una familia de enzimas de desintoxicacin que catalizan la conjugacin del glutatin con diversos electrfilos endgenos y xenobiticos. Los estudios han identificado antiesquistosmico ( 75 ), contra la malaria y antifilrico ( 69 ) la actividad de los compuestos conocidos por su actividad inhibidora de la GST ( 70 ). Las estructuras cristalinas de la glutatin S-transferasa de la filaria Onchocerca volvulus, responsable de la oncocercosis, enfermedad debilitante, se obtuvieron recientemente en alta resolucin (1.5 y 1.8a). El anlisis estructural de la enzima muestra que es una diana de frmaco adecuada para la intervencin en las filariasis, con la ventaja potencial de no comprometer el husped humano ( 69 ). Se estn haciendo todos los esfuerzos basados en la estructura de cambiar el panorama de las enfermedades tropicales. Un ejemplo es el estudio reciente que utiliza estructuras disponibles y secuencias de genes de la enzima glyoxalase I para crear un modelo de la Leishmania donovani enzima ( 76 ). Este trabajo sugiere que las diferencias entre los
humanos y la L. estructuras donovani podran ser explotadas para frmacos basado en estructuras de diseo de inhibidores selectivos contra la enzima del parsito. Adems, el anlisis estructural de la Mycobacterium tuberculosis de tipo II deshidroquinasa sugiri modificaciones sobre inhibidores conocidos que condujeron a la sntesis de un nuevo inhibidor de ms de 180 veces ms potentes que el inhibidor de prototipo. Estudios de acoplamiento indicaron interacciones de unin electrostticas clave entre el inhibidor y la enzima. Se estn realizando estudios estructurales de los complejos de enzima-inhibidor y deben ser considerados para el diseo de la prxima generacin de inhibidores ( 71 ).
5. Seccin Prctica: Caracterizacin computacional de un producto gnico de una secuencia gentica parcial Slo
El objetivo de este ejercicio es para llevar el lector o estudiante en contacto con libremente disponibles herramientas bioinformticas en lnea utilizados para caracterizar computacionalmente una protena completa a partir de slo una secuencia de ADN parcial de su gen correspondiente. A travs de un conjunto de preguntas de orientacin, con sugerencias, este ejercicio implicar buscar el GenBank para toda la secuencia del gen, traduccin a la secuencia de la protena correspondiente, y la bsqueda de la estructura de la protena (en este caso o bien se puede suponer que el estudiante ya est familiarizado con las salidas de los programas BLAST distintos o que se llevar a cabo el aprendizaje a travs del ejercicio). Si no hay una estructura est disponible, entonces el estudiante debe buscar secuencias similares con un 30% o ms de identidad que han conocido las estructuras 3D. Dependiendo de la duracin del curso, el estudiante puede proceder mediante la determinacin de la estructura de las protenas por homologa de modelado o simplemente mediante el uso de la estructura 3D conocida para inferir similitud estructural y la funcin de su / su protena. Se alienta al estudiante para descargar cualquier archivo de estructura 3D de protenas conocido a su / su ordenador y visualizarlo en un visor macromolcula biolgica instalado localmente como SwissPDBViewer ( 77 ) o la deteccin de movimiento ( 78 ). Esta ser una oportunidad nica para que el estudiante familiarizarse con la arquitectura de las protenas. El mismo experimento se puede cambiar fcilmente para investigar un genoma en su conjunto, as. El conjunto de preguntas puede ser utilizado para guiar al estudiante a travs de la writring de un artculo que describe el gen y su producto. Este ejercicio debe ser realizado por un profesor o tutor en la bioinformtica.
1 - Puede el gen putativo ser completamente e inequvocamente caracterizado a partir de la secuencia de ADN parcial dado anteriormente? Cmo? S. El gen puede ser completa y sin ambigedad caracteriza, pero la solucin requerir un anlisis ms cuidadoso de lo que lo hizo un par de aos atrs. La razn es simple: haba mucho menos secuencias que los que hay ahora. Solucin: Puesto que tenemos una secuencia de nucletidos que nuestro conjunto de datos inicial, tenemos que ir a la pgina de BLAST NCBI, seleccionar el programa BLAST de nucletidos y buscar en la base de datos de nucletidos utilizando una consulta de nucletidos. La pgina se ver as:
1. - El primero permite al usuario para pegar la secuencia de consulta para el anlisis. Nuestra secuencia de consulta que contiene 30 nucletidos, se destacan en el rectngulo de color rojo, se pega en el cuadro de bsqueda. 2. - La segunda seccin permite la eleccin de una base de datos que se debe buscar y gama secuencia opcional coordina a la bsqueda. Vamos a buscar en la base de datos no redundante (nr) de nucletidos (nt) en este ejercicio. Tenga en cuenta que esto ya no es la opcin por defecto. Es por eso que se resalta en amarillo. 3. - La tercera seccin ofrece alternativas de optimizacin a la bsqueda. Vamos a utilizar los parmetros y ajustes estndar para nuestra bsqueda. Vamos a buscar secuencias muy similares con bomba de barrido. 4. - En esta seccin se muestra un resumen de nuestras funciones de bsqueda que se han definido en los apartados anteriores. Ahora vamos a marcar la opcin de mostrar los resultados en una nueva ventana. Esta opcin es muy til, ya que nos permite bsquedas BLAST volver a correr con diferentes secuencias y / o parmetros, manteniendo los resultados anteriores. Ahora estamos listos para realizar la bsqueda, haga clic en el icono de BLAST. Despus de unos segundos la pgina de resultados aparecer en una nueva ventana. Si se asume que est familiarizado con una explosin de salida, slo la parte de la lista de salida de accesos y las alineaciones se ilustra aqu. Lista de salida de resultados:
Usted puede notar que slo los primeros 11 hits presentan los valores de E muy bajas (por debajo de 10 -5), que son la mayora, posiblemente significativo. Si queremos ser ms estrictas, exigiendo una cobertura del 100% en la secuencia de alineacin, slo los primeros ocho hits son relevantes para nuestra bsqueda y la caracterizacin de nuestra secuencia. Los seis primeros xitos estn relacionados para completar las secuencias del genoma que lo hace ms difcil para nosotros identificamos nuestra secuencia diana. Esperamos que para encontrar el gen putativo directa o secuencias de ADN que contienen el gen putativo. Por lo tanto, las nicas opciones directas y fciles accesos que quedan son siete y ocho.
Este sencillo anlisis han demostrado que la secuencia de ADN parcial que estamos buscando para identificar ms probable es parte de un gen perteneciente a cualquiera de Mycobacterium tuberculosis o Mycobacterium bovis, o ambos. Cmo resolver esta posible ambigedad? Ahora tenemos que mirar cuidadosamente la secuencia de alineaciones que siguen la lista de xitos de estos dos xitos que hemos seleccionado. Los resultados son los siguientes:
Las estadsticas de alineacin es idntica para los dos hits. Para el xito cuyo nmero de acceso GenBank U02492.1 es, nuestra secuencia de consulta comienza exactamente en la primera posicin de la secuencia de coincidencias. Para el xito cuyo nmero de acceso de GenBank U41388.1 es el final 5 'de nuestra secuencia de consulta partidos residuo 904 en la secuencia de coincidencias. Si hace clic en los enlaces de nmeros de adhesin, se le redirige a la anotacin correspondiente de estas secuencias. Como se sugiere por la anotacin, la segunda es una secuencia mucho ms larga de nucletidos (1789 pb) que contiene no slo una, sino dos genes putativos, uno de ellos a partir de la base 904 que es similar a la encontrada en el primer golpe. Adems, el segundo golpe corresponde a los genes que son putativo, que es, sin confirmacin experimental. A partir de estos anlisis, ahora podemos pasar a la siguiente pregunta. 2 - La secuencia de ADN parcial anterior corresponde a un gen? Si es as, cul es su nmero de acceso GenBank? S. De acuerdo con los anlisis en 1, la secuencia de ADN parcial 30-nucletidos ms probable corresponde a un gen confirmado. Su nmero de acceso es el ms representado por U02492.1.
3 - Cul es el nombre gen? El nombre de un gen puede obtenerse a partir de la anotacin en la lista de resultados o mediante la bsqueda en la base de datos de nucletidos NCBI con el nmero de acceso de GenBank U02492.1. Otra forma es hacer clic en el enlace asociado con la entrada U02492.1 con el botn derecho del ratn y abrirlo en una nueva ventana. La parte superior de la pgina resultante ser de la siguiente manera:
Mirando cuidadosamente en este archivo sin GenBank podemos obtener toda la informacin acerca de la entrada de nucletidos U02492.1. Podemos ver claramente por todas partes, pero ms especficamente en la seccin de caractersticas que el nombre de genes es inh A. 4 - Cul es el tamao en pares de bases del gen? En la seccin de caractersticas, en la novena lnea, el gen de enlace muestra que el gen A inh comienza en la base 22 y termina en la base 831, totalizando as 810 pares de bases. 5 - Qu organismo (s) Tiene el gen pertenece?
Los anlisis mostraron que el gen se puede encontrar tanto en bacterias M. tuberculosis y M. bovis. 5.1.2 Gene del producto o la caracterizacin de protenas 6 - Cuntos aminocidos contiene el producto del gen? Una vez ms, mirando atentamente a la entrada U02492.1, podemos encontrar fcilmente la respuesta a esta pregunta, o por un simple clculo matemtico. Por ejemplo, si el gen contiene 810 pb, los ltimos tres bases componen el codn de parada, por lo que la regin de codificacin de la protena es de 807 pb de longitud. Despus de dividir este nmero por tres (el nmero de bases en un codn) obtenemos 269 aminocidos. Sin embargo, muy a menudo la anotacin de informacin no est disponible, y la nica informacin que tenemos es la secuencia de nucletidos. Por lo tanto, cmo podemos averiguar la secuencia de la protena y, por tanto, de su correspondiente nmero de aminocidos? Tenemos que traducir nuestro inh Una secuencia de genes en su protena correspondiente. Existen varias formas de realizar esta tarea. Vamos a utilizar una de ellas, una herramienta llamada Traducir ( http://us.expasy.org/tools/dna.html ), que se puede acceder a travs del sitio web ExPASy. Esta herramienta traduce una secuencia de ADN (ARN) en sus seis (tres en cada direccin) diferentes posibles marcos de lectura abiertos (ORFs). El traductor de la interfaz se parece a esto:
Nuestra secuencia de nucletidos, correspondiente a la entrada del GenBank U02492.1, fue copiado y pegado para el anlisis (rectngulo rojo). Despus de hacer clic en SECUENCIA TRADUCIR obtenemos:
Nuestra tarea ahora es averiguar cul de los seis cuadros corresponde a la inh Un producto gnico. En otras palabras, nos preguntamos cul es la ORF correcto. A menudo, la ORF correcta es el ms largo entre los seis posibles. Si seguimos a este supuesto (que no siempre es correcta!), La ms larga ORF entre los seis encontrado por la herramienta Traducir ORF 1 (5'-3'Frame 1) es la respuesta correcta. Al hacer clic sobre el enlace 5'-3'Frame 1 nos mostrar la traduccin conceptual en una letra de cdigo de aminocidos, de la siguiente manera:
Una vez identificado, el ORF puede ser traducido en su correspondiente protena o secuencia de aminocidos. En la mayora de las especies procariotas, un ORF comienza con un ATG que codifica para metionina (Met o M) y termina con un codn de parada (TAA, TAG o TGA). Ahora, al hacer clic en el primer residuo Met nos dar nuestra secuencia de la protena en un formato similar al GenBank flatfile, incluyendo el nmero de aminocidos. En este caso, 269 (ver figura siguiente).
Si seguimos y hacemos clic en el enlace de formato FASTA en la parte inferior de la pgina, obtenemos nuestra secuencia de la protena en el formato FASTA, listo para su uso por otros programas.
7 - Cul es el nombre del producto gnico y la posible funcin? Hasta ahora hemos trabajado con una secuencia de ADN. Ahora vamos a consultar las bases de datos NCBI protena con la secuencia de la protena obtenida anteriormente y
descubrir su posible funcin. Por esta puropose, vamos a volver a la pgina bsica BLAST en el NCBI ( http://www.ncbi.nlm.nih.gov/BLAST/ ), pero, en este momento, vamos a seleccionar el enlace "explosin de protenas", que nos llevar a la pgina BLASTp. La pgina BLASTp en NCBI se ver as:
Nuestra secuencia de consulta ya est insertado en el cuadro de bsqueda. BLASTp parmetros estndar para la comparacin de protena-protena estn siendo utilizados, tales como la sustitucin de la matriz BLOSUM62 y la base de datos nr. Para ms detalles, haga clic en el enlace de parmetros de algoritmo en la parte inferior de la pgina. La lista de salida de los resultados se muestra para los golpes de arriba 21:
La puntuacin de bits y los valores de E indican que nos encontramos nuestra protena. Por otra parte, las plazas de rojo a la derecha con la letra "S" dentro indicar que nuestras protenas ms probable es que tenga una estructura 3D (S), que le ayudar a responder las siguientes preguntas. Para aumentar nuestra confianza en que los resultados se corresponden con los homlogos de nuestra protena de la consulta, hay que comprobar si la alineacin abarca toda la secuencia de la protena consulta. La siguiente figura muestra la primera alineacin de la lista de resultados.
Inspeccin de la anotacin, podemos ver la nuestra consulta protena se llama enoil (protena transportadora de acilo o ACP) reductasa de Mycobacterium tuberculosis cepa H37Rv o InhA. Para obtener una respuesta ms completa que podemos acceder a la anotacin de protenas a travs de su nmero de acceso GenBank NP_21600, del mismo modo como lo hicimos con el nmero de genes. La seccin de caractersticas del archivo resultante es:
Desde M. la tuberculosis es una bacteria, esta enzima funciones ms probables en el citoplasma y est implicado en la biosntesis de los cidos miclicos, un componente esencial de su pared celular. Los enlaces azules de la fase de clasificacin pueden proporcionar al lector curioso con ms informacin acerca de esta enzima. 8 - Es este gen presente en los seres humanos? Qu consecuencias podra tener este hecho para una posible aplicacin del producto del gen para un descubrimiento de frmacos basado en la estructura? Para responder a esta pregunta, se puede ejecutar una bsqueda de similitud BLASTp de esta secuencia de la protena contra una base de datos de protenas RefSeq humanos. Adems, es necesario para leer sobre la biosntesis de cidos grasos en los seres humanos y bacterias. Una respuesta rpida es: no, no est presente en los seres humanos. Por lo tanto, en teora es un objetivo de frmaco ideal contra la tuberculosis. De hecho, el lector encontrar que esta enzima se ha demostrado ser un objetivo de buena fe de la isoniazida (INH).
9 - El producto del gen tienen una estructura 3D? Si es as, cul es su nmero de identificacin RCSB / AP? Describir la arquitectura de producto gnico. Como podemos ver en la salida BLASTp anteriormente, en la actualidad hay varias estructuras 3D de la enzima InhA, complejo enzima-NADH, complejos terciarios relacionados con los frmacos candidatos, y con el aducto NADH-INH que inhibe la enzima. Histricamente, la primera estructura InhA por determinar es que con PDB ID 1ENY (la 8 entrada en la lista negra de BLASTp), por lo que vamos a investigar este particular. Para ver la estructura 3D, ahora debera ir a la pgina de bsqueda PDB ( http://www.rcsb.org/pdb/home/home.do ). Para ello, introduzca el cdigo PDB de la protena (1ENY) en la barra de bsqueda en la parte superior de la pgina y haga clic en "Site Search". La pgina inicial del resultado se ver de la siguiente manera:
Se puede obtener toda la informacin disponible de la estructura 3D de esta enzima por navegar a travs de los enlaces o descargar el archivo PDB en un directorio local en nuestro ordenador y trabajar con nuestra modelizacin molecular preferido y el paquete de visualizacin. Por ejemplo, podemos ver en la seccin de clasificacin que esta enzima tiene una de 3 capas () arquitectura sandwich de acuerdo con la clasificacin CATH. Vamos a visualizar la siguiente. Algunos de los software de visualizacin se puede acceder directamente desde la pgina se ilustra arriba. Se pueden ubicar en la parte inferior de la seccin "Imgenes y Visualizacin". Otra alternativa es el sitio Primera Presentacin en Jmol ( http://molvis.sdsc.edu/fgij/index.htm ). Ir al sitio, introduzca 1ENY en la casilla en blanco y haga clic en el botn Enviar:
Como su nombre indica, podemos hacer muchas manipulaciones visualizacin sencillas que nos ayudarn a comprender la estructura de la molcula, las interacciones y la funcin.
Nota: el uso de software de visualizacin molecular, no importa lo simple que es, requiere al menos un conocimiento general del objeto a ser visualizado. Por lo tanto, para poder utilizar este software, el usuario debe comprender los principios bsicos de la estructura y funcin de protenas. Despus de enviar el cdigo PDB 1ENY, y esperando un poco para cargar la mquina JAVA, obtenemos:
Aqu la estructura InhA parece esttica, pero el sitio se mostrar inicialmente la imagen de rodar con el fin de presentar una mejor idea de su tridimensionalidad. Al pulsar el botn izquierdo del ratn y moviendo de izquierda a derecha y de arriba abajo permite al usuario mantener el control total de la rotacin de la molcula. Adems, al pulsar el botn izquierdo del ratn al mismo tiempo que las teclas de control o alt, y moviendo el ratn, va a cambiar el zoom. Es posible visualizar la molcula usando diferentes representaciones. Por encima, la enzima columna vertebral se representa como cintas donde hlices y las hebras de la hoja son de color rojo y amarillo, respectivamente. Vueltas y loops estn en gris. En este ngulo de vista, podemos ver hlices de la izquierda, una hoja central, y ms hlices de la derecha. Es por eso que esta enzima tiene una arquitectura de tipo sndwich de 3 capas-
. Las dos hlices capas son las "rebanadas de pan" y la lmina , relleno del sndwich! Tambin podemos observar el modelo que llena el espacio del NADH coenzima color de acuerdo a las normas de la CPK (nitrgeno en azul, el carbono en gris, el oxgeno en rojo, el fsforo en naranja). Esta coenzima es la clave para la funcin de InhA. En la figura, los puntos negros aadido flecha a la posicin en la que el sustrato cabr dentro de la enzima. Los frmacos que inhiben esta enzima es muy probable que se unen a esta regin. 10 - Si el producto gnico no tiene una estructura 3D, sera posible inferir la estructura de los homlogos ms cercanos con una estructura 3D conocida? Explica la respuesta en los detalles. Recuerde que toda la informacin que hemos reunido hasta ahora comenz a partir de una pequea secuencia de nucletidos. Algunos conocimientos bsicos de la biologa molecular y el uso de slo unos pocos de ms de 1.200 sitios web de bioinformtica estn disponibles en un servidor de edicin web de la revista Investigacin Nucleic Acids ( http://nar.oxfordjournals.org/content/vol35/suppl_2/index. shtml? etoc ). Afortunadamente, encontramos una estructura 3D de nuestra secuencia de nucletidos 30. Si nuestra protena no tiene una estructura, podramos utilizar el principio de modelado comparativo u homologa para construir una estructura de 3D para ello. Este principio establece que si una secuencia de la protena de estructura desconocida (protena diana) tiene una identidad de secuencia mayor que o igual a 30% con otra protena con estructura conocida (plantilla), en toda su longitud, a continuacin, la protena diana estructura 3D puede ser modelada basado en una o en una combinacin de varias molculas de molde ( 26 ). Esto es posible porque las protenas homlogas descienden de un ancestro comn y son propensos a presentar la misma estructura y funcin. Nota de precaucin: Esto es correcto en general, pero hay excepciones, sin embargo.