Sie sind auf Seite 1von 35

Captulo A06 estructura de protenas, Modelizacin y Aplicaciones

Ardala Breda, Napoleo Fonseca Valadares, Osmar Norberto de Souza, y Charles Richard Garratt. Informacin del Autor Creado: 1 de may de 2006; ltima actualizacin: 14 de septiembre de 2007.

1. Por qu es importante estudiar las protenas?


En el drama de la vida a nivel molecular, las protenas son donde est la accin ( 1 ). Las protenas son dispositivos moleculares, en la escala nanomtrica, donde se ejerce la funcin biolgica ( 1 ). Ellos son los componentes bsicos de todas las clulas de nuestro cuerpo y en todos los seres vivos de todos los reinos. Aunque la informacin necesaria para que la vida siga es codificada por la molcula de ADN, el dinmico proceso de mantenimiento de la vida, la replicacin, la defensa y la reproduccin se llevan a cabo por las protenas. Hay veinte aminocidos naturales, cuya frecuencia es ms alta que otras especiales con funciones particulares. Estos veinte aminocidos se pueden agrupar formando cadenas de polipptidos, o protenas, en diferentes formas determinadas por el cdigo gentico y limitado por las propiedades estereoqumicas. Estas protenas pueden tener una expresin constitutiva o transitoria de clulas en lo que respecta a sus funciones. Vale la pena mencionar que los esfuerzos estn en marcha para hacer protenas de aminocidos no naturales tambin ( 2 , 3 ). El Proyecto de ontologa de genes ( 4 ) utiliza tres categoras para describir un producto de gen o protena. Funcin Molecular es la categora que describe las tareas realizadas por las protenas individuales y se puede dividir en doce subcategoras, a saber, los procesos celulares, el metabolismo, la replicacin del ADN / modificacin, la transcripcin / traduccin, de sealizacin intracelular, la comunicacin de clula a clula, la protena plegables / degradacin, transporte, protenas multifuncionales, las funciones del citoesqueleto / estructurales, la defensa y la inmunidad, y varios. Las protenas estructurales, por ejemplo, son responsables de la integridad celular y la forma general de clulas ( 5 ), sus funciones vara de componer el citoesqueleto ( 6 ) de montaje de canales de iones transmembrana ( 7 , 8 ), una estructura esencial para la osmolaridad celular e incluso para sinptica flujo de informacin. No slo la molcula de ADN no puede replicarse a s mismo sin maquinaria de la protena, tales como el complejo de transcripcin, o burbuja de la transcripcin ( 9 ), pero tambin las mitosis y la meiosis eventos de duplicacin celular y la produccin de gametos no puede seguir sin protenas que realizan los pasos ms eventos y la segregacin cromosmica ( 10 ). El sistema

inmunolgico, encargado de la defensa de nuestro cuerpo, se basa en la estructura de reconocimiento, en la diferenciacin del yo del no-yo, lo que slo puede ser posible a travs de clulas especializadas que se pueden unir e identificar lo que es ajeno al cuerpo. Tales procesos de reconocimiento se produce a travs de interacciones protena-protena en la superficie de las clulas del sistema inmune, donde la afinidad de unin se puede determinar si ser o no ser iniciada una respuesta inmune, y tambin donde no asignadosinteracciones protena o el reconocimiento puede causar enfermedades auto-inmunes ( 11 , 12 ). Las reacciones bioqumicas de la respiracin celular, el oxgeno y el transporte de gas carbnico, la absorcin de alimentos, el consumo de energa, almacenamiento de energa, el calor o reacciones fisiolgicas fros, o cualquier proceso de la vida uno puede imaginar, se lleva a cabo bsicamente por una protena o un complejo de protenas. Todos los procesos que tienen lugar en un organismo vivo tienen protenas que actan en alguna parte, de una manera precisa, desarrollado bajo la presin de la seleccin natural. Estos son slo algunos ejemplos de funcin de la protena. Un hecho notable es que todas las tareas que pueden realizar se basan en un principio comn, los veinte aminocidos que pueden formar una protena. Esa es la razn por la que el estudio de las protenas, su composicin, estructura, dinmica y funcin, es tan importante. Debemos entender cmo estas molculas veces, la forma en que se ensamblan para formar complejos, cmo funcionan, si queremos responder a preguntas como por qu tenemos cncer, por qu nos ponemos viejos, por qu nos enfermamos, cmo podemos encontrar la cura para muchas enfermedades, por qu la vida como la conocemos, ha evolucionado de esta manera y en este planeta y no en ningn otro lugar, al menos por el momento. Todas las protenas funciones dependen de su estructura, que, a su vez, depende de los parmetros fsicos y qumicos. Este es otro hecho importante en el estudio de estas molculas, clsica biolgica, fsica, qumica, matemticas y ciencias de la informtica han estado trabajando juntos en una nueva zona conocida como la bioinformtica para permitir un nuevo nivel de conocimiento de organizacin de la vida ( 13 ).

2. Explosin de Secuencias Biolgicas y datos de estructura


Las protenas tradicionalmente han de ser estudiados individualmente. Una protena de inters se haba su secuencia de codificacin identificado y clonado en un vector de expresin adecuado. Por lo tanto, siempre que la clonacin, expresin y purificacin fueron exitosos, suficientes cantidades de protenas puras podran ser empleados en experimentos bioqumicos o se utilizan para preparar soluciones para la espectroscopia de RMN o hacer crecer cristales para determinacin de la estructura por cristalografa de rayos X. Con los avances de la tecnologa de secuenciacin de los aos 80, el paradigma cambi de estudio de las protenas individuales de todo el conjunto de protenas de un organismo ( 1 , 14 ). Desde la segunda mitad de los aos 90 se observa un crecimiento exponencial de la secuencia biolgica y la estructura de datos, principalmente por los proyectos del genoma en marcha en diferentes pases de todo el mundo, tanto en las industrias pblicas y privadas ( . Fig. 1 ). En abril de 2007, haba 1.952 proyectos del genoma, de los cuales 343 son de

genomas completos publicados, 993 y 588 son de curso genomas procariotas y eucariotas, respectivamente, y el 28 de metagenomes ( www.genomesonline.org ( 15 )). Figura 1 Nmero de secuencias disponibles en el GenBank partir del 15 de diciembre de 2005. La explosin de datos biolgicos a mediados de los 90 se puede ver fcilmente con el crecimiento exponencial desde 1995. Para una descripcin detallada del conjunto completo de datos, consulte http://www.ncbi.nlm.nih.gov/Genbank/genbankstats.html. (ms. ..) Estos rea de datos almacenados en bases de datos o bancos de datos, cuyo nmero aumenta cada ao. Segn Galperin ( 16 ), hay 858 bases de datos, 139 ms que el ao anterior, a disposicin del pblico. La cantidad de datos producidos inst a la necesidad de formas rpidas y fiables de acceso, recuperacin, investigacin y comprensin de estos datos ( 13 , 17 ). Herramientas bioinformticas se utilizan para realizar estas tareas en todas las bases de datos biolgicos, de los cuales GenBank ( 18 ) en el NCBI y RCSB / AP ( 19 ) son los ms representativos de secuencias y estructuras, respectivamente.

2.1 La base de datos GenBank


GenBank, posiblemente la base de datos primaria biolgica ms conocida, contiene secuencias de ADN a disposicin del pblico por ms de 205 mil especies diferentes, obtenidos principalmente a travs de las presentaciones de los distintos laboratorios y presentaciones lote de proyectos de secuenciacin a gran escala. Junto con la Biblioteca de Datos EMBL en Europa y en el Banco de Datos de ADN de Japn, que hacen las tres ms importantes bases de datos de secuencias con el intercambio diario de datos, diseados para proporcionar y fomentar el acceso de la comunidad cientfica a la mayora hasta la fecha y la secuencia de ADN completa informacin, asegurando la cobertura de todo el mundo ( 18 ). Al 15 de diciembre de 2005, no son 52.016.762 secuencias en GenBank . A (BLAST 20 ) Bsqueda de 8 de febrero de 2006 revel que de la cantidad por encima de 3.284.262 secuencias son secuencias no redundantes (nr) de codificacin (CDS), con exclusin de las muestras ambientales. Las secuencias nr se actualizan regularmente, por lo que su valor puede cambiar de una semana a otra.

2.2 La base de datos RCSB / AP


El Collaboratory Investigacin de Bioinformtica Estructural (RCSB) Protein Data Bank (PDB) proporciona un recurso web la informacin a las estructuras macromoleculares biolgicas ( 19 ). Incluye herramientas y recursos para la comprensin de la relacin entre la secuencia, estructura y funcin de macromolculas biolgicas. Al 7 de febrero de 2006, no fueron 35.026 estructuras en el RCSB / AP, de los cuales 33.429 son protenas ( . Fig. 2 ), incluidos los que forman complejos con los cidos nucleicos [ Tabla Resumen de los comentarios Lanzamiento ].

La figura 2 Crecimiento del nmero total de estructuras en la base de datos RCSB / AP (Kouranov et al., 2006). El crecimiento exponencial sigue el mismo patrn de la figura 1. Al igual que en las secuencias de GenBank nr, si usamos un 90% secuencia de identidad de corte para eliminar la redundancia en el banco de datos de estructura de protenas que terminamos con 12.611 grupos o conjuntos distintos de estructuras [ Estadsticas actuales sobre la redundancia en el Protein Data Bank RCSB ]. Si ahora suponemos que este nmero representa los diferentes tipos de pliegues de protenas conocidas y compararlo con los diferentes tipos de secuencias de protenas conocidas, a partir de la base de datos del GenBank nr , se concluye que slo el 0,38% de las secuencias de protenas disponibles sabido pliegues. Uso de 1028, el nmero actual de pliegues determinados por la SCOP [ Como pliegues definidos por la SCOP , ( 21 , 22 )], el nmero de secuencias de protenas con pliegues conocidos, 0,03%, es considerablemente ms pequeo. Esto es en parte debido a la mayor velocidad con la que las secuencias de protenas se puede determinar (a partir de CDS) en comparacin con la determinacin de nuevas estructuras 3D de protenas. [Comentario: Tambin, muchas secuencias de protenas tienen pliegues 3D similares, y muchas de estas secuencias tienen poca similitud de secuencia con otras secuencias con el mismo pliegue 3D. Esta es una razn principal por la cual el nmero de pliegues SCOP es mucho menor que la predicha por simple secuencia similitud.] Claramente, los mtodos computacionales que son complementarios a los mtodos experimentales para la determinacin de estructuras de protenas son necesarios, y stos se pueden proporcionar por bioinformtica estructural esfuerzos [revisado por 23-25]. Segn el Diccionario Ingls de Oxford, Bioinformtica Estructural est conceptualizando la biologa en trminos de molculas, en el sentido de la qumica fsica y la aplicacin de tcnicas informticas, derivados de disciplinas como las matemticas, la ciencia y la estadstica equipo, comprender, organizar y explorar la informacin estructural asociada a estas molculas a gran escala ( 13 ). Hay varios mtodos de clculo para la determinacin de la estructura de protenas, incluyendo el modelado de homologa ( 26 ), el reconocimiento veces a travs de roscado ( 27 ), y los mtodos ab initio ( 28 ). El enorme incremento en la cantidad de secuencias y datos de estructura de protenas, junto con los avances en la bioinformtica, los mtodos experimentales y computacionales, estn mejorando nuestro conocimiento sobre la relacin entre la secuencia de la protena, la estructura, la dinmica y la funcin. Este conocimiento, a su vez, est siendo utilizado para entender cmo las protenas interactan con otras molculas tales como pequeas molculas o ligandos que pueden convertirse en un candidato a frmaco. En las secciones siguientes se describe la jerarqua de estructura de la protena y su aplicacin al diseo de frmacos en enfermedades tropicales. La ltima seccin es un ejercicio que le permita al lector o estudiante para aplicar varias herramientas bioinformticas a partir de una secuencia de ADN parcial o nmero de acceso de protena y produciendo un modelo de su estructura y funcin.

3. Principios bsicos de la estructura de protenas

Cuando un tomo de todo el modelo de una estructura de la protena se ve por primera vez (ya sea una figura, un modelo tridimensional o una representacin de grficos de ordenador) puede parecer una tarea desalentadora para descifrar cualquier patrn subyacente dentro de ella. Despus de todo, estas estructuras suelen contener miles, si no decenas-o cientos-de-miles de tomos. Por esta razn, a menudo se considera conveniente para simplificar el problema mediante el uso de una descripcin jerrquica de la estructura de la protena en la que las capas sucesivas de la jerarqua describen cada vez ms complejos niveles de organizacin. Tpicamente cuatro niveles se utilizan y se utilizarn para la estructura primaria, secundaria, terciaria y cuaternaria de una protena. A menudo es til incluir dos niveles intermedios adicionales entre las estructuras secundaria y terciaria, que se conocen como estructuras secundarias sper y dominios. Existen muchos excelentes libros de texto sobre el tema que debe ser consultado para obtener informacin ms detallada ( 1 , 29 - 31 ). Aqu, vamos a tratar slo de dar un esquema para hacer hincapi en la importancia del estudio de la estructura tridimensional de las protenas para el proceso de diseo de frmacos que se describe al final de este captulo.

3.1 Estructura primaria


La estructura primaria de una protena originalmente se refera a su estructura covalente completa pero con ms frecuencia se interpreta como la secuencia de aminocidos de cada cadena de polipptido de la protena que se compone. Estos son a menudo una y la misma cosa, pero los enlaces de disulfuro y otros tipos raros de enlace covalente formado entre las cadenas laterales de los aminocidos no estn codificados directamente por la propia secuencia. Una cadena de polipptidos es un heteropolmero unidimensional compuesta por residuos de aminocidos. Hay bsicamente slo veinte aminocidos de origen natural que son codificados directamente por el gen correspondiente, aunque en casos excepcionales codones de parada se pueden utilizar para la incorporacin de dos aminocidos adicionales (selenocistena y pirrolisina ( 32 )). Todos estos aminocidos son cidos -aminocidos que poseen la estructura genrica dada en la Figura 3a . Comn a todos estos aminocidos es el grupo amino, grupo de cido carboxlico y de hidrgeno unido al tomo central de carbono (el carbono ). Slo el grupo R (tambin conocida como la cadena lateral) se diferencia de un aminocido a otro y vara en trminos de tamao, polaridad, hidrofobicidad, carga, forma, volumen, etc Con los veinte aminocidos diferentes disponibles, la naturaleza es capaz de producir la gran diversidad de funciones que desempean las protenas en los organismos vivos. Figura 3 Los aminocidos. En (a) la estructura genrica de un cido -amino se da, en el que slo el grupo R (cadena lateral) vara de un tipo a otro. En (b) y (c), respectivamente, se muestra la diferencia entre los D-aminocidos L-y (uno de ellos el (ms. ..) Cabe sealar que la -carbono es tetradrica y, en general, est obligado a cuatro restos qumicos diferentes. Como tal, es asimtrica (un centro quiral) y existen dos enantimeros

diferentes (D y L) para cada aminocido ( Fig. 3b ). Entre los aminocidos de origen natural, la nica excepcin es el aminocido glicina, cuyo grupo R es un tomo de hidrgeno, haciendo que el simtrica -carbono. Esto confiere una serie de propiedades conformacionales importantes en este aminocido que a menudo son esenciales para el mantenimiento de una estructura dada. Por esta razn, glicinas crticos a menudo se conservan entre los miembros de una familia de protenas dada. Los restantes aminocidos son (con muy pocas excepciones) siempre encontr que los L-aminocidos. Esto tiene consecuencias importantes para las estructuras quirales observados en las protenas en todos los niveles de la jerarqua. Slo existen otros dos centros quirales dentro de los veinte aminocidos, estas son las -carburos dentro de las cadenas laterales de los aminocidos treonina e isoleucina, que tambin existen, ya que slo uno de los dos enantimeros posibles. Una cadena de polipptido se genera por una serie de reacciones de condensacin entre el grupo carboxilo de un aminocido y el grupo amino de la siguiente, produciendo un enlace covalente ( . Fig. 4 ). Este es un enlace amida que se da el nombre trivial de un enlace peptdico en el caso de cadenas de polipptidos. La unin de dos cidos resultados amino en un dipptido, que posee un grupo amino libre (N-terminal) y el grupo carboxilo (Cterminal) permitiendo que la reaccin de condensacin para continuar ad infinitum, en principio, en ambas direcciones ( . Fig. 4 ). Despus de someterse a la condensacin, el aminocido se denomina un residuo (para denotar `lo que queda" despus de la condensacin). Teniendo en cuenta la existencia de la 20 aminocidos de origen natural, para un polipptido de longitud n hay 20 n posible secuencias de aminocidos. Dado que n es tpicamente del orden de cientos e incluso puede ser decenas-de-miles, el nmero de tericamente posibles secuencias de polipptidos es literalmente astronmica. No existen en la actualidad la gran mayora (de hecho, hay materia suficiente en el universo) y nunca han existido antes (ya que no ha habido tiempo suficiente para generarlos). Los polipptidos que observamos en las especies actuales son los productos seleccionados de entre una pequea fraccin de todas las combinaciones posibles que se expresan a lo largo del proceso evolutivo. Figura 4 Una cadena de polipptido se genera por una serie de reacciones de condensacin, in vivo que ocurren normalmente dentro del ribosoma durante la sntesis de protenas. Los aminocidos individuales se muestran en su forma de ion hbrido, en el que los grupos amino y cido carboxlico (Ms. ..) 3.1.1 Las propiedades conformacionales de una cadena polipeptdica Debido a la naturaleza qumica del enlace amida, el enlace peptdico entre dos aminocidos est sujeta al fenmeno de la resonancia, lo que significa que adquiere las caractersticas de un doble enlace parcial. La distancia CN (1.32A) es ms corto que un enlace sencillo normal y ms de un doble enlace normal. Adems, esta introduccin de una rigidez en la estructura como el vnculo ya no puede girar libremente. La consecuencia es que los tomos de -carbono de dos aminocidos adyacentes, junto con el carbonilo (C = O) y los grupos NH de la propia grupo de pptidos, se encuentran todos en el mismo plano ( . Fig. 5

). La torsin (diedro) ngulo asociado a este enlace se denomina , que con el fin de ser plana debe ser 180 o (trans) o 0 o (cis). Enlaces peptdicos cis son slo comn cuando los cidos mentiras prolina aminocidos en el C -terminal del lado de la fianza. Esto es debido a la naturaleza inusual de la cadena lateral de prolina que forma un enlace covalente con su propia cadena principal de generacin de nitrgeno un anillo cerrado. Como tal prolina es, estrictamente hablando, un cido amino secundario y ni trans ni cis son particularmente energticamente favorable. Aproximadamente un tercio adoptar la conformacin cis y stos se conservan con frecuencia entre los miembros de la familia de protenas ( 33 ). La figura 5 Una seccin corta de la cadena de polipptido que muestra los grupos de pptidos planas y la identificacin de la torsin ngulos y . Los polipptidos obedecen necesariamente estereoqumica estndar y por lo tanto todas las longitudes y ngulos de enlace estn efectivamente fijas, variando slo mnimamente en torno a sus valores normales. Por lo tanto, la nica fuente de la libertad conformacional que posee el polipptido proviene de la rotacin de torsin alrededor de sus enlaces simples. Ya hemos visto que el enlace peptdico no es libremente giratorio, por lo que es efectivamente fijado, normalmente en la configuracin trans. Slo hay dos enlaces sencillos restantes por residuo a lo largo de la cadena principal, y uno de estos bonos pueden asociar la torsin ngulos y ( . Fig. 5 ), que se define como 0 o cuando en la conformacin trans. La conformacin de la cadena principal de un residuo dado puede por lo tanto ser descrito en trminos de estos dos parmetros, que pueden ser representados convenientemente en trminos de un sistema de coordenadas de dos dimensiones (el grfico de Ramachandran), en el que tanto y varan entre -180 y 180 o.

3.2 Estructura secundaria


No todas las combinaciones de y son estereoqumicamente posible, ya que muchos (como por ejemplo 0 o / 0 o por ejemplo) provocan un impedimento estrico. De hecho, como se muestra originalmente por Ramachandran, slo alrededor de un tercio del espacio / es estereoqumicamente accesible a los residuos de aminocidos en un polipptido real ( 34 ). Si los ngulos y se repiten sistemticamente para todos los residuos dentro de un tramo de polipptido, el resultado ser inevitablemente una hlice. Un nmero infinito de tipos de hlice son tericamente posible, dependiendo de la combinacin de y , y que puede ser convenientemente caracteriza por dos parmetros, n y d, correspondientes, respectivamente, al nmero de restos por vuelta helicoidal y el desplazamiento paralelo a la eje de la hlice por residuo. Hay relaciones matemticas convenientes que se relacionan y a n y d. Sin embargo, de todas las hlices tericamente posibles, slo un nmero limitado ocurre con cualquier frecuencia en las estructuras de protenas. Los que son ms importantes en el caso de las protenas globulares corresponden a la -hlice ( -63 o, -42 o, n = 3,6, d = 1.5A) y el -captulo ( -120 o y 135 o, n = -2.3, d = 3,3 A). Estos son los tipos ms

importantes de la estructura secundaria y corresponden a pequeos tramos de residuos consecutivos. El valor de n negativo en el caso de la -hebra indica que es una hlice zurdo, mientras que la -hlice es diestro. El hecho de que el parmetro n es cerca de 2 para la captulos (el valor mnimo tericamente posible) significa que las hebras son de hecho muy extendida hlices con un dimetro cadena principal estrecho. Por consiguiente las cadenas laterales emergen alternativamente en lados opuestos de la cadena, dando lugar a un aspecto de zig-zag o plisada. La -hlice ( . Fig. 6 ) es particularmente abundante en tanto globular y algunas protenas fibrosas debido a su estabilidad inherente. Esto surge como consecuencia de varios factores, incluyendo la presencia de enlaces consecutivos de hidrgeno entre el carbonilo del residuo i y el NH de residuos i 4, el radio de la hlice que es compatible con el de Van de Waals contactos a travs del eje de la hlice y la posibilidad de formar pares de iones (puentes de sal) entre los residuos cargados opuestamente separados por 3 o 4 residuos a lo largo de la secuencia. Los enlaces de hidrgeno son particularmente fuertes debido a la separacin ideal entre donante (nitrgeno) y aceptor (oxgeno) tomos, as como debido a su linealidad y la alineacin dipolar. Alternativos pero similares hlices, tales como el 3 y 10 hlices son mucho menos comunes debido a la naturaleza ms dbil de las fuerzas estabilizadoras descritas anteriormente. Autnomas 3 10 hlices s existen, pero son mucho ms comnmente observado como la primera o ltima a su vez de una -hlice ( 35 ). -hlices pueden ser un poco ms comn de lo que se pensaba ( 36 ). La figura 6 Los tipos ms comunes de la estructura secundaria. -hlices en general presentan una serie de propiedades fisicoqumicas y estructurales comunes. Ellos tienden a ser anfipticos, con una cara hidrofbica apuntando hacia el ncleo de la protena y una cara hidrfila dirigida hacia disolvente acuoso (esto puede ser invertido en el caso de protenas de la membrana). La competencia entre el agua y los grupos de amida de la columna de la protena tiende a alargar los enlaces de hidrgeno en la cara hidrfila, lo que lleva a la curvatura de la hlice ( 37 ). La alineacin de los dipolos individuales de las unidades peptdicas conduce a un dipolo macroscpico asociado con toda la hlice, que es tpicamente del orden de 0,5 unidades de carga positiva en el extremo N-terminal y 0,5 unidades de carga negativa en el extremo C-terminal ( 38 ). Junto con los grupos NH libres dentro de la primera a su vez, esto hace que el N-terminales de -hlices sitios de unin ideales para aniones, tales como fosfato. En la ausencia de tal un anin, con frecuencia el extremo N-terminal est limitada por la cadena lateral del primer residuo helicoidal (la N-casquillo), que es muy a menudo una asparagina o cido asprtico ( 39 ). El aminocido ms comn que se encuentra en la segunda posicin es una prolina, lo que significa que la secuencia Asn-Pro sera, en principio, ser una seal de iniciacin de hlice fuerte. -captulos no son capaces de formar enlaces de hidrgeno internos. Se renen en lminas por la formacin de enlaces de hidrgeno entre hebras ( . Fig. 6 ). Hojas pueden ser paralelas, antiparalela o mixto en la naturaleza en funcin de la orientacin relativa de los hilos de los que estn compuestos. La ngulos y varan de un tipo a otro y -hojas son

capaces de asumir una amplia variedad de arquitecturas ( 40 ). Una caracterstica comn a casi todos los -hojas es que se tuercen. Cuando se ve perpendicular a las hebras, la hoja tiene un giro de la mano izquierda y cuando se mira en paralelo a los hilos que es diestro. Este ltimo puede aparecer una contradiccin dado el giro de la mano izquierda de las hebras individuales (vase ms arriba), pero resulta del hecho de que slo cada segundo residuo de (1, 3, 5, 7, etc, o 2, 4, 6, etc) contribuir enlaces de hidrgeno en el mismo lado de la hebra. Existen, pero son poco frecuentes en comparacin con los trenzados hojas planas (con n = 2). Figura 7 muestra ejemplos de los dos planos y retorcidos -hojas. La figura 7 Apartamento (n = 2) y retorcido -hojas (izquierda y derecha, respectivamente) Entre las diferentes arquitecturas que forman -hojas son paralelas (raro) y anti-paralela (comunes) bobinas en espiral, paralelos y monturas anti-paralelas (paraboloides hiperblicos), barriles paralelos 8 de cadena y barriles anti-paralelas con un nmero muy variable de hilos enrollados, helicoides de tres hilos, etc ( 40 ) En las protenas globulares, las -hlices y -captulos menudo atravesar la estructura. Dado que ambos tienen ejes aproximadamente lineales, claramente son necesarios otros tipos de estructura con el fin de causar la inversin de la cadena. Estos se denominan giros y bucles. Activa se componen de una serie bien definida de los residuos. -vueltas se componen de dos residuos, -cumple tres aos, -turnos cuatro, -cumple cinco aos y gira de seis ( 41 ). El ms conocido y ampliamente descrito son los -vueltas, que vienen en varias formas diferentes distinguibles por el y ngulos de los segundo y tercero residuos de la vuelta. En la mayora (pero no todas) las definiciones, existe un enlace de hidrgeno entre el carbonilo del primer residuo y el NH del cuarto. Varias clasificaciones se han propuesto para la -vueltas y tipos I y II son los ms comunes (ver 41 ). Sin embargo los tipos I 'y II' se observan en -horquillas (una estructura sper-secundaria compuesta de dos hebras -anti-paralelo) debido a la compatibilidad de la hoja de torsin con la de la propia (a su vez 42 ). En general, las vueltas no pueden ser representados por un nico punto en el espacio / (a diferencia de las hlices descritas ms arriba). De hecho muchas de las -vueltas requieren uno de los residuos internos (2 o 3) para adoptar `ngulos / prohibidas", imponiendo un requisito para una glicina en las posiciones especficas ( 41 ). El tipo de giro puede a veces por lo tanto, ser fcilmente predicho a partir de la secuencia de residuos de sus componentes. Los bucles son ms difciles de clasificar, ya que son ms grandes que gira y por lo tanto pueden adoptar una amplia variedad de conformaciones. Diferente a los giros, por lo general, presentan un ncleo hidrofbico y, al menos en el caso de -bucles, son tan compacto como otras partes de la estructura.

3.3 Estructura terciaria


Con el fin de formar estructuras globulares, los elementos individuales de la estructura secundaria de un polipptido deben embalar uno contra el otro con el fin de formar una

estructura terciaria estable, compacta y biolgicamente activa. Las formas en que las estructuras secundarias Pack ms comnmente ha sido ampliamente estudiada ( 43 - 45 ). Los modelos ms simples que tienen por objeto explicar las observaciones experimentales se basan en la interdigitacin de las cadenas laterales. Por ejemplo, el enfoque de las perillas-en-agujeros o modelo cordilleras-en-surcos ( 43 ) explican igualmente bien los ngulos de embalaje ms comnmente observadas entre los dos -hlices ( = -50 y 20 ). Un enfoque similar se puede utilizar para el embalaje de -hojas de una contra la otra o de las hlices en contra de hojas ( 44 , 45 ). El resultado final del proceso de plegado es la estructura tridimensional completa del polipptido. Claramente, esto depende de la secuencia de aminocidos y por lo tanto en los detalles atmicos de la estructura. Sin embargo, para las protenas solubles esto ser casi inevitablemente como resultado la generacin de un ncleo hidrfobo en el que los residuos apolares tienden a agruparse sus cadenas laterales dentro del interior de la protena, dejando residuos hidroflicos expuestos al disolvente. Para fines descriptivos es til para simplificar la estructura mediante la eliminacin del detalle atmico y teniendo en cuenta slo la traza de la cadena principal en el espacio (vase la fig. 8 ). Esto se conoce como el pliegue de la protena a menudo. Existen muchas clasificaciones de los pliegues de protenas y dos de los ms utilizados son SCOP ( 22 ) y el cateterismo ( 46 ), ya que ambos utilizan un enfoque jerrquico. El nivel ms alto de la jerarqua clasifica pliegues en clases, en base a su contenido de estructura secundaria global (principalmente , principalmente , / , irregular). En el caso de la clasificacin CATH ( . Fig. 9 ), la segunda capa de las ofertas de jerarqua con diferentes arquitecturas dentro de una clase dada, de los cuales hay actualmente aproximadamente 30 tipos principales. Por ejemplo, dentro de los pliegues de la clase puede ser clasificado en el nivel de arquitectura como -haces, -no-haces, herraduras, -solenoides y / barriles. Dentro de la clase , hay -rolls, -barriles, almejas, --sndwiches trboles, -prismas (paralelas y ortogonales) -hlices (con diferente nmero de hojas), diferentes tipos de -solenoides (o -hlices), etc Dentro de la / de clase nos encontramos con barriles / (barriles TIM), / (sndwiches con un nmero variable de capas y tipos), el / -box, / -herradura, / -hlice etc La arquitectura describe la disposicin general de los elementos estructurales secundarios pero sin preocupacin por su conectividad. Figura 8 Las diferentes representaciones de la misma estructura de la protena (protena precursora del amiloide de Alzheimer). Todos los tomos excepto hidrgenos (a la izquierda), Ctraza (centro) y la cinta (a la derecha). Figura 9 Parte de la clasificacin CATH. Se muestran ejemplos de los superiores mayora de los niveles de la jerarqua (clase, Arquitectura y topologa). A nivel de la topologa, una descripcin ms fina se da dentro de una arquitectura dada en la que se toma la conectividad de las estructuras secundarias en cuenta. Por ejemplo, incluso teniendo en cuenta una arquitectura relativamente simple, la de un -haz, por

ejemplo, un haz de cuatro hlices, hay un sorprendente nmero de diferentes topologas (formas de orientar las hlices con respecto a la otra y luego los conectan). De hecho, hay 48 diferentes topologas tericamente posible para un haz de cuatro hlices ( 47 ). Sin embargo, probablemente por razones de simplicidad de plegado, la naturaleza ha favorecido el todo paquete anti-paralelo en el que dos hlices diagonal relacionados son paralelas y orientada hacia el resto anti-paralelo. Estas topologas son ms comunes de lo que cabra esperar por azar. Hay una creencia general de que el nmero total de pliegues es relativamente limitada (quizs unos pocos miles) y se espera que a medida que el resultado de las iniciativas de genmica estructural, dentro de los prximos aos nuestro conocimiento del universo de posibles pliegues utilizado por las protenas solubles al menos ser razonablemente completa ( 48 ). Ya est claro que algunos pliegues son ms comunes que otros y estos se han denominado superfolds por algunos autores ( 49 ). Incluyen el barril TIM, la jalea-roll y de arriba a abajo paquete 4-hlice. Con la acumulacin de nuevas estructuras de protenas a un ritmo cada vez mayor, determinado por difraccin de rayos X y RMN multidimensional, que ha sido posible derivar una serie de reglas empricas que gobiernan las formas posibles en las que un polipptido se puede plegar. Aunque muchas de esas reglas son fundadas sobre una base puramente emprica, algunos de ellos probablemente pueden explicarse apelando a la necesidad de la cintica de plegamiento eficientes. La regla ms bien establecida es la que determina que las conexiones entre los elementos de la estructura secundaria del tipo x (donde se refiere a una hebra -y x puede ser cualquier cosa, una -hlice, un bucle u otro -cadena) deben estar la mano derecha ( 50 ). Hay muy pocas excepciones a esta regla, pero un ejemplo espectacular es el zurdo -hlice, como se ve por ejemplo en la UDP-Nacetilglucosamina aciltransferasa ( 51 ). Otras reglas de conectividad prohben el entrecruzamiento de las conexiones de bucle y la formacin de nudos, por ejemplo. Sin embargo, como con la mayora de las reglas empricas, las excepciones siempre se pueden encontrar, y recientemente se han descrito algunas estructuras dramticamente anudadas ( 52 ). Cabe sealar que las protenas son molculas quirales inherentemente y esto tiene consecuencias importantes para las interacciones que hacen. Muchas enzimas, por ejemplo, son estereoselectiva con respecto a sus sustratos debido a la asimetra inherente en sus sitios activos. Por ejemplo, cuando una proteasa de VIH artificial se sintetiza a partir de D en lugar de los aminocidos L, el resultado fue una proteasa activa que era especfica para un sustrato del enantimero opuesto ( 53 ). Las consecuencias del tomo -carbono asimtrico se puede ver en la mayora, si no todos los niveles de la estructura de la protena. No es por casualidad que los diestros -hlice est energticamente favorecida sobre su compaero zurdo, ni que los -captulos son zurdos (la mano derecha cuando slo cada segundo residuo es visto) o sus hojas zurdos ( cuando se ve perpendicular a las hebras). Adems, el embalaje de -hlices diestros utilizando la cadena de interdigitacin lado conduce a el ngulo de embalaje comn de 20 , lo que significa que cuando estas hlices bobina alrededor de la otra para formar bobinas en espiral (como se ve en la queratina, miosina y cremalleras de leucina, por ejemplo, ), inevitablemente, dichas estructuras se zurdos. En el siguiente nivel, las conexiones diestros que se encuentran en unidades x junto con el giro

en -captulos s significa que todos () 8 barriles de barriles (TIM) tienen la misma quiralidad. En efecto, el barril siempre `enrollar 'de la misma manera debido a la combinacin de la hebra de giro y de corte de hoja (el desplazamiento de una cadena con respecto a sus vecinos que se traduce en la inclinacin de los hilos con respecto al eje del can) ( 1 , 40 ).

3.4 Estructura cuaternaria


Algunas protenas (una minora) se componen slo de una nica cadena polipeptdica. El resto son homo o hetero-oligmeros o asambleas o polmeros macromoleculares. En una reciente evaluacin de las protenas codificadas por el E. genoma coli, se espera que slo un 20% a ser monomricos ( 54 ). Los dmeros fueron los ms comunes, lo que representa casi el 40% de todas las protenas, seguido de tetrmeros (21%). Cuando dos subunidades (cadenas polipeptdicas) interactan para formar una interfaz, existen dos posibilidades; la interfaz puede ser islogos o heterloga. En el primer caso, la asociacin conduce a la formacin de un dmero simtrico que posee un eje de dos veces (DIAD), en el que si una regin A en la primera subunidad interacta con una regin B en el segundo, a continuacin, la regin A de la segunda necesariamente interactuar con la regin B en la primera ( 1 ). En el caso de las interacciones heterlogas este no es el caso. Pueden ser simtrica, lo que lleva a las estructuras en forma de anillo que poseen ejes de simetra de orden superior (> 2) o asimtrica. Casi todas las estructuras oligomricas poseen simetra interna. Dado que las propias subunidades individuales son asimtricos y quirales (porque estn hechos de Laminocidos), esto significa que la simetra slo puede surgir por la asociacin de subunidades alrededor de ejes de rotacin pura. En principio, stos pueden ser de cualquier orden y muchos ejemplos incluyendo 2 veces, 3 veces, 4 veces, 5 veces, 6 veces, 7 veces, 9 veces y 11 veces los ejes (y tal vez otros) se han observado en la naturaleza. Tres acuerdos fundamentalmente diferentes son posibles. . Estructuras cclicas (construido de un anillo de subunidades que emplean un tipo de interfaz heterloga conducen generalmente a estructuras similares a poros, particularmente cuando el nmero de subunidades se hace grande Ejemplos incluyen la neuraminidasa (4 veces) y el complejo captador de luz (11 veces). Dihedral estructuras, adems de poseer un eje principio, tambin tienen una serie de ejes perpendiculares de 2 veces. Por ejemplo, la mayora de los tetrmeros se construyen utilizando 222 simetra (tres ejes perpendiculares entre s de 2 veces) en lugar de un eje 4 veces sola , como se encuentra en la neuraminidasa. simetra diedro da ms opciones para crear diferentes interfaces entre subunidades, y esta riqueza a menudo se toma ventaja de las enzimas reguladas alostricamente. Junto con un eje principal de orden superior, la simetra diedro se puede utilizar para la creacin de protenas con cavidades internas Ejemplos accesibles a travs de canales. incluyen la chaperona GroEL ( 55 ) y el proteasoma ( 56 ), ambos de los cuales tienen ejes 7-plegado. La tercera opcin es el uso de la simetra icosadrica o cbica en la que una serie de tres ejes de los pliegues estn acompaadas por no perpendicular de dos ejes de plegado, cuatro veces o cinco veces (o combinaciones de stos). Las estructuras resultantes son generalmente aproximadamente esfrica y se utilizan como molculas de almacenamiento

(tales como la ferritina, por ejemplo) o como cpsides virales. Adems, la simetra de translacin se puede aadir a los ejes de rotacin para producir simetra helicoidal como se ve en microtbulos, virus del mosaico del tabaco y otra estructura filamentosa. Cules son las ventajas de la construccin de protenas oligomricas y por qu son tan comunes? Existen varias respuestas. A veces es slo una cuestin de ser grande, como por ejemplo en el caso de las protenas plasmticas que, con el fin de evitar la ultrafiltracin por los riones, debe ser mayor que 60 kDa. Ser grande puede a menudo tambin aumentar la estabilidad y reducir la relacin de rea superficial / volumen, con lo que la protena menos susceptible a la proteolisis. Ser oligomrica tambin da lugar a la posibilidad de cooperatividad en enzimas y molculas de transporte, adems de ser una forma eficiente de la construccin de grandes estructuras con material gentico limitado, tales como en los virus esfricos, por ejemplo. El potencial de tener mltiples sitios de unin idnticos dentro de una sola molcula (como en las inmunoglobulinas, por ejemplo) introduce la posibilidad de una actividad de reticulacin y como se menciona anteriormente muchas estructuras oligomricas sirven para generar cavidades con una funcin biolgica especfica.

3.5 Un comentario final sobre la estructura de la protena


La razn de inters en la estructura tridimensional completa de una protena es generalmente de entender su actividad biolgica o para interferir con l, como por ejemplo en el caso del diseo de frmacos (ver ms abajo). En ambos casos una descripcin meramente topolgico es claramente insuficiente ya que la actividad biolgica depende de detalle atmico y, a menudo aparentemente modificaciones sutiles a una estructura pueden afectar dramticamente su actividad. Aqu no tenemos espacio para una descripcin completa de incluso un nmero limitado de familias de protenas. Sin embargo, en la siguiente seccin se debe hace evidente que el conocimiento de la estructura atmica de alta resolucin de una protena diana es un requisito previo esencial para el diseo de frmacos basado en la estructura.

4. El uso de estructuras de protenas en Descubrimiento Inhibidor y Diseo


Antes del desarrollo de tcnicas para la obtencin de la estructura 3D de protenas, las drogas fueron descubiertas por la modificacin sistemtica de compuestos con actividades biolgicas conocidas que fueron descubiertos por casualidad o por seleccin aleatoria, en base a prueba y error. Era un enfoque consume tiempo y dinero, e incluso cuando se emplean mtodos de la qumica medicinal todo para reducir la cantidad de compuestos a ser sintetizado y probado, estos enfoques requiere procedimientos exhaustivos de sntesis y evaluacin. Qumicos medicinales tradicionales centran su atencin en la comprensin de las relaciones entre las estructuras y actividades de los compuestos activos conocidos y proponer modificaciones que podran mejorar algunas propiedades biolgicas de la molcula ( 57 , 58 ).

Los qumicos medicinales tomaron ventaja inmediata de la rpida evolucin de la informtica y la computacin grfica, en particular, y desarrollaron tcnicas para visualizar, manipular y superponer estructuras 3D de compuestos activos con el fin de obtener rpidamente informacin acerca de la estructura y actividades de relacin de los compuestos activos conocidos. Distinto ordenador Estructura-Actividades Relacin aproximaciones cuantitativas (QSAR) como HQSAR, CoMFA y mtodos QSAR 3D relacionados con la base se convirti en popular entre los qumicos medicinales. Al mismo tiempo, los avances significativos en la biologa molecular y estructural y en la actualidad se hicieron decenas de miles de estructuras 3D de protenas que estn disponibles. Esto representa una enorme cantidad de informacin estructural de los receptores medicinalmente pertinentes, por otra parte las estructuras de complejos de protenas con pequeos ligandos son tambin una valiosa fuente de informacin sobre las interacciones favorables que estabilizan la asociacin del ligando con el bolsillo de unin de la protena ( 59 ). Recientemente, potentes computadoras de escritorio se han convertido en asequible, junto con una diversidad cada vez mayor de software libre para fines acadmicos, as como una notable mejora en la transferencia de datos a travs del acceso a Internet. Por lo tanto, ahora es posible trabajar en el pas en estaciones de trabajo de gran alcance, en estrecho contacto con los grupos de investigacin acadmica de todo el mundo, y aprovechar al mximo el software hasta al da de visualizacin de molculas, realizando el modelado molecular y hasta procesar datos cristalogrficos y resolver estructuras. A pesar de este progreso indiscutible, basado en la estructura de diseo ligando todava se enfrenta a varios retos importantes y limitaciones, como la falta de disponibilidad de las estructuras en 3D para muchos receptores importantes, receptores particularmente unidas a la membrana, los enfoques computacionales adecuados para hacer frente a inducido en forma de ligando interacciones o molculas de agua en el sitio de unin y selectividad entre diferentes isoformas del mismo receptor o enzima-receptor. Por otra parte, la colaboracin con los qumicos sintticos y los bilogos experimentales probablemente continuar siendo un factor determinante de xito ( 59 ). Las drogas son ligandos que no slo caben en el bolsillo de unin de la protena diana, pero tambin se absorben, transportan, distribuyen al compartimiento de cuerpo derecho, as como idealmente ser estable a la metabolizacin, no txico, libre de efectos secundarios y qumicamente estables en la formulacin. Por lo tanto, es claro que la etapa de diseo ligando del proceso de descubrimiento de frmacos es slo uno de los pasos iniciales en un esfuerzo multidisciplinario que requiere generalmente varias rondas de refinamiento entre la identificacin de un principio activo y la seleccin de un frmaco candidato viable. Diseo basado estructural puede ayudar a este proceso continua al identificar oportunidades para las modificaciones estructurales que no interfieren con la unin, pero puede mejorar la afinidad y selectividad, y que puede alterar favorablemente a las propiedades de la molcula, tales como la solubilidad, hidrofobicidad y estado de ionizacin ( 59 ) . Encontrar un compuesto de plomo, la optimizacin de sus propiedades y convertirla en un frmaco aprobado necesita una enorme cantidad de tiempo y dinero. Es una bsqueda que

requiere esfuerzo anintense y de cooperacin entre los equipos de descubrimiento multidisciplinarios ( 60 ). En algunos casos, el anlisis cuidadoso de una estructura de la protena-ligando puede ser suficiente para sugerir modificaciones en el ligando para mejorar la afinidad. Ms estructuras de la misma protena con diferentes ligandos pueden hacer que sea ms fcil. Herramientas de modelado molecular pueden modelar la estructura de una protena sobre la base de una estructura homloga conocida previamente, por lo que es posible usar la informacin estructural para el diseo de ligandos para las protenas para las que se conoce ninguna estructura. El cribado virtual puede proporcionar estructuras de ligando completamente diferentes de los ligandos ya conocidos. Modelos QSAR pueden ayudar al diseo de modificaciones para mejorar una propiedad biolgica de un ligando y pueden predecir las actividades con un error razonable. Procedimientos de acoplamiento se pueden utilizar para modelar modos de unin y estimar las energas de enlace.

4.1 Aplicaciones de estructuras de protenas


La prediccin de los modos de unin y las afinidades de diferentes compuestos a medida que interactan con los sitios de unin a protenas es el objetivo principal de la estructura basada en el diseo de frmacos. Computacional enfoques a este problema se llaman acoplamiento. Figura 10 muestra esquemticamente un enfoque para este problema tal como se aplica en el banquillo del programa ( 61 ). Figura 10 Representacin esquemtica del algoritmo de bsqueda de MUELLE. Las esferas se calculan sobre la superficie del sitio del receptor y despus se filtr para mantener slo la esfera ms grande asociado con cada tomo de la superficie. tomos de ligando se encajan en el sitio, haciendo coincidir (ms. ..) La caracterstica clave de un buen programa de acoplamiento es la capacidad para reproducir los modos de unin de ligandos experimentales ( 62 ). Un gran nmero de programas se han escrito para abordar esta rea. En general, los programas operan de la siguiente manera: Un gran nmero de conformaciones se generan para la molcula pequea, ya sea antes del acoplamiento o durante la rutina de acoplamiento. Cada conformacin se coloca en el sitio activo en una variedad de orientaciones, la combinacin de la conformacin y la orientacin que se conoce como una "pose". Este procedimiento de muestreo se basa por lo general los algoritmos genticos, la simulacin Monte Carlo, recocido simulado o geometra de distancia ( 61 , 62 ). Muchas actitudes son seleccionados y clasificados por una funcin de puntuacin, con el fin de determinar el mejor en general plantean. En general, la flexibilidad potencial dentro de tanto el ligando y los residuos del sitio de unin representa un desafo computacional significativa. Para hacer que el problema de acoplamiento tratable, la mayora de los programas aborden adecuadamente la cuestin de la flexibilidad del ligando, pero se supone que el sitio de unin es rgida. Adems, algunos

programas se ocupan parcialmente flexibilidad protena. Las funciones de puntuacin desarrollado hasta la fecha suelen ser de un campo clsico de la mecnica molecular fuerza, una funcin emprica que describe los trminos tales como enlaces de hidrgeno y lipofilia, o un posible "basada en el conocimiento", derivado del anlisis de complejos protenaligando ( 62 , 63 ) . Otra caracterstica importante de un buen programa de acoplamiento es la capacidad de sus funciones de puntuacin para anotar y clasificar mltiples ligandos contra un solo objetivo en funcin de sus afinidades de unin experimentales ( 62 ). Esta tarea es ms problemtica ( 64 ), las funciones de puntuacin utilizados en los programas de conexin deben contener muchas aproximaciones, ya que tienen que ser lo suficientemente rpido para evaluar un nmero extremadamente grande de poses posible. Por ejemplo, no se toman en cuenta explcitamente por lo general de los cambios entrpicos debido al desplazamiento de las aguas desde el sitio activo o de la reduccin en los grados de libertad en el ligando. Por lo general, una funcin de la puntuacin que se puede seleccionar la correcta postura durante un ligando no se ubicar necesariamente una serie de ligandos potenciales en el orden correcto ( 63 ). Un uso importante de los programas de conexin para la protena-ligando es cribado virtual, en la que grandes bibliotecas de compuestos se acoplan en un sitio de unin a la diana y anot. Para este propsito, los atraques deben ser an ms rpido. La aceleracin de un protocolo de acoplamiento se hace a menudo a costa de un menor nmero de modos de toma de muestras de unin, y, como resultado, reduce las tasas de xito. Por lo tanto, es importante que los parmetros de bsqueda se eligen que dan velocidades de conexin til para aplicaciones de cribado virtual, con una prdida aceptable en la precisin de acoplamiento ( 63 ). Para superar el "problema" de rango investigadores han empleado diferentes mtodos que van desde la fuerza bruta, lo que significa el uso de clusters de ordenadores muy caros de hacer todo el trabajo pesado computacional, a la utilizacin de mtodos ms elegantes como marcador consenso. Este mtodo consiste en utilizar un programa de acoplamiento para realizar la bsqueda conformacional y clasificar los compuestos, y emplear funciones de puntuacin otras herramientas de conexin "para volver a evaluar los primeros resultados. Slo la parte superior anot compuestos comunes a cada funcin de puntuacin sern identificados como candidatos para bioensayo. En comparacin con los procedimientos individuales de puntuacin, se demostr que los falsos positivos en la deteccin biblioteca virtual se reducen en gran medida y las tasas de xito han mejorado. Hay muchas maneras diferentes de puntuacin consenso rendimiento ( 64 ). Algunas herramientas de conexin tambin tienen otra caracterstica til, la estimacin de la energa de enlace. Sin embargo, esta tcnica sigue exigiendo una alta potencia de clculo y la mayora de los proyectos no se lo puede permitir. Por lo general, slo los mejores ligandos se encuentran en el cribado virtual se someten a este procedimiento. Tenga en cuenta que a pesar de que estos clculos no son muy precisos, si se puede dar la clasificacin correcta de molculas candidatas, proporcionar informacin valiosa. 4.1.1 Primeros pasos con Virtual

Resultados de los exmenes virtuales son altamente dependientes de la base de datos y la preparacin de destino. Las bases de datos deben ser atentos, y eso significa un esfuerzo considerable se debe poner en el filtrado de molculas con propiedades fsicas indeseables y funcionalidades qumicas como de alto peso molecular, los grupos reactivos, demasiados bonos rotativos y lipofilia no adecuado ( 65 ). Estados tautomricos, ionizacin y cargos deben ser tambin observados, as como los enantimeros posibles que surgen de los centros quirales. Por ltimo, hay que decidir si se quiere una base de datos de compuestos similares a las drogas o el plomo-como. Antes de preparar el receptor, es necesario comprobar si es adecuada para un procedimiento de cribado virtual. Es comn disponer de ms de una estructura de la misma protena en el complejo con diferentes ligandos o sin cualquier ligando unido. Es hasta el qumico mdico a elegir entre estas diferentes opciones. Como pauta, la resolucin debe ser tan alta como sea posible. Otro paso importante es leer el archivo pdb del receptor. Informacin til se puede encontrar acerca de los parmetros cristalogrficos empleados, toma nota de que el autor acerca de los residuos de baja densidad de electrones e incluso mutaciones en la protena. Tambin los programas tales como Procheck y Whatcheck se pueden utilizar para analizar la estereoqumica y el entorno qumico de cada residuo de la protena. Despus de la eleccin de la estructura del receptor ms adecuado, por lo general se requiere la adicin de tomos de hidrgeno, seguido de minimizacin de la energa potencial para evitar choques estricos. Algunos de los cambios deben hacerse con cuidado en el sitio de unin, como asignar el estado de protonacin derecho de residuos ionizables, la comprobacin de los estados tautomricas de las histidinas, la posible voltea de las glutaminas y asparagines y las orientaciones de los tomos de hidrgeno de los grupos hidroxilo en la residuos de serina y treonina ( 65 ). Recuerde que los procedimientos de investigacin virtuales suelen tardar das para terminar y si se comete un error en la fase de preparacin, toda la obra puede verse comprometida. Tambin uno de los procedimientos ms importantes es la inspeccin visual de los mejores compuestos clasificados en el contexto del sitio de unin. Serendipity, el principio de que "azar slo favorece a la mente preparada", en palabras de Louis Pasteur, juega un papel importante en todo el proceso de cribado virtual, especialmente durante la etapa de inspeccin visual. 4.1.2 Estructura de las protenas y 3D-QSAR Estructuras de protenas se pueden utilizar en muchas maneras de mejorar los resultados de las tcnicas de relacin estructura-actividad cuantitativas (QSAR). Dos de las tcnicas ms comunes son el anlisis comparativo de campo Molecular (CoMFA) y el comparativo Similitud Molecular Indices Anlisis (CoMSIA). Ambos mtodos asumir que los ligandos tienen un modo de unin comn, sus estructuras 3D se modelan y superponen y anlisis Partial Least Square (PLS) se realiza para tratar de encontrar una correlacin entre las actividades biolgicas de los compuestos y de sus estructuras 3D ( 66 ). Estos mtodos se basan en gran medida de una superposicin correcta de las estructuras de ligandos y, si se conoce la estructura de la protena diana, es un enfoque vlido para acoplar

los ligandos en el sitio de presagiar protena y utilizar el resultado como una "alineacin estructural". La informacin estructural de protenas tambin se puede utilizar para ayudar a la interpretacin de los resultados. Otro mtodo QSAR, Energa de enlace comparativo (COMBINA) requiere al menos una estructura de un complejo ligando-protena y el enlace de datos experimentales para el conjunto de entrenamiento de los complejos ligando-protena. El conjunto de entrenamiento se utiliza para el desarrollo del modelo solamente y no para la evaluacin del modelo, que debe ser realizada utilizando un conjunto independiente de datos. La estructura del complejo ligando-protena conocida se utiliza para modelar todos los restantes complejos de el conjunto de entrenamiento (en caso de no hay datos estructurales disponibles bPLSeing), estos complejos se superponen y la energa se reduce al mnimo. La energa de interaccin entre el ligando y el receptor en cada complejo se calcula y se descompone sobre la base de las propiedades fsicas y la ubicacin en la molcula. Anlisis PLS se utiliza entonces para construir un modelo de correlacin de los datos de unin biolgicos con la suma de los componentes ponderados, seleccionados de la energa de interaccin ( 66 ).

4.2 Estructura basada en el diseo de medicamentos contra enfermedades tropicales


Las enfermedades tropicales son responsables de algunos de los problemas de salud en todo el mundo ms severas. Cientos de millones de personas se ven afectadas por estas enfermedades ( 67 - 71 ), matando a millones de personas al ao. Las diferencias estructurales entre el husped y el parsito puede ser explotado con el objetivo de desarrollar un frmaco selectivo contra los parsitos, sin causar daos al host. Un ejemplo de este enfoque es la timidilato sintasa-reductasa dihidrofolato (DHFR-TS) enzima ( . Fig. 11 ). Aunque el husped humano presenta esta enzima en su va bioqumica, la enzima humana difiere estructuralmente de la enzima del parsito, y estas diferencias puede ser explotado con el fin de disear inhibidores selectivos de la enzima homloga contra los parsitos. La enzima bifuncional DHFR-TS de parsitos tales como Toxoplasma gondii, Cryptosporidium parvum y cuatro especies diferentes de Plasmodium juega un papel crucial en la biosntesis de pirimidina y se ha utilizado como diana para la estructura basada en el diseo de frmacos. Figura 11 Acoplamiento de la WR99210 ligando sinttico en el sitio de unin de tipo salvaje Plasmodium falciparum DHFR (PDB ID: 1j3i). El programa GOLD (rojo) fue capaz de reproducir la posicin cristalogrfica del ligando (amarillo) (62). La estructura de la DHFR-TS de Leishmania major, y la reciente determinacin de las estructuras de Cryptosporidium hominis y P. falciparum ( 67 ) ahora puede arrojar algo de luz sobre el modo de unin de tipo salvaje DHFR-TS y los mutantes resistentes a los inhibidores actuales, como el metotrexato y dapsona (Lapdap ). Estos datos estructurales

ofrecen la posibilidad de desarrollar nuevos inhibidores con mayor potencia y selectividad, y estos datos seran tiles para DHFRs de modelado molecular de otras especies de parsitos para los que las estructuras no estn disponibles todava ( 72 ). Por otra parte, la resistencia generalizada a los medicamentos antipaldicos disponibles en la actualidad ha llevado a un aumento en la bsqueda de nuevos objetivos, algunos de ellos ya en las etapas de validacin ( 72 ). Inhibidores de la DHFR son en gran medida ineficaces para el control de infecciones trypanosomatid, en parte debido a la presencia de pteridina reductasa (PTR1), que est implicado en el metabolismo del folato / pterina. Las estructuras cristalinas de la PTR1 de Leishmania tarentolae y Trypanosoma cruzi, y una serie de anlisis cristalogrficos de la enzima de la Leishmania major en binario y complejos ternarios identifican interacciones importantes que pueden ser explotadas en un desarrollo basado en la estructura de inhibidores de la enzima nuevos con valor teraputico potencial ( 73 ). Adems, se estn estudiando otros mtodos para abordar el desarrollo de nuevos frmacos contra el tripanosomatides. La estructura cristalina y el mecanismo de trans-sialidasa, una enzima que parece ser crtica para T. supervivencia cruzi y la capacidad de invasin de las clulas ya est disponible. La estructura proporciona el primer paso para el diseo basado en la estructura de los nuevos inhibidores con potenciales aplicaciones teraputicas ( 74 ). Adems, la estructura de resolucin 2,0 A de la UDP-galactosa-4 'epimerasa de la parsito protozoario Trypanosoma Bruce, el agente causante de la enfermedad del sueo africana en los seres humanos, y la prdida de nagana la enfermedad en el ganado bovino, se determin recientemente. Una comparacin estructural con la enzima humana identific una diferencia potencialmente importante en la hendidura de unin al sustrato que podran ayudar a un enfoque basado en la estructura para el desarrollo de inhibidores especficos Gale Tb ( 68 ). Otras enzimas que han sido consideradas como buenas dianas para el desarrollo de frmacos antiparasitarios son las glutatin S-transferasa, una familia de enzimas de desintoxicacin que catalizan la conjugacin del glutatin con diversos electrfilos endgenos y xenobiticos. Los estudios han identificado antiesquistosmico ( 75 ), contra la malaria y antifilrico ( 69 ) la actividad de los compuestos conocidos por su actividad inhibidora de la GST ( 70 ). Las estructuras cristalinas de la glutatin S-transferasa de la filaria Onchocerca volvulus, responsable de la oncocercosis, enfermedad debilitante, se obtuvieron recientemente en alta resolucin (1.5 y 1.8a). El anlisis estructural de la enzima muestra que es una diana de frmaco adecuada para la intervencin en las filariasis, con la ventaja potencial de no comprometer el husped humano ( 69 ). Se estn haciendo todos los esfuerzos basados en la estructura de cambiar el panorama de las enfermedades tropicales. Un ejemplo es el estudio reciente que utiliza estructuras disponibles y secuencias de genes de la enzima glyoxalase I para crear un modelo de la Leishmania donovani enzima ( 76 ). Este trabajo sugiere que las diferencias entre los

humanos y la L. estructuras donovani podran ser explotadas para frmacos basado en estructuras de diseo de inhibidores selectivos contra la enzima del parsito. Adems, el anlisis estructural de la Mycobacterium tuberculosis de tipo II deshidroquinasa sugiri modificaciones sobre inhibidores conocidos que condujeron a la sntesis de un nuevo inhibidor de ms de 180 veces ms potentes que el inhibidor de prototipo. Estudios de acoplamiento indicaron interacciones de unin electrostticas clave entre el inhibidor y la enzima. Se estn realizando estudios estructurales de los complejos de enzima-inhibidor y deben ser considerados para el diseo de la prxima generacin de inhibidores ( 71 ).

5. Seccin Prctica: Caracterizacin computacional de un producto gnico de una secuencia gentica parcial Slo
El objetivo de este ejercicio es para llevar el lector o estudiante en contacto con libremente disponibles herramientas bioinformticas en lnea utilizados para caracterizar computacionalmente una protena completa a partir de slo una secuencia de ADN parcial de su gen correspondiente. A travs de un conjunto de preguntas de orientacin, con sugerencias, este ejercicio implicar buscar el GenBank para toda la secuencia del gen, traduccin a la secuencia de la protena correspondiente, y la bsqueda de la estructura de la protena (en este caso o bien se puede suponer que el estudiante ya est familiarizado con las salidas de los programas BLAST distintos o que se llevar a cabo el aprendizaje a travs del ejercicio). Si no hay una estructura est disponible, entonces el estudiante debe buscar secuencias similares con un 30% o ms de identidad que han conocido las estructuras 3D. Dependiendo de la duracin del curso, el estudiante puede proceder mediante la determinacin de la estructura de las protenas por homologa de modelado o simplemente mediante el uso de la estructura 3D conocida para inferir similitud estructural y la funcin de su / su protena. Se alienta al estudiante para descargar cualquier archivo de estructura 3D de protenas conocido a su / su ordenador y visualizarlo en un visor macromolcula biolgica instalado localmente como SwissPDBViewer ( 77 ) o la deteccin de movimiento ( 78 ). Esta ser una oportunidad nica para que el estudiante familiarizarse con la arquitectura de las protenas. El mismo experimento se puede cambiar fcilmente para investigar un genoma en su conjunto, as. El conjunto de preguntas puede ser utilizado para guiar al estudiante a travs de la writring de un artculo que describe el gen y su producto. Este ejercicio debe ser realizado por un profesor o tutor en la bioinformtica.

5.1 Biologa Molecular y Experimental Laboratorio de Genmica


En un laboratorio de biologa molecular o la genmica se identific un fragmento de ADN, supuestamente correspondiente a un gen,. Sus primeros 30 pares de bases se han secuenciado y se determin que -3 5'-TGACACAACACAAGGACGCACATGACAGGA. Conteste las siguientes preguntas a travs de experimentos Bioinformtica. 5.1.1 Caracterizacin gentica

1 - Puede el gen putativo ser completamente e inequvocamente caracterizado a partir de la secuencia de ADN parcial dado anteriormente? Cmo? S. El gen puede ser completa y sin ambigedad caracteriza, pero la solucin requerir un anlisis ms cuidadoso de lo que lo hizo un par de aos atrs. La razn es simple: haba mucho menos secuencias que los que hay ahora. Solucin: Puesto que tenemos una secuencia de nucletidos que nuestro conjunto de datos inicial, tenemos que ir a la pgina de BLAST NCBI, seleccionar el programa BLAST de nucletidos y buscar en la base de datos de nucletidos utilizando una consulta de nucletidos. La pgina se ver as:

Esta interfaz BLASTN es fcil de entender. Se divide en cuatro secciones principales.

1. - El primero permite al usuario para pegar la secuencia de consulta para el anlisis. Nuestra secuencia de consulta que contiene 30 nucletidos, se destacan en el rectngulo de color rojo, se pega en el cuadro de bsqueda. 2. - La segunda seccin permite la eleccin de una base de datos que se debe buscar y gama secuencia opcional coordina a la bsqueda. Vamos a buscar en la base de datos no redundante (nr) de nucletidos (nt) en este ejercicio. Tenga en cuenta que esto ya no es la opcin por defecto. Es por eso que se resalta en amarillo. 3. - La tercera seccin ofrece alternativas de optimizacin a la bsqueda. Vamos a utilizar los parmetros y ajustes estndar para nuestra bsqueda. Vamos a buscar secuencias muy similares con bomba de barrido. 4. - En esta seccin se muestra un resumen de nuestras funciones de bsqueda que se han definido en los apartados anteriores. Ahora vamos a marcar la opcin de mostrar los resultados en una nueva ventana. Esta opcin es muy til, ya que nos permite bsquedas BLAST volver a correr con diferentes secuencias y / o parmetros, manteniendo los resultados anteriores. Ahora estamos listos para realizar la bsqueda, haga clic en el icono de BLAST. Despus de unos segundos la pgina de resultados aparecer en una nueva ventana. Si se asume que est familiarizado con una explosin de salida, slo la parte de la lista de salida de accesos y las alineaciones se ilustra aqu. Lista de salida de resultados:

Usted puede notar que slo los primeros 11 hits presentan los valores de E muy bajas (por debajo de 10 -5), que son la mayora, posiblemente significativo. Si queremos ser ms estrictas, exigiendo una cobertura del 100% en la secuencia de alineacin, slo los primeros ocho hits son relevantes para nuestra bsqueda y la caracterizacin de nuestra secuencia. Los seis primeros xitos estn relacionados para completar las secuencias del genoma que lo hace ms difcil para nosotros identificamos nuestra secuencia diana. Esperamos que para encontrar el gen putativo directa o secuencias de ADN que contienen el gen putativo. Por lo tanto, las nicas opciones directas y fciles accesos que quedan son siete y ocho.

Este sencillo anlisis han demostrado que la secuencia de ADN parcial que estamos buscando para identificar ms probable es parte de un gen perteneciente a cualquiera de Mycobacterium tuberculosis o Mycobacterium bovis, o ambos. Cmo resolver esta posible ambigedad? Ahora tenemos que mirar cuidadosamente la secuencia de alineaciones que siguen la lista de xitos de estos dos xitos que hemos seleccionado. Los resultados son los siguientes:

Las estadsticas de alineacin es idntica para los dos hits. Para el xito cuyo nmero de acceso GenBank U02492.1 es, nuestra secuencia de consulta comienza exactamente en la primera posicin de la secuencia de coincidencias. Para el xito cuyo nmero de acceso de GenBank U41388.1 es el final 5 'de nuestra secuencia de consulta partidos residuo 904 en la secuencia de coincidencias. Si hace clic en los enlaces de nmeros de adhesin, se le redirige a la anotacin correspondiente de estas secuencias. Como se sugiere por la anotacin, la segunda es una secuencia mucho ms larga de nucletidos (1789 pb) que contiene no slo una, sino dos genes putativos, uno de ellos a partir de la base 904 que es similar a la encontrada en el primer golpe. Adems, el segundo golpe corresponde a los genes que son putativo, que es, sin confirmacin experimental. A partir de estos anlisis, ahora podemos pasar a la siguiente pregunta. 2 - La secuencia de ADN parcial anterior corresponde a un gen? Si es as, cul es su nmero de acceso GenBank? S. De acuerdo con los anlisis en 1, la secuencia de ADN parcial 30-nucletidos ms probable corresponde a un gen confirmado. Su nmero de acceso es el ms representado por U02492.1.

3 - Cul es el nombre gen? El nombre de un gen puede obtenerse a partir de la anotacin en la lista de resultados o mediante la bsqueda en la base de datos de nucletidos NCBI con el nmero de acceso de GenBank U02492.1. Otra forma es hacer clic en el enlace asociado con la entrada U02492.1 con el botn derecho del ratn y abrirlo en una nueva ventana. La parte superior de la pgina resultante ser de la siguiente manera:

Mirando cuidadosamente en este archivo sin GenBank podemos obtener toda la informacin acerca de la entrada de nucletidos U02492.1. Podemos ver claramente por todas partes, pero ms especficamente en la seccin de caractersticas que el nombre de genes es inh A. 4 - Cul es el tamao en pares de bases del gen? En la seccin de caractersticas, en la novena lnea, el gen de enlace muestra que el gen A inh comienza en la base 22 y termina en la base 831, totalizando as 810 pares de bases. 5 - Qu organismo (s) Tiene el gen pertenece?

Los anlisis mostraron que el gen se puede encontrar tanto en bacterias M. tuberculosis y M. bovis. 5.1.2 Gene del producto o la caracterizacin de protenas 6 - Cuntos aminocidos contiene el producto del gen? Una vez ms, mirando atentamente a la entrada U02492.1, podemos encontrar fcilmente la respuesta a esta pregunta, o por un simple clculo matemtico. Por ejemplo, si el gen contiene 810 pb, los ltimos tres bases componen el codn de parada, por lo que la regin de codificacin de la protena es de 807 pb de longitud. Despus de dividir este nmero por tres (el nmero de bases en un codn) obtenemos 269 aminocidos. Sin embargo, muy a menudo la anotacin de informacin no est disponible, y la nica informacin que tenemos es la secuencia de nucletidos. Por lo tanto, cmo podemos averiguar la secuencia de la protena y, por tanto, de su correspondiente nmero de aminocidos? Tenemos que traducir nuestro inh Una secuencia de genes en su protena correspondiente. Existen varias formas de realizar esta tarea. Vamos a utilizar una de ellas, una herramienta llamada Traducir ( http://us.expasy.org/tools/dna.html ), que se puede acceder a travs del sitio web ExPASy. Esta herramienta traduce una secuencia de ADN (ARN) en sus seis (tres en cada direccin) diferentes posibles marcos de lectura abiertos (ORFs). El traductor de la interfaz se parece a esto:

Nuestra secuencia de nucletidos, correspondiente a la entrada del GenBank U02492.1, fue copiado y pegado para el anlisis (rectngulo rojo). Despus de hacer clic en SECUENCIA TRADUCIR obtenemos:

Nuestra tarea ahora es averiguar cul de los seis cuadros corresponde a la inh Un producto gnico. En otras palabras, nos preguntamos cul es la ORF correcto. A menudo, la ORF correcta es el ms largo entre los seis posibles. Si seguimos a este supuesto (que no siempre es correcta!), La ms larga ORF entre los seis encontrado por la herramienta Traducir ORF 1 (5'-3'Frame 1) es la respuesta correcta. Al hacer clic sobre el enlace 5'-3'Frame 1 nos mostrar la traduccin conceptual en una letra de cdigo de aminocidos, de la siguiente manera:

Una vez identificado, el ORF puede ser traducido en su correspondiente protena o secuencia de aminocidos. En la mayora de las especies procariotas, un ORF comienza con un ATG que codifica para metionina (Met o M) y termina con un codn de parada (TAA, TAG o TGA). Ahora, al hacer clic en el primer residuo Met nos dar nuestra secuencia de la protena en un formato similar al GenBank flatfile, incluyendo el nmero de aminocidos. En este caso, 269 (ver figura siguiente).

Si seguimos y hacemos clic en el enlace de formato FASTA en la parte inferior de la pgina, obtenemos nuestra secuencia de la protena en el formato FASTA, listo para su uso por otros programas.

7 - Cul es el nombre del producto gnico y la posible funcin? Hasta ahora hemos trabajado con una secuencia de ADN. Ahora vamos a consultar las bases de datos NCBI protena con la secuencia de la protena obtenida anteriormente y

descubrir su posible funcin. Por esta puropose, vamos a volver a la pgina bsica BLAST en el NCBI ( http://www.ncbi.nlm.nih.gov/BLAST/ ), pero, en este momento, vamos a seleccionar el enlace "explosin de protenas", que nos llevar a la pgina BLASTp. La pgina BLASTp en NCBI se ver as:

Nuestra secuencia de consulta ya est insertado en el cuadro de bsqueda. BLASTp parmetros estndar para la comparacin de protena-protena estn siendo utilizados, tales como la sustitucin de la matriz BLOSUM62 y la base de datos nr. Para ms detalles, haga clic en el enlace de parmetros de algoritmo en la parte inferior de la pgina. La lista de salida de los resultados se muestra para los golpes de arriba 21:

La puntuacin de bits y los valores de E indican que nos encontramos nuestra protena. Por otra parte, las plazas de rojo a la derecha con la letra "S" dentro indicar que nuestras protenas ms probable es que tenga una estructura 3D (S), que le ayudar a responder las siguientes preguntas. Para aumentar nuestra confianza en que los resultados se corresponden con los homlogos de nuestra protena de la consulta, hay que comprobar si la alineacin abarca toda la secuencia de la protena consulta. La siguiente figura muestra la primera alineacin de la lista de resultados.

Inspeccin de la anotacin, podemos ver la nuestra consulta protena se llama enoil (protena transportadora de acilo o ACP) reductasa de Mycobacterium tuberculosis cepa H37Rv o InhA. Para obtener una respuesta ms completa que podemos acceder a la anotacin de protenas a travs de su nmero de acceso GenBank NP_21600, del mismo modo como lo hicimos con el nmero de genes. La seccin de caractersticas del archivo resultante es:

Desde M. la tuberculosis es una bacteria, esta enzima funciones ms probables en el citoplasma y est implicado en la biosntesis de los cidos miclicos, un componente esencial de su pared celular. Los enlaces azules de la fase de clasificacin pueden proporcionar al lector curioso con ms informacin acerca de esta enzima. 8 - Es este gen presente en los seres humanos? Qu consecuencias podra tener este hecho para una posible aplicacin del producto del gen para un descubrimiento de frmacos basado en la estructura? Para responder a esta pregunta, se puede ejecutar una bsqueda de similitud BLASTp de esta secuencia de la protena contra una base de datos de protenas RefSeq humanos. Adems, es necesario para leer sobre la biosntesis de cidos grasos en los seres humanos y bacterias. Una respuesta rpida es: no, no est presente en los seres humanos. Por lo tanto, en teora es un objetivo de frmaco ideal contra la tuberculosis. De hecho, el lector encontrar que esta enzima se ha demostrado ser un objetivo de buena fe de la isoniazida (INH).

9 - El producto del gen tienen una estructura 3D? Si es as, cul es su nmero de identificacin RCSB / AP? Describir la arquitectura de producto gnico. Como podemos ver en la salida BLASTp anteriormente, en la actualidad hay varias estructuras 3D de la enzima InhA, complejo enzima-NADH, complejos terciarios relacionados con los frmacos candidatos, y con el aducto NADH-INH que inhibe la enzima. Histricamente, la primera estructura InhA por determinar es que con PDB ID 1ENY (la 8 entrada en la lista negra de BLASTp), por lo que vamos a investigar este particular. Para ver la estructura 3D, ahora debera ir a la pgina de bsqueda PDB ( http://www.rcsb.org/pdb/home/home.do ). Para ello, introduzca el cdigo PDB de la protena (1ENY) en la barra de bsqueda en la parte superior de la pgina y haga clic en "Site Search". La pgina inicial del resultado se ver de la siguiente manera:

Se puede obtener toda la informacin disponible de la estructura 3D de esta enzima por navegar a travs de los enlaces o descargar el archivo PDB en un directorio local en nuestro ordenador y trabajar con nuestra modelizacin molecular preferido y el paquete de visualizacin. Por ejemplo, podemos ver en la seccin de clasificacin que esta enzima tiene una de 3 capas () arquitectura sandwich de acuerdo con la clasificacin CATH. Vamos a visualizar la siguiente. Algunos de los software de visualizacin se puede acceder directamente desde la pgina se ilustra arriba. Se pueden ubicar en la parte inferior de la seccin "Imgenes y Visualizacin". Otra alternativa es el sitio Primera Presentacin en Jmol ( http://molvis.sdsc.edu/fgij/index.htm ). Ir al sitio, introduzca 1ENY en la casilla en blanco y haga clic en el botn Enviar:

Como su nombre indica, podemos hacer muchas manipulaciones visualizacin sencillas que nos ayudarn a comprender la estructura de la molcula, las interacciones y la funcin.

Nota: el uso de software de visualizacin molecular, no importa lo simple que es, requiere al menos un conocimiento general del objeto a ser visualizado. Por lo tanto, para poder utilizar este software, el usuario debe comprender los principios bsicos de la estructura y funcin de protenas. Despus de enviar el cdigo PDB 1ENY, y esperando un poco para cargar la mquina JAVA, obtenemos:

Aqu la estructura InhA parece esttica, pero el sitio se mostrar inicialmente la imagen de rodar con el fin de presentar una mejor idea de su tridimensionalidad. Al pulsar el botn izquierdo del ratn y moviendo de izquierda a derecha y de arriba abajo permite al usuario mantener el control total de la rotacin de la molcula. Adems, al pulsar el botn izquierdo del ratn al mismo tiempo que las teclas de control o alt, y moviendo el ratn, va a cambiar el zoom. Es posible visualizar la molcula usando diferentes representaciones. Por encima, la enzima columna vertebral se representa como cintas donde hlices y las hebras de la hoja son de color rojo y amarillo, respectivamente. Vueltas y loops estn en gris. En este ngulo de vista, podemos ver hlices de la izquierda, una hoja central, y ms hlices de la derecha. Es por eso que esta enzima tiene una arquitectura de tipo sndwich de 3 capas-

. Las dos hlices capas son las "rebanadas de pan" y la lmina , relleno del sndwich! Tambin podemos observar el modelo que llena el espacio del NADH coenzima color de acuerdo a las normas de la CPK (nitrgeno en azul, el carbono en gris, el oxgeno en rojo, el fsforo en naranja). Esta coenzima es la clave para la funcin de InhA. En la figura, los puntos negros aadido flecha a la posicin en la que el sustrato cabr dentro de la enzima. Los frmacos que inhiben esta enzima es muy probable que se unen a esta regin. 10 - Si el producto gnico no tiene una estructura 3D, sera posible inferir la estructura de los homlogos ms cercanos con una estructura 3D conocida? Explica la respuesta en los detalles. Recuerde que toda la informacin que hemos reunido hasta ahora comenz a partir de una pequea secuencia de nucletidos. Algunos conocimientos bsicos de la biologa molecular y el uso de slo unos pocos de ms de 1.200 sitios web de bioinformtica estn disponibles en un servidor de edicin web de la revista Investigacin Nucleic Acids ( http://nar.oxfordjournals.org/content/vol35/suppl_2/index. shtml? etoc ). Afortunadamente, encontramos una estructura 3D de nuestra secuencia de nucletidos 30. Si nuestra protena no tiene una estructura, podramos utilizar el principio de modelado comparativo u homologa para construir una estructura de 3D para ello. Este principio establece que si una secuencia de la protena de estructura desconocida (protena diana) tiene una identidad de secuencia mayor que o igual a 30% con otra protena con estructura conocida (plantilla), en toda su longitud, a continuacin, la protena diana estructura 3D puede ser modelada basado en una o en una combinacin de varias molculas de molde ( 26 ). Esto es posible porque las protenas homlogas descienden de un ancestro comn y son propensos a presentar la misma estructura y funcin. Nota de precaucin: Esto es correcto en general, pero hay excepciones, sin embargo.

Das könnte Ihnen auch gefallen