Sie sind auf Seite 1von 5

> REPLACE THIS LINE WITH YOUR PAPER IDENTIFICATION NUMBER (DOUBLE-CLICK HERE TO EDIT) < 1

First A. Author, Fellow, IEEE, Second B. Author, and Third C. Author, Jr., Member, IEEE
Phyre2: protein modeling,
prediction and analysis

almacenan perfiles de protenas conocidas. As, se consigue un
AbstractEste artculo pretende explicar la herramienta alineamiento entre dos secuencias (una desconocida con otra
phyre2 usada para prediccin, modelado y anlisis de protenas, desconocida), que permitir construir un modelo de la
temas fundamentales para la bioinformtica. Se detallar todo su secuencia conocida basado en la secuencia desconocida.
funcionamiento utilizando una secuencia objetivo no comprobada Cuando la similitud entre la secuencia de inters es baja, las
experimentalmente y sujeta a ciertos fallos. Se mostrar cmo es
la pgina principal de Phyre2, especificando las actividades tcnicas computacionales utilizadas pueden mejorar la
necesarias para hacer un envo apropiado de la secuencia de deteccin de relaciones y el posterior alineamiento si se tiene
aminocidos, segn las necesidades del usuario. Tambin se informacin acerca de la estructura para aumentar el anlisis
comprender el formato de los resultados arrojados por Phyre2, de la secuencia.
comentando cada una de las partes de estos y explicando cmo se Phyre2 es una de las herramientas ampliamente usadas para la
deben leer los mismos. Se aclararn los tipos de herramientas, prediccin de estructuras de protenas. La herramienta fue
recursos y componentes de software implementados por el
servidor web Phyre2. Se presentarn los resultados y se
lanzada en enero del 2011 y actualmente procesa ms de 1000
mostrarn los detalles de la protena objetivo y las pautas usadas secuencias enviadas cada da, acumulando as un total de
para determinar la misma. Tambin, se comprobar que el alrededor de 50000 usuarios nicos cada ao.
servidor web de phyre2 es uno de los ms confiables, ms fciles
de usar y que muestra los resultados de una manera organizada
para los usuarios. II. MATERIALS AND METHODS AND
Index Terms Phyre2, alignment, modeling, prediction, A. About the web server
protein, amino acid sequence Phyre2 est alojado en la web. Al igual que otros servicios
que se usan con el mismo fin, su interfaz es muy sencilla de
usar. Para enviar una secuencia para un anlisis, es necesario
I. INTRODUCTION nicamente introducir la cadena de aminocidos y adjuntar un

L A cantidad de informacin que maneja la


bioinformtica es, con los aos, cada vez ms grande.
Desde que se determinaron las primeras secuencias, el
correo electrnico a donde se enviarn los resultados.
Posteriormente, se elige un modo de modelado; Phyre2 hace
uso un modo normal, por homologa, y otro intensivo usando
crecimiento en la cantidad de estas ha sido exponencial. Hoy ab initio.
en da, en las bases datos de protenas, como la El procesamiento de la informacin dura alrededor de
UniProtKB/TrEMBL, se pueden encontrar alrededor de cien media hora con el modo normal y una hora con el modo
millones de secuencias. Adems, en la Protein Data Base intensivo, aproximadamente. Cuando Phyre2 termina todos
(PDB), existen estructuras 3D de ms de cien mil de ellas. sus procesos, el usuario recibe un correo electrnico donde se
Todo esto pone un reto cada vez ms grande para los adjunta un link a la pgina oficial donde se estn alojados los
cientficos e investigadores que buscan hallar las propiedades resultados. En esta pgina se mostrar el resultado principal
y estructuras de secuencias de protenas de inters. Sin con su respectiva estructura, plantilla principal, informacin
embargo, los avances en tecnologa y computacin han sido de la plantilla, porcentaje de confianza y cobertura y ms
muy tiles en la prediccin, modelado y anlisis de dichas enlaces para poder observar detalladamente la protena en la
secuencias. PDB (Protein Data Bank). Adems, desde all se podr
Las tcnicas usadas computacionalmente funcionan en la descargar un archivo comprimido (.rar), con informacin de
mayora de casos puesto que las la estructura de las protenas otros resultados de protenas relevantes, con su respectivo
son altamente conservadas en la evolucin y, adems, se ha .pdb, .fasta, .scop e imgenes de sus estructuras en 3D. El
demostrado que existen relativamente pocas estructuras nicas contenido de la carpeta incluye tambin varios archivos PDF
(entre mil y diez mil). De esta manera, y gracias a estos en donde se puede visualizar los resultados de diferentes
principios, la prediccin de estructuras de protenas es mucho formas: Secondary structure and disorder prediction,
ms fcil si se comparan las secuencias objetivo con una Domain analysis, Detail template information.
enorme librera de secuencias conocidas. Se debe tener en cuenta que estos resultados se almacenarn
Por muchos aos, se han desarrollado cientos de en los servidores de Phyre2 durante 30 das nicamente.
herramientas y mtodos computacionales con el fin de facilitar Aunque es posible restaurar el tiempo de expiracin y obtener
la prediccin de estructuras proteicas. otro mes si el usuario necesita de ms tiempo.
Al da de hoy, el mtodo ms fiable sigue siendo el de
comparar la secuencia de inters con bases de datos que

> REPLACE THIS LINE WITH YOUR PAPER IDENTIFICATION NUMBER (DOUBLE-CLICK HERE TO EDIT) < 2

B. How Phyre2 works: structure and algorithms


Phyre2 realiza varios procesos internos que no da a conocer
al usuario, pues uno de los motivos de su creacin es ser una III. PRELIMINARY RESULTS
herramienta que devuelva resultados tiles a usuarios que no A. The target protein
sean muy expertos en el rea de la bioinformtica a travs de The Como se mencion previamente, para probar el
una interfaz grfica fcil de manejar. Para llevar a cabo estos funcionamiento del servidor web Phyre2 se us una secuencia
procesos, usa ciertas herramientas, recursos y componentes de de aminocidos de prueba. Aunque la finalidad era conocer a
software creados por el grupo desarrollador: servicios web, detalle los procesos, mtodos y algoritmos usados por la
bases de datos y algoritmos existentes escritos en diferentes herramienta, tambin se analizaron los resultados
lenguajes. Por supuesto estos mtodos varan dependiendo de proporcionados.
si se realiza el modelado por homologa o por ab initio.
Los pasos que se le muestra al usuario una vez que este
haya ingresado el query son Finding homologues with PSI-
Blast, Building hidden Markov model of sequence,
Checking for transmembrane helices, Constructing models,
Loop modelling and Generating results page. Estos
mensajes se usan para explicarle un poco al usuario las
funciones que internamente se estn ejecutando, pero como tal Fig. 1. Amino acid sequence tested
el alineamiento y modelado de una secuencia de protenas se
compone de cuatro niveles; estos niveles encierran el
funcionamiento del algoritmo que se usa para la prediccin. El Despus de pasar la secuencia a travs del servidor web
primer nivel es gathering homologous sequences, cuya usando el modo normal, se obtuvo el nombre de la protena
funcin es la de escanear la secuencia introducida por el objetivo con un 100% de confianza: Trichomonas vaginalis
usuario con la base de datos HHblits (Homology detection by lacatate dehydrogenase in complex with NADH.El porcentaje
iterative HMM-HMM comparison), la cual devuelve mltiples de confianza se debe a que, cubriendo un 99% de la secuencia,
alineamientos de secuencias que se se usan para predecir la se obtuvo un 100% de identidad.
estructura secundaria de la protena a travs de la herramienta En la PDB (Protein Data Bank), se puede revisar la
PSIPRED (PSI-blast based secondary structure PREDiction) informacin completa y detallada de la protena. All se
y, posteriormente, se resuelve el alineamiento y la estructura encontr que es una protena clasificada como
secundaria en un hidden Markov model (HMM), un modelo OXIDOREDUCTASE, perteneciente al organismo
estadstico que busca encontrar parmetros desconocidos a Trichomonas vaginalis. Adems, se pudo conocer que fue
partir de parmetros observables. depositada el 2014-07-29, por Steindel, P.A., Chen, E.H.,
En el nivel dos (fold library scanning) se comparan los Theobald, D.L, y liberada el 2015-08-12.
Al analizar el documento Detail template information, se
resultados devueltos por el nivel 1 con una librera de
pudo comprobar que, aunque hubo muchos resultados con un
protenas ya conocidas, es decir, comprobadas
100% de confianza, las dems protenas se alejaban de la
experimentalmente; las secuencias con mayor puntaje de
secuencia buscada; el segundo
alineamiento se usan para construir el backbone. El nivel 3 resultado que ms se acerc fue reconstructed ancestral
tiene una divisin, que se debe a si el anlisis que se quiere trichomonad malate dehydrogenase in2 complex with nadh,
hacer es normal o intensivo. El primero se evidencia el 3a: so4, and po4, cuyo porcentaje de identidad era del 60%.
Loop modeling, el que usa el modelado por homologa, en el Tambin, revisando los resultados Secondary structure and
modo normal; en segunda instancia se encuentra el multiple disorder prediction, se tiene que en general que: la secuencia
template modeling with Poing, que es el que se usa si el posee un 6% de desorden; las alpha helix representan un 42%
modelamiento es ab initio (desde cero), en el modo intensivo; del total; las beta strand un 21%; y el porcentaje restante
por eso se puede afirmar que este segundo proceso toma ms corresponde a los coil. Estos datos son establecidos basados en
tiempo. Como tal en el nivel 3 se agregan fragmentos la prediccin PSIPRED.
importantes de la protena; para esto es importante la
B. Conclusion
ubicacin, el ngulo del fragmento, la temperatura y la
cantidad. Por ltimo se encuentra el cuarto nivel, Side chain Aunque existen dos modos (normal e intensivo), por defecto
placement, en el que se ubican las cadenas laterales respecto a Phyre2 elige el normal, y recomienda que siempre se enve
sus probabilidades de posicin. Si el backbone suministrado es primero la secuencia de aminocidos usando este modo. Esto
es porque la mayora de veces es el modo ms fiable y rpido.
correcto hay un 80% de probabilidades de que los side chains
nicamente despus de analizar los resultados se debe
tambin lo sean.
considerar reenviar la secuencia en modo intensivo. En la
Phyre2 es una herramienta muy completa. Los mtodos pgina principal de resultados de Phyre2 se muestra a veces un
usados para el alineamiento, modelamiento y prediccin estn mensaje donde se advierte qu porcentaje de cobertura podra
divididos en varias etapas, lo que garantiza una fiabilidad incrementarse si se usa el modo intensivo.
superior respecto de muchos sus semejantes.
> REPLACE THIS LINE WITH YOUR PAPER IDENTIFICATION NUMBER (DOUBLE-CLICK HERE TO EDIT) < 3

Phyre2 est ubicado entre los motores de prediccin y 2nd ed. New York, NY, USA: McGraw-Hill, 1964, pp. 15-
64. [Online]. Available: http://www.bookref.com.
anlisis de secuencias ms utilizados actualmente, debido a su
[11] The Founders Constitution, Philip B. Kurland and Ralph
uso fcil, el tiempo de respuesta y su precisin, el cual es Lerner, eds., Chicago, IL, USA: Univ. Chicago Press, 1987.
superado solo por ciertos motores que usan mtodos y [Online]. Available: http://press-
algoritmos ms complejos. An as la diferencia de efectividad pubs.uchicago.edu/founders/
[12] The Terahertz Wave eBook. ZOmega Terahertz Corp., 2014.
no es abismal, es de un 2.5% y 5%. Por esto se concluye que
[Online]. Available: http://dl.z-
Phyre2 es una herramienta muy confiable y user-friendly. thz.com/eBook/zomega_ebook_pdf_1206_sr.pdf. Accessed
on: May 19, 2014.
[13] Philip B. Kurland and Ralph Lerner, eds., The Founders
Constitution. Chicago, IL, USA: Univ. of Chicago Press,
REFERENCES 1987, Accessed on: Feb. 28, 2010, [Online] Available:
http://press-pubs.uchicago.edu/founders/
Basic format for books:
J. K. Author, Title of chapter in the book, in Title of His Published
Basic format for journals (when available online):
J. K. Author, Name of paper, Abbrev. Title of Periodical, vol. x, no. x, pp.
Book, xth ed. City of Publisher, (only U.S. State), Country: Abbrev. of
xxx-xxx, Abbrev. Month, year. Accessed on: Month, Day, year, DOI:
Publisher, year, ch. x, sec. x, pp. xxxxxx.
10.1109.XXX.123456, [Online].
Examples: Examples:
[1] G. O. Young, Synthetic structure of industrial plastics, in
[14] J. S. Turner, New directions in communications, IEEE J.
Plastics, 2nd ed., vol. 3, J . Peters, E d . New
Sel. Areas Commun., vol. 13, no. 1, pp. 11-23, Jan. 1995.
Y o r k , NY, USA: McGraw-Hill, 1964, pp. 1564.
[15] W. P. Risk, G. S. Kino, and H. J. Shaw, Fiber-optic
[2] W.-K. Chen, Linear Networks and Systems. Belmont,
frequency shifter using a surface acoustic wave incident at
CA, USA: Wadsworth, 1993, pp. 123135.
an oblique angle, Opt. Lett., vol. 11, no. 2, pp. 115117,
Feb. 1986.
Basic format for periodicals: [16] P. Kopyt et al., Electric properties of graphene-based
J. K. Author, Name of paper, Abbrev. Title of Periodical, vol. x, no. x, pp. conductive layers from DC up to terahertz range, IEEE
xxx-xxx, Abbrev. Month, year, DOI. 10.1109.XXX.123456. THz Sci. Technol., to be published. DOI:
Examples: 10.1109/TTHZ.2016.2544142.
[3] J. U. Duncombe, Infrared navigationPart I: An
assessment of feasibility, IEEE Trans. Electron Devices, Basic format for papers presented at conferences (when
vol. ED-11, no. 1, pp. 3439, Jan. 1959, available online):
10.1109/TED.2016.2628402. J.K. Author. (year, month). Title. presented at abbrev. conference title.
[4] E. P. Wigner, Theory of traveling-wave optical laser, [Type of Medium]. Available: site/path/file
Phys. Rev.,
vol. 134, pp. A635A646, Dec. 1965.
Example:
[5] E. H. Miller, A note on reflector arrays, IEEE Trans. [17] PROCESS Corporation, Boston, MA, USA. Intranets:
Antennas Propagat., to be published. Internet technologies deployed behind the firewall for
corporate productivity. Presented at INET96 Annual
Meeting. [Online]. Available:
Basic format for reports: http://home.process.com/Intranets/wp2.htp
J. K. Author, Title of report, Abbrev. Name of Co., City of Co., Abbrev.
State, Country, Rep. xxx, year. Basic format for reports and handbooks (when available
Examples: online):
[6] E. E. Reber, R. L. Michell, and C. J. Carter, Oxygen J. K. Author. Title of report, Company. City, State, Country. Rep. no.,
absorption in the earths atmosphere, Aerospace Corp., Los (optional: vol./issue), Date. [Online] Available: site/path/file
Angeles, CA, USA, Tech. Rep. TR-0200 (4230-46)-3, Nov.
Examples:
1988.
[18] R. J. Hijmans and J. van Etten, Raster: Geographic
[7] J. H. Davis and J. R. Cogdell, Calibration program for the
analysis and modeling with raster data, R Package Version
16-foot antenna, Elect. Eng. Res. Lab., Univ. Texas,
2.0-12, Jan. 12, 2012. [Online]. Available: http://CRAN.R-
Austin, TX, USA, Tech. Memo. NGL-006-69-3, Nov. 15,
project.org/package=raster
1987.
[19] Teralyzer. Lytera UG, Kirchhain, Germany [Online].
Available:
Basic format for handbooks: http://www.lytera.de/Terahertz_THz_Spectroscopy.php?
Name of Manual/Handbook, x ed., Abbrev. Name of Co., City of Co., id=home, Accessed on: Jun. 5, 2014
Abbrev. State, Country, year, pp. xxx-xxx.
Examples: Basic format for computer programs and electronic documents
[8] Transmission Systems for Communications, 3rd (when available online):
ed., Western Electric Co., Winston-Salem, NC, USA, 1985, Legislative body. Number of Congress, Session. (year, month day). Number of
pp. 4460. bill or resolution, Title. [Type of medium]. Available: site/path/file
[9] Motorola Semiconductor Data Manual, Motorola NOTE: ISO recommends that capitalization follow the accepted practice
Semiconductor Products Inc., Phoenix, AZ, USA, 1989. for the language or script in which the information is given.
Example:
Basic format for books (when available online): [20] U.S. House. 102nd Congress, 1st Session. (1991, Jan. 11).
J. K. Author, Title of chapter in the book, in Title of Published Book, xth ed. H. Con. Res. 1, Sense of the Congress on Approval of
City of Publisher, State, Country: Abbrev. of Publisher, year, ch. x, sec. x, pp. Military Action. [Online]. Available: LEXIS Library:
xxxxxx. [Online]. Available: http://www.web.com GENFED File: BILLS
Examples:
[10] G. O. Young, Synthetic structure of industrial plastics, in
Plastics, vol. 3, Polymers of Hexadromicon, J. Peters, Ed.,
> REPLACE THIS LINE WITH YOUR PAPER IDENTIFICATION NUMBER (DOUBLE-CLICK HERE TO EDIT) < 4

Basic format for patents (when available online): [33] J. Zhang and N. Tansu, Optical gain and laser
Name of the invention, by inventors name. (year, month day). Patent Number characteristics of InGaN quantum wells on ternary InGaN
[Type of medium]. Available: site/path/file substrates, IEEE Photon. J., vol. 5, no. 2, Apr. 2013, Art.
no. 2600111
Example:
[21] Musical toothbrush with mirror, by L.M.R. Brooks. (1992,
May 19). Patent D 326 189 Example when using et al.:
[Online]. Available: NEXIS Library: LEXPAT File: DES [34] S. Azodolmolky et al., Experimental demonstration of an
impairment aware network planning and operation tool for
transparent/translucent optical networks, J. Lightw.
Basic format for conference proceedings (published): Technol., vol. 29, no. 4, pp. 439448, Sep. 2011.
J. K. Author, Title of paper, in Abbreviated Name of Conf., City of Conf.,
Abbrev. State (if given), Country, year, pp. xxxxxx.
Example:
[22] D. B. Payne and J. R. Stern, Wavelength-switched pas-
sively coupled single-mode optical network, in Proc. First A. Author (M76SM81F87) and
IOOC-ECOC, Boston, MA, USA, 1985, all authors may include biographies.
pp. 585590.
Biographies are often not included in
Example for papers presented at conferences (unpublished):
[23] D. Ebehard and E. Voges, Digital single sideband conference-related papers. This author
detection for interferometric sensors, presented at the 2nd became a Member (M) of IEEE in 1976, a
Int. Conf. Optical Fiber Sensors, Stuttgart, Germany, Jan. Senior Member (SM) in 1981, and a
2-5, 1984. Fellow (F) in 1987. The first paragraph
Basic format for patents: may contain a place and/or date of birth
J. K. Author, Title of patent, U.S. Patent x xxx xxx, Abbrev. Month, day, (list place, then date). Next, the authors
year. educational background is listed. The degrees should be listed
Example: with type of degree in what field, which institution, city, state,
[24] G. Brandli and M. Dick, Alternating current fed power and country, and year the degree was earned. The authors
supply, U.S. Patent 4 084 217, Nov. 4, 1978.
major field of study should be lower-cased.
The second paragraph uses the pronoun of the person (he or
Basic format for theses (M.S.) and dissertations (Ph.D.):
a) J. K. Author, Title of thesis, M.S. thesis, Abbrev. Dept., Abbrev. Univ.,
she) and not the authors last name. It lists military and work
City of Univ., Abbrev. State, year. experience, including summer and fellowship jobs. Job titles
b) J. K. Author, Title of dissertation, Ph.D. dissertation, Abbrev. Dept., are capitalized. The current job must have a location; previous
Abbrev. Univ., City of Univ., Abbrev. State, year. positions may be listed without one. Information concerning
Examples: previous publications may be included. Try not to list more
[25] J. O. Williams, Narrow-band analyzer, Ph.D. dissertation,
Dept. Elect. Eng., Harvard Univ., Cambridge, MA, USA,
than three books or published articles. The format for listing
1993. publishers of a book within the biography is: title of book
[26] N. Kawasaki, Parametric study of thermal and chemical (publisher name, year) similar to a reference. Current and
nonequilibrium nozzle flow, M.S. thesis, Dept. Electron. previous research interests end the paragraph.
Eng., Osaka Univ., Osaka, Japan, 1993.
The third paragraph begins with the authors title and last
name (e.g., Dr. Smith, Prof. Jones, Mr. Kajor, Ms. Hunter).
Basic format for the most common types of List any memberships in professional societies other than the
unpublished references: IEEE. Finally, list any awards and work for IEEE committees
a) J. K. Author, private communication, Abbrev. Month, year.
b) J. K. Author, Title of paper, unpublished. and publications. If a photograph is provided, it should be of
c) J. K. Author, Title of paper, to be published. good quality, and professional-looking. Following are two
Examples: examples of an authors biography.
[27] A. Harrison, private communication, May 1995.
[28] B. Smith, An approach to graphs of linear forms,
unpublished.
[29] A. Brahms, Representation error for real numbers in binary
computer arithmetic, IEEE Computer Group Repository,
Paper R-67-85.

Basic formats for standards: Second B. Author was born in


a) Title of Standard, Standard number, date. Greenwich Village, New York, NY,
b) Title of Standard, Standard number, Corporate author, location, date. USA in 1977. He received the B.S.
Examples: and M.S. degrees in aerospace
[30] IEEE Criteria for Class IE Electric Systems, IEEE engineering from the University
Standard 308, 1969.
[31] Letter Symbols for Quantities, ANSI Standard Y10.5- of Virginia, Charlottesville, in
1968. 2001 and the Ph.D. degree in
mechanical engineering from
Article number in reference examples: Drexel University, Philadelphia, PA, in 2008.
[32] R. Fardel, M. Nagel, F. Nuesch, T. Lippert, and A. Wokaun, From 2001 to 2004, he was a Research
Fabrication of organic light emitting diode pixels by laser-
assisted forward transfer, Appl. Phys. Lett., vol. 91, no. 6, Assistant with the Princeton Plasma Physics
Aug. 2007, Art. no. 061103. Laboratory. Since 2009, he has been an Assistant
> REPLACE THIS LINE WITH YOUR PAPER IDENTIFICATION NUMBER (DOUBLE-CLICK HERE TO EDIT) < 5

Professor with the Mechanical Engineering the IEEE Electromagnetic Compatibility Society
Department, Texas A&M University, College Best Symposium Paper Award in 2011.
Station. He is the author of three books, more
than 150 articles, and more than 70 inventions.
His research interests include high-pressure and
high-density nonthermal plasma discharge
processes and applications, microscale plasma
discharges, discharges in liquids, spectroscopic
diagnostics, plasma propulsion, and innovation
plasma applications. He is an Associate Editor of
the journal Earth, Moon, Planets, and holds two
patents.
Dr. Author was a recipient of the International
Association of Geomagnetism and Aeronomy
Young Scientist Award for Excellence in 2008, and

Third C. Author, Jr. (M87) received


the B.S. degree in mechanical
engineering from National Chung
Cheng University, Chiayi, Taiwan,
in 2004 and the M.S. degree in
mechanical engineering from
National Tsing Hua University,
Hsinchu, Taiwan, in 2006. He is
currently pursuing the Ph.D.
degree in mechanical engineering at Texas A&M
University, College Station, TX, USA.
From 2008 to 2009, he was a Research
Assistant with the Institute of Physics, Academia
Sinica, Tapei, Taiwan. His research interest
includes the development of surface processing
and biological/medical treatment techniques
using nonthermal atmospheric pressure plasmas,
fundamental study of plasma sources, and
fabrication of micro- or nanostructured surfaces.
Mr. Authors awards and honors include the
Frew Fellowship (Australian Academy of Science),
the I. I. Rabi Prize (APS), the European Frequency
and Time Forum Award, the Carl Zeiss Research
Award, the William F. Meggers Award and the
Adolph Lomb Medal (OSA).

Das könnte Ihnen auch gefallen