Sie sind auf Seite 1von 3

Instituto Tecnolgico Superior de Lerdo

Ensayo: Formatos de archivo de secuencias

Samuel dSantiago Lpez Gonzlez 10231025

M.E. E.D. I.S.C. Ricardo de Jess Bustamante Gonzlez Administracin y organizacin de datos

8 de febrero del 2012 Lerdo, Durango

Introduccin Ya sabemos acerca de los archivos ASCII y los archivos binarios, bueno dentro de los archivos ASCII se encuentran los archivos de secuencias (.sec) y de secuencias mltiples (.aln, .msf, .rsf) que se utilizan comnmente dentro de los programas de bioinformtica, estos archivos a su vez tienen ciertos formatos distintivos para lograr su reconocimiento, en este ensayo se dan a conocer algunos de los formatos, como tambin sus principales caractersticas. Desarrollo Formato de archivos Formato phylip es un formato de entrada para diferentes programas como phylip (ver mas acerca de como utilizar este programa), lard, plato, spot, entre otros. Formato GenBank es utilizado para los reportes de secuencias que se encuentran almacenados en el Genbank, se caracteriza por proporcionar al usuario una informacin bastante completa sobre la secuencia. EMBL son reportes generados por la base de datos de secuencias respaldada por el EMBL (European Molecular Biology Laboratory) PIR formato con el cual son generados los archivos provenientes de la base de datos. FASTA uno de los ms utilizados en la actualidad puede incluir una o mas secuencias no alineadas. CLUSTAL es un formato para archivos de secuencias alineados. Sus principales caractersticas son: tanto nucletidos como aminocidos son representados por el cdigo de una letra; los gaps son indicados con un guin "-" y al final de las secuencias alineadas, puede aparecer una especie de secuencia consenso con signo como: "*", ":" y "." MSF (multiple sequence file) este es un archivo de secuencias se utiliza para dos o ms secuencias alineadas. ; este archivo tambin puede servir como entrada de datos en los programas GCG. RSF (Rich Sequence File) este tipo de formato permite introducir una o ms secuencias para llevar a cabo un anlisis, es utilizado por algunos programas del GCG.

Conclusin Como se puede apreciar en el ensayo estos tipos de formatos se utilizan en la rama de la bioinformtica para las secuencias de nucleoticos como aminoacidos, y existen 2 programas principales que tratan estos archivos que son el phylip que de los formatos mencionados solo abre el phylip y el GCL que en algunos casos se tienen que realizar configuraciones pero puede abrir GenBank, EMBL, MSF, RSF. Aqu se puede ver una prctica de bioqumica, donde se utilizan los formatos

Referencias Anlisis, comparacin y reconstruccin filogentica de secuencias de DNA mitocondrial, [En lnea]. [Fecha de consulta 8/02/12]. Disponible en la web: http://biologia.uab.es/biocomputacio/tutorial/sessio6/tutorialdnamit.htm Tipos de archivos de secuencias, [En lnea]. [Fecha de consulta 8/02/12]. Disponible en la web: http://www.cecalc.ula.ve/bioinformatica/UNIX/node62.html PHYLIP: PHYLogeny Inference Package., [En lnea]. [Fecha de consulta 8/02/12]. Disponible en la web: http://www.cecalc.ula.ve/bioinformatica/PHYLIP/phylip.html

Das könnte Ihnen auch gefallen