Sie sind auf Seite 1von 9

EXAMEN DE BIOINFORMTICA PARTE 2.

NOMBRE Y
APELLIDOS: VANESA MACIAS CAO

14 DE ENERO DE 2011

En primer lugar guarda este archivo con tu Apellido_Apellido_Nombre.doc.


Utiliza este archivo para escribir, copiar y pegar la informacin solicitada. Modifica el
espacio de los recuadros tras cada pregunta segn tus necesidades. Guarda alguna
copia de seguridad durante el transcurso del ejercicio. Al finalizar carga el archivo en
la Carpeta de tareas del mdulo de Formacin Comn P1 (o P2) dentro de Examen
Bioinfomatica_Conv1_Parte2.

1) El siguiente resultado proviene de un anlisis de tblastn. Vers 5 elementos


resaltados en gris. Indica su significado
Query= act201
(367 letters) lecturas de la secuencia de inters
>eco:b3701 dnaN; DNA polymerase III, beta-subunit [EC:2.7.7.7]; K02338 DNA
polymerase III beta subunit
Length = 1101 longitud de secuencia del gen
Score = 364 bits (934), Expect = e-102 E values son similares a P values. Sera la
probabilidad de encontrar por azar un alineamiento con ese score o puntuacion o mayor.
Por debajo de 10-5 parecido es menor el porcentaje de identidad sera aprox. De 10-20%. En
la gua Blast pone El valor de E refleja el tamao de la base de datos y el sistema de
puntuacin en uso.
Identities = 190/369 (51%), Positives = 249/369 (67%), Gaps = 2/369 (0%)
Frame = +1 desplazamiento del marco de lectura
Query: 1
MHFTIQREALLKPLQLVAGVVERRQTLPVLSNVLLVVEGQQLSLTGTDXXXXXXXXXXXX 60 puede ser
cualquier residuo. Segn la gua: Blastp trata a los cdigos ambiguos como los
desajustes en la alineacin
M FT++RE LLKPLQ V+G + R TLP+L N+LL V
LSLTGTD
Sbjct: 1
MKFTVEREHLLKPLQQVSGPLGGRPTLPILGNLLLQVADGTLSLTGTDLEMEMVARVALV 180
Query: 61

DAAEPGEITVPARKLMDICKSLPNDVLIDIRVEEQKLLVKAGRSRFTLSTLPANDFPTVE 120
EPG TVPARK DIC+ LP
I +++E +++LV++GRSRF+LSTLPA DFP ++
Sbjct: 181 QPHEPGATTVPARKFFDICRGLPEGAEIAVQLEGERMLVRSGRSRFSLSTLPAADFPNLD 360
Query: 121 EGPGSLNFSIAQSKLRRLIDRTSFAMAQQDVRYYLNGMLLEVNGGTLRSVATDGHRLAMC 180
+
+ F++ Q+ ++RLI+ T F+MA QDVRYYLNGML E G LR+VATDGHRLA+C
Sbjct: 361 DWQSEVEFTLPQATMKRLIEATQFSMAHQDVRYYLNGMLFETEGEELRTVATDGHRLAVC 540
Query: 181 S--LDAQIPSQDRHQVIVPRKGILELARLLTEQDGEVGIVLGQHHIRATTGEFTFTSKLV 238
S +
+PS
H VIVPRKG++EL R+L
D + + +G ++IRA G+F FTSKLV
Sbjct: 541 SMPIGQSLPS---HSVIVPRKGVIELMRMLDGGDNPLRVQIGSNNIRAHVGDFIFTSKLV 711
Query: 239 DGKFPDYERVLPRGGDKLVVGDRQQLREAFSRTAILSNEKYRGIRLQLSNGLLKIQANNP 298
DG+FPDY RVLP+ DK +
L++AF+R AILSNEK+RG+RL +S
LKI ANNP
Sbjct: 712 DGRFPDYRRVLPKNPDKHLEAGCDLLKQAFARAAILSNEKFRGVRLYVSENQLKITANNP 891
Query: 299 XXXXXXXXXXXXYNGGNLEIGFNVSYLLDVLGVIGTEQVRFILSDSNSSALVHEADNDDS 358
Y+G +EIGFNVSY+LDVL + E VR +L+DS SS + +A + +
Sbjct: 892 EQEEAEEILDVTYSGAEMEIGFNVSYVLDVLNALKCENVRMMLTDSVSSVQIEDAASQSA 1071
Query: 359 AYVVMPMRL 367
AYVVMPMRL
Sbjct: 1072AYVVMPMRL 1098 secuencias similares

2)

Utiliza la herramienta SRS de EMBL (http://srs.ebi.ac.uk) y busca dentro de la


base de datos de secuencias de protenas UniprotKb las protenas con el
nombre de gen hisS. A continuacin debes hacer varias cosas:

A) Ordnalos por tamao en formato descendente de forma que se observe en la


parte superior la protena ms larga. Debes copiar y pegar la pantalla con el
resultado

B) Ordnalos por Nombre del organismo en formato ascendente Debes copiar y


pegar la pantalla con el resultado

C) Localiza la protena de Abiotrophia defectiva ATCC 49176, entra en el registro y


copia y pega a continuacin: el nmero de enzima (EC number), el nombre del
enzima, el nombre del gen como locus ordenado (ORF Name) y la descripcin
taxonmica completa.
EC number 6.1.1.21
Nombre de la enzima Histidine--tRNA ligase
ORF name GCWU000182_01597
Descripcion taxonmica completa Bacteria; Firmicutes; Lactobacillales; Aerococcaceae;
Abiotrophia

3) El siguiente fragmento corresponde a un clon de una genoteca obtenida de una


especie bacteriana.
>seq3
TGGCCGCCAGCGCGAACAGCAACGACATCGCCAGGGCTCGGGTCTTCATCAGGCAGTTTCCAACAACGGGGAATCCTCCGATGCTAGG
CCTGTGCGATGGCCGGCCCCATGGCCAAAGGTCATGGGCGGTGCGCCCACCCGGCCATGCCAAAGGCGTGCGAACCAAGGTTCGCACC
CACCAGATCAGTTTCGGTTCGCACCCACACCGGGTAGTGGCGGGCCGTACCCTGCAGACGTCGTTCCGCGCTCAGTCGACCAGGCGCA
GGCGCAGTTCCTTCGGCAGCGCGAACACCATCGATTCCGGTTCGCCGTCCAGCTCGCCCACGCCGCTGGCGCCCAGCTCGGCCAGGCG
CGCCAGCACGCCATCGACCAGCACCTGCGGCGCCGAGGCGCCGGCGGTCACGCCGATGTGCTGCTTGCCTGCCACCCATGCCGGGTCG
ATCTCGTGCGCACCATCGATCAGATACGACTCCACGCCTTCGCGGCGGGCCAGCTCGCTCAGACGGTTGGAGTTGGAGCTGTTCGGCGA
ACCGACCACCAGCACCAGGTCGCAGCGCTTGGCCAGGTCGCGCACAGCATCCTGGCGGTTCTGCGTGGCGTAGCAGATGTCGTCGTTC
TTCGGGCCCTGCATCGCAGGGAACCGCTCGCGCAGCGCATCGATGATGCCGCGCGTGTCATCCACCGACAGCGTGGTCTGGGTGGTGTA
GGCGAAGTTTTCCGGCTGGTTGATCTGCAGCGTCGCGACCTGCTCGACATCCTCGACCAGGTAGATCTGCCCGGTCCCGGCTTCGCGGT
TCCACTGGCCCATGGTGCCTTCCACCTCCGGGTGACCGGCGTGGCCGATCAGCACCACGTCACGGCCGGCACGGCAGTGGCGCGCGAC
CTCGAAGTGGACCTTGGTCACCAGCGGGCAGGTGGCGTCGAACACCTTCAGGCCACGGCGCTCGGCTTCCTGGCGCACGGCCTGGGA
CACGCCATGCGCGCTGAAGATCACGGTGTTGTTGTCCGGAACCTCGTCGAGTTCCTCGACGAAGATCGCGCCGCGCTGCTTCAGGTCGT
CGACCACGAAGCGGTTGTGCACCACTTCATGGCGGACATAGATGGGCGCGCCCAGCGTTTCGATCGCGCGCTTGACGATCTCGATCGCA
CGATCGACACCGGCACAGAAACCACGCGGGTTGGCGAGCAGCACATCCATCAGTTCAGTCTCCCGGCGGCAGCCGGCTTACGGTTTCG
GGTTGGCATTATCCGCCTTTTTGGCGGACTTGCCGTCGAACAGGCCAAACAGTGCGATGCCGATGGCACCCACCACGATGGCCGAGTCG
GCGATGTTGAACGAGGGCCAGGTGTAGCTGCCCACGTACCACTGGATGAAGTCGACCACGTGGCCGTGCACCTGGCGGTCGATCACGT
TGCCGATGGCGCCGCCGATGATCAGCGCATACGGCACCGCGGCCTTCCAGTTGCCGCGGGCGGTGCCGCGCAGCCACCACGCCATCAG
CCCGCTGATGGCGATCGCCAGCGCGGTGAAGAAGTACTTCTGCCAGCCACCGGCGTCGCTCAGGAAACTGAATGCCGCGCCGGTGTTG
TAGGTGCGGTACCAGTTCCAGAAGCCGTCGATGACCACCACCGGCTGGAACTCCGGCAGGCTGGACAGCACCCAGGCCTTGGACCACT
GGTCCAGGCCGATGATGGCCACCGACAGCAGCAGCCAGACCAGGGCGTTCGGATGCGGACGGGGCGCGGCCAT

Desconoces que genes codificantes puede contener. Haz una bsqueda por similitud
con el programa blastx en GenomeNet (http://blast.genome.jp/) sobre los
genes/protenas de un solo genoma (E. coli K 12 Smbolo=eco). Obtn solamente 5
resultados y 5 alineamientos. Copia y pega la pantalla con la parte superior del
resultado del blast.

a) Interpreta el resultado del blast Cuntos genes contiene, en que orden y en


que cadena? Indica en base a la similitud si los genes estn enteros o no.
Nmero de genes 5
Orden de los genes ispH, ECK0030, JW0027, lytB, yaaE; 4-hydroxy-3-methylbut-2-enyl
diphosphate reductase, 4Fe-4S protein (EC:1.17.1.2); K03527 4-hydroxy-3-methylbut-2-enyl
diphosphate reductase[EC:1.17.1.2]
En qu cadena cadenas complementarias (Frame = -1)
En base a la similitud estn enteros o no no, la mayor Identities = 195/312 (62%) y la
menor Identities = 18/60 (30%),

b) Por qu para contestar a la pregunta anterior es mejor un blastx que un


blastn?
Blastx
Blastn

DNA 6proteina
DNA 1 DNA

El alineaminto de aas sobre los nt es preferible porque existen 20 tipo de aas frente a 4
nt. Adems, se han creado matrices de sustitucin aminoacdica que muestran la mayor o
menor probabilidad de que se produzcan ciertos cambios (PAM, BLOSUM)

c) Pon un ejemplo en el que un tblastn sea el tipo de blast ms apropiado


Por ejemplo si queremos buscar una protena ribosmica en nCBI usaremos el tblastn
(especie similar ya que por ejemplo la tuya no est anotada) contra la secuencia nt
del genoma bacteriano en el que buscamos

4) Haz un alineamiento con las siguientes secuencias con ClustalW en Mega. Hazlo
con las protenas y obtn luego el de nucletidos.
a) Copia y pega la pantalla con la parte inicial del alineamiento de nucletidos.

b) Luego busca en la parte inicial una regin con un hueco y mueve 3 nt de una nica
secuencia hacia la derecha, copiando y pegando a continuacin la pantalla.

c) Finalmente haz un rbol filogentico con el mtodo del Neighbor joining con el
alineamiento de las secuencias de nt con las posiciones 1+2 y pon la raz en la
secuencia 5 y pgalo a continuacin.

>1
ATGACGGCAATTGCCCCGGTACTCCGCATAACCATTGATGGCCCAAGCGGTGCAGGTAAAGGCACCTTGTGCAAAGCAATGGCGGAAGCAGGAGAATTGC
AATGGCATCTGCTGGATTCCGGCGCGATATACCGCGTACTGGCGCTGGCGGCATTGCATCACCATGTCGATCTCGCCTCTGAAGATGCGCTGGTGCCGCT
GGCGTCCCATCTGGACGTGCGTTTCGTCTCAACGGACGGCAACCTGGAAGTTATCCTGGAAGGCGAGGACGTTAGCGGCGAAATCCGTACGCAGGAAGTC
GCGAACGCGGCATCCCAGGTGGCGGCATTCCCACGCGTGCGTGAAGCGCTTCTTCGCCGCCAACGCGCATTCCGCGAAGCGCCTGGTTTAATCGCCGATG
GACGCGATATGGGGACCGTGGTCTTCCCGGATGCGCCGGTAAAAATTTTCCTTGACGCCTCCTCGGAGGAACGTGCGCATCGACGTATGCTACAGTTGCA
GGAGAATGGCTTTAGTGTTAACTTTGAACGCCTTTTGGCCGAGATCAAGGAACGCGACGATCGCGATCGTCATCGTGCCGTTGCGCCGTTAGTTCCTGCT
GCTGATGCATTAGTTTTGGATTCTACCCGATTAAGCATTGAGCAAGTGATTGAAAAAGCGTTACAATATGCGCGCCAAAAATTGGCTCTCGCTTAA
>2
ATGACGGCAATTGCCCCGGTTATTACCAGACTTATTGATGGCCCAAGCGGTGCAGGGAAAGGCACCTTGTGTAAGGCTATGGCGGAAGCGTTGCAATGGC
ATCTGCTGGACTCGGGTGCAATTTATCGCGTACTGGCATTGGCGGCATTACATCACCATGTTGATGTTGCGTCGGAAGATGCGCTGGTACCGCTGGCATC
CCATCTGGATGTACGTTTTGTGTCGACCAATGGCAATCTGGAAGTGATCCTCGAAGGGGAAGATGTCAGCGGCGAAATTCGTACTCAGGAAGTGGCGAAT
GCAGCTTCACAAGTCGCGGCATTCCCACGCGTTCGTGAAGCATTATTGCGTCGCCAACGCGCGTTTCGCGAATTACCAGGTCTGATTGCCGATGGCCGCG
ACATGGGAACGGTGGTATTCCCTGATGCACCAGTGAAAATTTTCCTTGACGCCTCCTCGGAAGAACGTGCGCATCGCCGCATGCTACAGTTGCAGGAGAA
GGGCTTTAGTGTTAACTTTGAGCGCCTTTTGGCCGAGATCAAAGAACGCGACGACCGCGATCGTAACCGAGCGGTAGCGCCACTGGTTCCGGCAGCCGAT
GCTTTAGTGTTGGATTCCACCACCTTAAGCATTGAGCAAGTGATTGAAAAAGCGCTACAATACGCGCGCCAGAAATTGGCTCTCGCATAA
>3
ATGACGGCGATAGCCCCGGTGATAACCGTTGATGGACCGAGTGGTGCGGGTAAAGGTACGCTTTGCAAAGCATTGGCTGAATCATTGAACTGGCGCTTGC
TGGATTCTGGTGCGATTTACCGAGTGCTGGCACTCGCTGCTTTGCATCATCAGGTCGATATCAGCACCGAAGAGGCATTGGTACCACTTGCCGCACATCT
CGATGTTCGTTTTGTTTCACAGAATGGGCAGCTACAAGTTATTTTAGAAGGCGAGGATGTCAGCAATGAGATCCGAACCGAGACAGTGGGTAATACTGCA
TCCCAAGCGGCGGCTTTCCCCCGTGTACGTGAAGCATTACTGCGTCGCCAGCGAGCTTTTCGCGAAGCGCCTGGTTTAATTGCTGATGGCCGGGATATGG
GGACTATCGTGTTTCCTGATGCACCTGTGAAAATATTTCTTGATGCCAGTTCGCAAGAACGCGCGCACAGACGTATGCTACAGTTGCAGGAAAGAGGGTT
TAATGTTAACTTTGAACGTCTTTTGGCCGAGATACAGGAGCGGGATAACCGTGATCGTAACCGGTCTGTTGCACCTTTAGTCCCTGCGGCGGATGCGTTG
GTACTGGATTCAACCAGTATGTCCATCGAACAGGTGATCGAACAGGCGCTGGCTTATGCCCAACGAATTTTAGCCTTGCCGTTGAAAAAATAA
>4
ATGACGGTGATGGCACCGGTAGTTACGAGACTTGTTGACGGACCGAGCGGCGCAGGCAAAGGTACCTTATGTAAGGCATTGGCTGAAGCTTTTTTACAAT
GGAACCTGCTGGACTCGGGGGCTATCTATCGTGTTTTGGCGTTGGCGGCGTTACACCACCATGTGGATATCAGTTCAGAAGATGCGCTGGTCCCGCTAGC
CTCTCATCTTGATGTGCGCTTTGTTGCAGAAGACGGCCAGTTGAAAGTCATTCTGGAAGGTGAAGACGTTAGCCACGAAATTCGTACCGAAGCGGTGGGC
AACACGGCTTCTCAGGCTGCAGCTTTTCCTCGTGTTCGTGAAGCATTATTACGTCGGCAGCGTGCTTTCCGTGAGGCTCCGGGGTTGATTGCCGATGGCC
GTGATATGGGAACGGTGGTCTTTCCTGACGCCCCAGTGAAGATTTTCCTGGATGCCAGTGCGGAAGAACGTGCACAACGTCGCATGCTACAGTTGCAGGG
GAAGGGCTTTAATGTTAACTTTGAACGTCTTTTGTCTGAGATAAAAGAACGGGACGATCGTGATCGTAGCCGCCCCGTTGCGCCGTTAGTACCTGCTGCC
GATGCGCTGGTGCTGGATTCAACGGAAATGACAATCGATGAAGTGATAGCGCGCGCGTTGGCTTATGCCCGCGAAATTTTAGCGTAA
>5
ATGGAGAAATACATGACCTCTTCTCATACGCCAGTGGTTACCGTTGATGGACCTAGCGGTGCAGGTAAAGGCACATTGTGCATGTTGTTGGCTAAAAAAC
TCGGTTTTCAGCTATTGGACTCTGGCGCGATTTATCGCGTGTTGGCCTTGGCGGCTCTTCATCATGGCGTTGATCTTGAATCGGAAGACGCTTTGGTTCC
TCTTGCTACGCATCTTGATGTGCAGTTCATCGCGGAAGGCGACTTAGTGAAAGTCATCCTCGAAGGTGAAGATGTGTCCCGCGAGCTGCGTAAAGAAGAA
ACTGGGATGGCTGCGTCAAAAGTCGCGGCATTACCTCGGGTACGTGAAGCGCTGCTGCGCCGTCAACGCGCGTTTGCTAGTGGTATTGGATTAGTTGCAG

ATGGCCGTGATATGGGCACAGTGGTTTTTCCAGCGGCGGAAGCAAAAATTTTCCTTGATGCGAGTGCGGAAGAAAGAGCCCGTAGACGCTTCAAGCAGTT
GCAACTGAAGGGGCTTGATGTTAAATTTGATGCCCTTTTAAGCGAAATTCAGGAAAGAGACGACCGCGACAGAAATCGTGCTGTTGCTCCATTACGTCCT
GCTGAAGACGCATTAGTGCTTGATTCAACCACATTGACTATCGATGAAGTGGTGGAACAAGCGCTACAATATATTGAATCTAAGCTAGTGTGA
>6
ATGAAATTTATAAATAATATTGTTCCTATTGTGACCGTTGATGGTCCTAGTGGGTCAGGAAAGGGAGTATTATCTAAACAGTTAGCATATATTCTTGGAT
GGAATTTATTAGATTCAGGAATAATTTATCGAATTTTAGCATGTGAGGCTTTGGATAATAATATAGATATGTGTAATGAGGATAGTTTACAGGTGCTGAT
GTCAAAGATAAAAGTTAGTTTTATAAATATAAAAAATAGTTTCGTTGTGTATTGTAATGATAAAGAAATCAAAAAGAATATTCATACGGAATTTGTTGGA
AATTTAGCTTCTAAAATTGCACTTTTTCCGAAAGTACGTGATGTTTTATTAAAATATCAACGCACATTTTGTGTATTTCCTGGTCTTGTTGCTGATGGAA
GAGATATGGGAACGATAGTTTTTCCTAATGCAATAGTAAAAATTTTTCTAAATGCTGCTGTAAAAGTAAGAGCACAAAGACGATTAGATCAGTTGCAGAA
AGTAAATTTTTCTGTTAATTTTAAGTGTTTATCATCACAAATAAAAGAACGTGATGATCGAGATTGTAATAGACAATTAGCACCGTTAGTTCCTGCAGTT
GATGCATTTGTTTTAGATTCGACTCATTTGTCTAAAAATGAAGTTGAAAATAAAGCGTTATTATTTATTCAGAAAAAAATTGGTATAATTAATTATTAA

Das könnte Ihnen auch gefallen