Sie sind auf Seite 1von 7

GENSCAN

JULIAN MATEO MROALES ESLAVA


20151578054

PROGRAMA DE SISTEMATIZACION DE DATOS


DEPARTAMENTO DE TECNOLOGIA EN SISTEMATIZACION
DE DATOS
FACULTAD TECNOLOGICA

UNIVERSIDAD DISTRITAL FRANCISCO JOSE DE CALDAS


BOGOTÁ, abril 24
1. La secuencia escogida y obtenida a través de GQuery es el genoma de un Delfin. Y su
genoma es el siguiente:

>NC_025899.1 Dolphin polyomavirus 1 isolate DPyV-1/Trachea/2010, partial sequence


CAGAAAAGCTGGTGGCTAAATAGGCCTCCAGGCCACTGAGGCTCTCAAAAAAAGTATATATAA
GGTATAA
TTTGGCAGTGTGCCCTGAGTGACAGGCACAGGGTGGCAGTATAGCTTAACAATAGAACAGAAA
CTGACCT
TTAAAAAGTAAATAGCACCACCTCGTGTTAAACAAACACACCTGCTAGAACCTGCCAGAAGCTT
GCCAAA
ACTTGCAGGAAGTTGCCTGAGCTTGTAGAAAGCAGAATATCAGGTTTCAGGAAATAGTAAATAA
ACCACT
CCCATTGCCATAGCAACGGAAGCACGTGTTATTAGCTTAACCTTTTACAACAAAGCAGGCAGA
GAACTGA
GCTGCTAAGTTGGTAAGTGTTTTATAAGGAAATGTGCTCTTTCAGTTGTTTTTTAGTGTTCTTTA
GGGCA
ATATGCCAAGCTGCTGTGGACCATTTTATAGGTCAAGCATTTAAAGTAAGTAAAAAGATTTTTAA
ATTAT
GATTTTAAAGTGGGGTGCTGTAAAGTACTTATATTTTATATCTTTTAGGATTTTACAGATGGAGA
TATTA
AAAGACCTGAAACTGAAGTAATTGAAACTACTGATGAATGTAATTTAGGTCAAGAAACTCCAAG
GTATGG
GAGCATTACTCACTATTTTACCTGAAATATTTACAGCTATAGATTTAGGAGCAATTGCTGGAGTA
GGTGC
AGATGCTGTAATAACAGGTGAAGCAGCAGCTTTATTAGAAGCACAGGTGGAATCAATTGTTCTA
ACAGAA
GGTGTAACTGAGGCAGAGGCAGTAGCATCTCTTGGTTTAACAGGTAGGCATATTGTTTTAAATG
TTTAAA
ATATAAATACTTGTTAAGTTTACAACACTTAGAGAGGTTTACTTTTTACAGGTAATACTGTTGCG
GAGAT
AACAGCTTTTCCTGAAGCATTAGAAACTGCTATTGGGTACTCAGGCCTAATACAAACAGCATCA
GGAGTA
TCAAGTCTAATAACTGCTGGAATCAAAACCTTTGGATTTGGAAATCAAATACCAGATACAAATAT
GGCTC
TGGTAGAGTGGAGACCAGAGCTCATTGATTACAATTTTCCAGGTGTTAGATGGCTAGCAAGAA
ATGTTGA
ATACTTTGATCCAAGATTTTGGGCCAGTGAGCTTTGGAGGGTTTTTATGGAAAGTGTGGCTAGA
GAAGGC
GCTGCACAAATAGAGGCTGCATCAACAGCTCTAGCAGAGCAGGGAAGAAGTGTAGCAGCAGA
TGCTATAG
CTAGATCTCTTGAAAATGCTAATTGGGTAATTAGTGAAACAGGTGCTCTAGCAAGAAGAGGCCT
TGATGT
TACAGGTGCCCTAGTAAGACAGGCAGGGCAAAGGGCAGTACAAAGTACAGGGTCAATTATTAC
CAATGCC
TATACAAACCTTGGTGATTATTATAGAGGCCTAACACCTCTAAGGCCCCCACAAAGAAGGGCAA
TGCTTA
GAGAATTAGAAAAATCAGAAAGGCAACAAACAATAACAGGAGAAGTAGTGTATAAGGCTCCTG
CACCTGG
TGGGGCAAATCAAAGAATTACACCTGAATGGATGTTACCACTAATTTTAGGTCTGTACAATCAC
CCTACC
TGGGGAGTCCCGGATGCTGTAACTGCTTTAAAAAGCAGTCAAGAAAAAGAAGAAAATGTCAGC
AAGAAAA
GGAAGAGGAGCTGTGAGACCACCCAGCCAGGTGCCAAAACTAATTGTAAAAGGAGGCGTAGA
AGTACTAG
GCGTTAAAACAGGGCCTGACAGTATTTTGTATGTAGAATGTTACCTTCAACCTAGAATGGGGGA
CCCTGC
CACTAATGGTGCTAGTAGTGGGCAGCTAACTAGAAATAGCACAAATGAAACAGATAATGAAACA
CAACAG
GGAACAAGACTTGCAAGATACAGCTGTGGAAGTATTCAACTACCTCTGCTAAATGATGACATGA
CACAAG
GAACCATTCTGATGTGGGAAGCCTTTGAAGTAAAAACTGAACTTGTTGGCATTAATGTGTTGAC
AAATTT
TCATTCTGCAGAGGATTTGGCTTGGCCTGATGGCCCTGGACTTCCAATCCAAGGACTGAATTTT
CACATG
TTTGCTGTTGGGGGTCAACCTCTTGAGCTTCAGGGAATTCTAATGAACCACCTTACAACCTACC
CAGATG
ATGTTGTTGTGCCAAATAGAACAAACAAAACCCCTAGTCTAAAGGTGCTTGACCCTACAGCAAA
GTCTCA
GCTTACAGAGGATGGTAAATTCCCAATTGAATGTTGGGCCCCAGATCCATCTAAAAATGAAAAC
ACCAGA
TATTTTTGCAGTCTTACAGGGGGCACCCAAACCCCACCTGTATTGCAACAAACAAATACAGTAA
CCACTG
TGTTGCTGGATGCAAATGGTGTGGGACCCCTTTGCAAGGGGGACAGGCTGTTTGTCACCAGT
GCTGATAT
TATTGGCATTCATAAAGATGCCAGTCATCATGCTTTCCTCAGAGGCCTACCTAGATTCTTCAGA
GTAGGC
CTCAGAAAGAGAACAGTGAAGAACCCATACCCTGTGTATAGTATGCTAAATTCACTGTTCACAA
ATTTGA
ACCCCTCTATTACAGGGCAAAGTATGCAGGGGGCTAATAGCCAAGTGGAGGAGGTGTCAGTG
TACCAAGG
CACAGAGCCCCTTCCTGCTGACCCAGATATGACAAGATTTATTAATGAGTTTGGACAGGAAACA
ACATCC
CTGCCTCATTAAATAAACCACAACCCAGATATTTTACTATGTAAAAGTTTTATTTTGTACATATAT
TGTT
TTAATAAAACAACTTTAATTTATTGCTGTGTTTCTGTCATTGAATCAATTCCTGACTCTTGTGTGG
TACT
AGTAGCATCATTACAACTCTCAGGGGACATAGGGGTATCATCCAAATCCAAAATATATTTTCCC
TCATGC
ACATTAATACACATTTTACCAAAATCAGTAACACACACATGATTATCAAACACCTCTTTCCAATAA
ATTA
CTTTTTCCTGTATATCTTCTTCAAAATCACTTACTGGGCAAAAATATATTAAATACATTAATATAG
AAAT
TCCAGAATGTAAAATTCTTTTTGTTAATAATTCCCCTGTTTTATTTAAACTTCTTCTTAAATTAGG
CTTT
CTTTCAAATAATATCATTTTTGAAATTCTTGCTAACACAGTGGGAGGAATTTTATAATTATTACAT
GTAA
TTATTCCTGGTGGAAACACTTGCGTTTTTTTATTTGCATGTTTCTTTTCAAGCTGAACACCTATAT
AACC
ATCTAAATAATCTCTCATATCATCTAAATTTGCCATACCATTCCCTTTTGGTAAATTTCCTTCATT
CTCC
ATAGGTATGCCTTTTACATCTTCAAAAAGTATTGAAAATTGATCAATAGCCATACCTAATTCAAAT
TGTA
GTTTATCAGCAGGTACATTAATATTTAATGCCTTACCACCACACAAATTAATAATTGCTGATGCT
AGGGT
TGTTTTCCCTGTATTTAAACCTCCCCTAAATATACAATATCTATGTTTAGGTACATTATCTACTAT
ACAT
TGTAATACAGTTTTAATAATTCCTTCTGTATCTGGAAACATATTATGAAACCATGCTACAGCTGC
CATAT
ATAATTTAATATTTTCACTATTTAAGCATTCATCCATTTTTTTAAATGTTTTTAATAATTGCAATTTA
AA
TAAGTGCTTTCTAGTAGATGTAGCCATTATTAACCTTCTACTAGCTAAAACACCATCACATGCTT
GAGCA
CAAATATTTCTTTGATTTTTAGCATCCAAAAATAATTTAGCATTTTCTAAATGATCTTTATGATGTT
TTA
CATGAATTTTATCACTTTCACTATTACATTTTATACAGCTTGTAACACATGATCCAAATTCTAAAT
AATA
TCCCATTACCAATAAAGGATCATCAATATCACAATCTTTTGCAAAGTCCCCCACCTGTTTCCAAT
TTACC
TGTGGTATTTTACTTTTATCTTCAGCTGATGAAAATAATTCTTCCTCAAGCCCACCTTCTAATGTT
TGTT
CCACAAGATTAAAAGGATCTTCTAATAATCTTTTATACAATGCTACAGCATTATTTACCCCCCTA
ACAAT
ACAAAAGCTTAAGGTTAAAAATTTAGAACAAAAACTTAAAATTGCATTAGGCCTGTGCTTTGCAG
GTGTA
ATTAATAGTAATATACAAAAAGGTCCATTAGAATGTCTACTTATAAATGTACATTTATATTTATCA
TTTA
ATTTTTGATATAAAGTTTCCCCTTTTTCCTGTGTAGTATAAATTGCAAATGTAGTTAAAGTTCTAT
TACT
TAATATAGCTTTACTTAAAAAGTCCTTAATACAATCAGGAAAATCTGTAGGGGTATTACTTCTTTT
CTTT
TTTTTGGGAGGTGTTGCCTGTGATTCTTCACATTCTTCATCTGATTCTTCCAGGGTCTCATCACA
GTATA
GGTTGAAGTGTCTATTCCAGTTGTCCCACCATGCATCCCATTCAGGTGTGCCATATTCAGGAG
GTCTCTA
AAATAAAAAGATTATATTATATTAGAGTTTTTATACTTACCCACCCCTTTTAATACTTACCAAAGT
TTTA
GTTCATCCAAAGAGGTGTTTGCAACCATATCCATCCAAACATTGCAGGATGACCAATTATTCTC
CACTCC
AAACCAAGTTAAAAAACAGGTAAAGCAAAAGCATCTCATCCACAAAAGTGGTTTACTTTCTTTAT
TTTGT
CTTTTTTTGTGGCAATGTCTTAATAGACACATTAGGCAAAGGCAGCTGCTAGATAAACCCAAAT
TGCAAG
ATCCCCAGGTTTTACAATAAAATGTATCTGGGGATGCTTGAAATAATTTAATTTTTACCTCATCA
TCAGG
TTTGTAAGATGGTGCATGTTGCATAGCTTCAACAAGCTTTCCAAATAATACATTTAATCTTTGCA
TTAAA
GCTGGATCACCACCTTTATCTGGGTGATATTTTAATGCAGCAGATTTAAAGGCTGTTTTCATTAA
GCCAT
AGCATCCATATAAGGTTCTTTCAAGACCCAAAAGGTCCATTAATTCATGCTGCTCATCTAAAGTA
AGGCA
ATCCATTTTGTAAAAAGCCTCCGAGGCCTTTTTTCTCTCTATCTATCTA
 A través genScan
o Se obtiene el gen con sus características
o Se obtiene la proteína correspondiente al gen
 Vemos que de la secuencia introducida obtenemos un solo gen
 De ese gen se encuentra 3 exones
 Tiene 2 exones internos y 1 terminal
Debido a que esta secuencia solo nos dio como resultado un gen, analizare este mismo.
 EXON 1:
o Posición inicial: 727 (en qué carácter empieza)
o Posición Final: 867 (hasta el que llega)
o Longitud: 147
o Marco abierto de lectura: +2 (empieza desde el tercer caracter)
o Confiabilidad: 11.29 (probabilidad de ser correcto).
 EXON 2:
o Posición inicial: 946 (en qué carácter empieza)
o Posición Final: 1764(hasta el que llega)
o Longitud: 819
o Marco abierto de lectura: +2 (empieza desde el tercer caracter)
o Confiabilidad: 25.86 (probabilidad de ser correcto).
 EXON 3:
o Posición inicial: 1841 (en qué carácter empieza)
o Posición Final: 2796 (hasta el que llega)
o Longitud: 956
o Marco abierto de lectura: +0 (empieza desde el primer caracter)
o Confiabilidad: 27.53 (probabilidad de ser correcto).
 El exón con mayor probabilidad de ser correcto es el exón numero 3.
 El exón con menor probabilidad es el exón numero 1

 COMPROBANDO EN BLAST

Das könnte Ihnen auch gefallen