FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos...

20
FASTA Introducción a la Bioinformática

Transcript of FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos...

Page 1: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.

FASTA

Introducción a la Bioinformática

Page 2: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.

Semejansas y diferencias entre FASTA y BLAST

• Ambos programas no usan el mismo sistema de puntaje para alinear las secuencias de las bases de datos emparejadas con la secuencia query.

Page 3: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.

• ktup. Tanto FASTA como BLAST usan una estrategia de búsqueda inicial basada en palabras cortas.

• ktup en FASTA es el parámetro que indica el tamaño de la palabra utilizada en esta búsqueda inicial. FASTA utiliza por default ktup=2, mientras que BLAST utiliza ktup=3.

Page 4: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.

Matrices y scores

Page 5: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.
Page 6: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.

• Homólogos distantes. Existe una opción en FASTA (-F) que les permite ignorar (i.e. que no aparezcan en el output) secuencias altamente similares al query. Esto es útil, por ejemplo, para focalizar una búsqueda en las secuencias más divergentes. No existe una opción similar en BLAST.

Page 7: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.

• Filtrado de secuencias de baja complejidad. Por default, BLAST filtra secuencias de baja complejidad o repeticiones. FASTA no!.Esto puede afectar la capacidad de discriminar falsos positivos, aunque FASTA provee otro tipo de opciones para manejar este tipo de casos.

Page 8: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.

• Muchas secuencias son altamente repetitivas. Si la secuencia query contiene regiones de baja complejidad o repeticiones, es posible que una búsqueda encuentre muchas secuencias no relacionadas, con altos scores (por ej hits contra colas de poly-A o regiones ricas en Prolina) o repeticiones como Alu.

• BLAST permite filtrar el primer tipo de casos, mediante la opción -F.

• FASTA en cambio no provee esta alternativa. Es el usuario el que tiene que filtrar el query antes de realizar una búsqueda.

Page 9: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.

• Secuencias cortas. Si buscamos un primer o un péptido, al utilizar BLAST debemos tener en cuenta que BLAST no es muy útil al respecto. Esto es porque BLAST tiene un límite inferior sobre la longitud que puede tener una palabra (ktup). En el caso de nucleótidos, el límite inferior es 7 (el default es 11).

• En este sentido FASTA es mejor, porque siempre pueden usar ktup=1. Por otra parte, en el caso específico de péptidos, FASTA provee algunos algoritmos particulares de búsqueda (fastf3, fasts3 y tfasf3, tfasts3).

Page 10: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.

Versiones de FASTA

• FASTA: compara secuencia de una proteína o DNA Query / biblioteca de secuencias de proteínas o DNA.

• TFASTA: compara secuencia de una proteína Query / biblioteca de secuencias de ADN

• FASTF/TFASTF y FASTS/TFASTS: compara pequeños fragmentos de pépticos / base de datos de secuencias de proteína (FASTF/FASTS) o base de datos de secuencias de ADN (TFASTF/TFASTS).

Page 11: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.

• FASTX y FASTY: Traduce una secuencia de ADN en sus 3 regiones de marco de lectura forward y compara estos 3 marcos con una base de datos de proteínas.

• TFASTX y TFASTY: compara una secuencia de proteínas con una base de datos de ADN traduciendo cada secuencia de ADN en sus 6 posibles marcos de lectura.

Page 12: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.

GRACIAS

Page 13: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.
Page 14: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.

• Ejemplo:– Realizaremos un FASTA de la secuencia de

M. bovisMBOVIS(MrWr)

MRALIIVDVQNDFCEGGSLAVTGGAALARAISDYLAEAADYHHVVATKDFHIDPGDDFSGTPDYSSSWPPHCVSGTPGADFHPSLDTSAIEAVFYKGAYTGAYSGFEGVDENGTPLLNWLRQRGVDEVDVVGIATDHCVRQTAEDAVRNGLATRVLVDLTAGVSADTTVAALEEMRTASVELVCSPDGTA

Page 15: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.
Page 16: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.
Page 17: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.
Page 18: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.
Page 19: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.
Page 20: FASTA Introducción a la Bioinformática. Semejansas y diferencias entre FASTA y BLAST Ambos programas no usan el mismo sistema de puntaje para alinear.