Bioinformática (BQI 460)
Por: Rodrigo.Claudino • 3/4/2018 • 777 Palavras (4 Páginas) • 283 Visualizações
...
Diagonal -> 0 -1 = -1
Superior -> -3 -3 = -6
Lateral -> -3 -3 = -6
- T com T (segunda linha e terceira coluna de números):
Diagonal -> -3 +1 = -2
Superior -> -6 -3 = -9
Lateral -> -1 -3 = -4
- G com T (segunda linha e quarta coluna de números):
Diagonal -> -6 -1 = -7
Superior -> -9 -3 = -12
Lateral -> -2 -3 = -5
→ Alinhamentos possíveis após a realização dos cálculos e montagem da tabela:
ATGGCAAG ATGGCAAG ATGGCAAG
- T - GAACG - TGA - ACG -TG – AACG
Bit Score: -4 Bit Score: -4 Bit Score: -4
(-3+1-3+1-1+1-1+1) (-3+1+1-1-3+1-1+1) (-3+1+1-3-1+1-1+1)
→ Análise dos resultados: Como todos os Bit Scores possuem o mesmo valor, os três alinhamentos são igualmente bons.
2) Conforme a lista de proteínas em anexo indicada para cada aluno, recupere a sequência proteica ortóloga para Escherichia coli, Saccharomyces cerevisiae, Mus musculus e Homo sapiens, depositadas no NCBI.
→ Proteína indicada: β-ketothiolase (acetyl-CoA acyltransferase/ 3-ketoacyl-CoA thiolase)
→ Ordem dos “print´s”: igual à solicitada pelo exercício
→ Observação: sequências coladas no Bloco de Notas estão em anexo no email
[pic 85]
[pic 86]
[pic 87]
[pic 88]
3) Alinhe globalmente as quatro sequências utilizando o programa CLUSTAL OMEGA web server. Qual a identidade entre as sequências?
[pic 89]
[pic 90]
[pic 91]
Pela análise dos dados fornecidos pelo CLUSTAL (alinhamento e matriz de identidade), é possível perceber que a sequência de aminoácidos da β-ketothiolase apresenta maior identidade entre os organismos M.musculus e H.sapiens (87,91% de identidade), ou seja, a sequência dessa enzima é mais parecida entre esses dois organismos que quando comparada aos outros dois (S. cerevisiae e E. coli).
A sequência da enzima em E. coli é mais parecida com H.sapiens (58,10% de identidade); em S. cerevisiae, é mais parecida com E. coli (50,49% de identidade); em M. musculus, é mais parecida com H. sapiens (87,91% identidade).
4) Utilizando o BLAST implementado no site do NCBI, encontre a proteína ortóloga de Caenorhabditis elegans. Qual o e-value do melhor alinhamento? O que se pode concluir sobre a qualidade deste alinhamento?
→ Sequência FASTA (Fonte: NCBI):
[pic 92]
[pic 93]
[pic 94]
O e-value nos faz ter uma ideia de quão significativos são os alinhamentos obtidos. Seu valor diminui com o aumento do score. Ou seja, quanto menor o valor de e-value, maior o score e melhor o alinhamento. Dessa forma, como a primeira sequência apresentou o menor e, portanto, melhor, valor de e-value (2e-165), é ela que pode ser definida como a sequência ortóloga de C. elegans.
Porém, esse alinhamento possui baixa porcentagem de identidade, indicando que as sequências alinhadas não possuem tantos aminoácidos na mesma posição.
5) Construa a árvore filogenética para as cinco proteínas acima (Escherichia coli, Saccharomyces cerevisiae, Mus musculus, Homo sapiens e C. elegans) utilizando a técnica de máxima verossimilhança com valor de bootstrap de 1000 reamostragens. O que se pode concluir sobre a qualidade da árvore gerada? O que se pode concluir sobre a evolução desta proteína?
[pic 95]
[pic 96]
O valor de Bootstrap equivale ao número de vezes que o agrupamento ocorreu. Quanto maior esse valor, melhor, pois significa que o ramo possui melhor qualidade.
O valor de Bootstrap igual a 100 indica que em 100% das amostragens, as sequências proteicas de β-ketothiolase em M. musculus e H. sapiens estavam reunidas em um ramo contendo apenas as duas sequências. Ou seja, a árvore é altamente confiável e essas duas espécies possuem alta semelhança entre si.
O valor de Bootstrap igual a 59 indica que em 59% das amostragens, as sequências proteicas de β-ketothiolase em M. musculus, H. sapiens e S. cerevisiae estavam reunidas em um ramo contendo apenas as três sequências.
...