AAE-DeMo : Uma proposta de arquitetura inteligente para descoberta de motifs em sequências moleculares
Por: YdecRupolo • 10/12/2018 • 9.890 Palavras (40 Páginas) • 317 Visualizações
...
(TESLA, Nikola 1934 p. 2)
RESUMO
SCHMIDT, Augusto Garcia. AAE-DeMo: Uma Proposta de Arquitetura Baseada em Algoritmos Evolutivos para Descoberta de Motifs em Expressões Genéticas. 2017. 48f. Dissertação (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Computação, Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2017.
Motifs não são entidades aleatórias encontradas nas cadeias de DNA. O Motif também pode ser definido como um fenômeno não único. Já os Motifs, além de ter padrões recorrentes na sequência analisada, também possuem uma função biológica. Os algoritmos evolutivos são amplamente utilizados para encontrar soluções para otimização e padrões de pesquisa na área de ciência da computação. Encontrar motivos em sequências de genes é um dos problemas mais importantes na bioinformática e pertence à classe NP-Completo. Portanto, é plausível investigar a hibridação de ferramentas consolidadas, mas limitado em seu desempenho, em combinação com técnicas de algoritmos evolutivos. Este trabalho tem a premissa de mostrar uma pesquisa das principais técnicas e conceitos de algoritmos evolutivos utilizados na descoberta de padrões (motifs) na expressão gênica e também um estudo aprofundado dos principais algoritmos de bioinformática que são usados para esta função em recentes anos por pesquisadores. Entende-se que tais técnicas em combinação, podem obter resultados interessantes para pesquisa em bioinformática. Assim, propondo uma arquitetura otimizada para motivos em expressões genéticas de regiões promotoras da bactéria. Usando tantos algoritmos evolutivos, como algoritmos de bioinformática e técnicas de refinação de seus principais dados fornecidos pelos algoritmos utilizados. Assim, formando uma arquitetura com melhor desempenho devido à hibridização de ferramentas consolidadas para buscar padrões em expressões genéticas.
Palavras-Chave: Algoritmos Evolutivos, Descoberta de Motifs, Bioinformática.
ABSTRACT
SCHMIDT, Augusto Garcia. AAE-DeMo: An Architecture Proposal Based in Evolutionary Algorithms for Motifs Discovery in Genetic Expressions. 2017. 48p. Trabalho Individual (Mestrado em Ciência da Computação) – Programa de Pós-Graduação em Computação, Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2017.
Motifs are not random entities found in DNA chains. A motif can also be defined as not a single phenomenon. However, motifs, besides having recurring patterns in the analyzed sequence, also have a biological function. evolutionary algorithms are search techniques widely used to find approximate solutions to optimization and search patterns in the science area of computing. Finding motifs in gene sequences is one of the most important problems in bioinformatics and belongs to the class NP-Complete. Therefore, it is plausible to investigate the hybridization of consolidated tools, but limited in their performance, in combination with evolutionary algorithms techniques. This work has the premise to show a research of the main techniques and concepts of evolutionary algorithms used in discovery of patterns (motifs) in gene expression and also an in-depth study of the major bioinformatics algorithms that are used for this function in recent years by researchers. It is understood that such techniques in combination, can achieve interesting results for research in bioinformatics. Thus proposing an optimized architecture for motifs discovery in genetic expressions of promoter regions of a bacteria. Using as many evolutionary algorithms such as bioinformatics algorithms and refining techniques of its main data provided by the algorithms used. Thus forming an architecture with better performance due to hybridization of consolidated tools to search for patterns in genetic expressions.
Keywords: Evolutive Algorithms, Motifs Discovery, Bioinformatics.
LISTA DE FIGURAS
Figura 1: Crescimento do GenBank(PROSDOSCIMI, 2007). 14
Figura 2: Transição de hélice ativa de DNA para proteína (CÉSAR, DA SILVA JÚNIOR; SASSON, SEZAR., 2007). 15
Figura 3: Tabela de Códons e seus respectivos aminoácidos. 16
Figura 4: PWM de um modelo Probabilístico. 19
Figura 5: Método de Seleção Roleta 22
Figura 6: Crossover em um ponto. 23
Figura 7: Recombinação Uniforme. 24
Figura 8: Alinhamento Global e Local. 26
Figura 9: Alinhamento local de sequências. 27
Figura 10: Fluxo de Dados da Arquitetura. 29
Figura 11: Match por individuo - dataset PS00211. 35
Figura 12: Match por individuo - dataset PS50151. 35
Figura 13: Performance 10 gerações 100 indivíduos - dataset PS00211. 38
Figura 14: Performance 25 gerações 250 indivíduos - dataset PS00211. 38
Figura 15: Performance 50 gerações 500 indivíduos - dataset PS00211. 39
Figura 16: Performance 75 gerações 750 indivíduos - dataset PS00211. 39
Figura 17: Performance 100 gerações 1000 indivíduos - dataset PS00211. 40
Figura 18: Performance 10 gerações 100 indivíduos - dataset PS50151. 40
Figura 19: Performance 25 gerações 250 indivíduos - dataset PS50151. 41
Figura 20: Performance 50 gerações 500 indivíduos - dataset PS50151. 41
Figura 21: Performance 75 gerações 750 indivíduos - dataset PS50151. 42
Figura 22: Performance 100 gerações 1000 indivíduos - dataset PS50151. 42
Figura 23: Comparação da Arquitetura Proposta e MEME/MAST. 44
Figura 24: Comparação de Sequence Logos. 45
---------------------------------------------------------------
...