Engenharia De Computação – Universidade UniEvangélica
Por: kamys17 • 7/5/2018 • 3.935 Palavras (16 Páginas) • 302 Visualizações
...
O software Microsoft SQL Server Analysis Services fornece vários algoritmos para serem usados nas soluções de mineração de dados. Esses algoritmos são subconjuntos de todos os algoritmos que podem ser usados para mineração de dados. Outros algoritmos de terceiros compatíveis com a especificação OLE DB para Data Mining também são utilizados.
O algoritmo Analysis Services inclui os seguintes tipos de algoritmos:
- Algoritmos de classificação prevêm uma ou mais variáveis discretas, com base nos outros atributos do conjunto de dados. Um exemplo de um algoritmo de classificação é Algoritmo Árvores de Decisão da Microsoft.
- Algoritmos de regressão prevêm uma ou mais variáveis contínuas, como lucro ou perda, com base nos outros atributos do conjunto de dados. Um exemplo de um algoritmo de regressão é Algoritmo MTS.
- Algoritmos de segmentação dividem dados em grupos ou clusters de itens que têm propriedades semelhantes. Um exemplo de um algoritmo de segmentação é Algoritmo Microsoft Clustering.
- Algoritmos de associação encontram correlações entre atributos diferentes em um conjunto de dados. A aplicação mais comum desse tipo de algoritmo é para criar regras de associação, que podem ser utilizadas em uma análise de cesta básica. Um exemplo de um algoritmo de associação é Algoritmo Associação da Microsoft.
- Algoritmos de análise de seqüência resumem sequências frequentes ou episódios em dados, como um fluxo de caminho da Web. Um exemplo de um algoritmo de seqüência é Algoritmo MSC.
Para aplicação dos algoritmos de Data Minig, deve-se realizar uma seleção minuciosa para que seja realizada a melhor escolha, por exemplo, escolha do melhor algoritmo para uma tarefa empresarial específica pode ser um desafio. Embora possam ser utilizados algoritmos diferentes para executar a mesma tarefa empresarial, cada algoritmo produz um resultado diferente e alguns podem produzir mais de um tipo de resultado. Por exemplo, pode-se usar o algoritmo Árvores de Decisão da Microsoft não apenas para previsão, mas também como uma maneira de reduzir o número de colunas em um conjunto dados uma vez que a árvore de decisão pode identificar colunas que não afetam o modelo de mineração final.
Não é necessária utilizar algoritmos independentementes. Em uma solução de mineração de dados, é possível usar alguns algoritmos para explorar dados e, em seguida, usar outros algoritmos para prever um resultado específico com base nesses dados. Por exemplo, pode-se usar um algoritmo de cluster, que reconhece padrões, para dividir dados em grupos que são mais ou menos homogêneos e, em seguida, usar os resultados para criar um modelo de árvore de decisão melhor. É comum utilizer-se vários algoritmos em uma solução para executar tarefas separadas, por exemplo, usando um algoritmo de árvore de regressão para obter informações de previsão financeira e um algoritmo com base em regras para executar uma melhor análise de cesta básica. Os modelos de mineração podem prever valores, produzir resumos de dados e localizar correlações ocultas [Elmasri, R., Navathe, S. B. 2011].
4. Aplicações de Data Mining
As aplicações em Data Mining, segundo Ronaldo Goldschmidt e Eduardo Bezerra, desenvolvem etapas nas quais são desempenhadas diversas tarefas que justificam os métodos utilizados na mineração de dados.
Estas etapas desenvolvem as tarefas conforme descritas a seguir [GOLDSCHMIDT, Ronaldo e BEZERRA, Eduardo, 2016]:
A Descoberta de Associações é uma tarefa onde, cada registro do conjunto de dados é normalmente chamado de transação. Cada transação é composta por um conjunto de itens. A tarefa de descoberta de associações compreende a busca por itens que frequentemente ocorrem de forma simultânea em uma quantidade mínima de transações do conjunto de dados. Um exemplo clássico da aplicação dessa tarefa é na área de Marketing. Em particular, uma história que já virou mito na área de Data Mining e, para a qual não consegue-se encontrar uma fonte fidedigna de sua veracidade. É o das cervejas e fraldas: durante um processo de Descoberta de Associações em sua base de dados, uma grande rede de mercados norte-americana descobriu que um número razoável de compradores de fralda também comprava cerveja na véspera de finais de semana. Por meio de uma análise das transações de compra, os analistas de dados perceberam que os compradores eram homens e que, ao comprarem fraldas para seus filhos, compravam também cerveja para consumo enquanto cuidavam das crianças e assistiam aos jogos na televisão durante o final de semana. Este exemplo ilustra a associação entre fraldas e cervejas. De acordo com a história, essa empresa utilizou o novo conhecimento para aproximar as gôndolas de fraldas e cervejas na rede de mercados, incrementando assim a venda conjunta dos dois produtos.
A Classificação em Data Mining é a tarefa em que, os atributos do conjunto de dados são divididos em dois tipos. Cada atributo do primeiro tipo é denominado atributo previsor. O segundo tipo, para o qual há apenas um atributo, é denominado atributo alvo. Para cada valor distinto do atributo alvo tem-se uma classe que normalmente corresponde a um rótulo categórico pertencente a um conjunto pré-definido. A tarefa de Classificação consiste em descobrir uma função que mapeie um conjunto de registros em um conjunto de classes. Uma vez descoberta, tal função pode ser aplicada a novos registros de forma a prever a classe em que tais registros se enquadram. Como exemplo, considera-se uma financeira que possui o histórico de seus clientes e o comportamento destes em relação ao pagamento de empréstimos contraídos previamente. Considera-se ainda, dois tipos de clientes: adimplentes e inadimplentes. Estas são as classes do problema e os valores do atributo alvo. Uma aplicação da tarefa de Classificação, neste caso, consiste em descobrir uma função que mapeie corretamente os clientes, a partir de seus dados e dos valores dos atributos previsores, em uma destas classes. Tal função pode ser utilizada para prever o comportamento de novos clientes que desejem contrair empréstimos junto à financeira. Esta função pode ser incorporada a um sistema de apoio à decisão que auxilie na filtragem e concessão de empréstimos somente a clientes classificados como bons pagadores.
A Regressão, compreende a busca por uma função que mapeie os registros de um banco de dados em um intervalo de valores numéricos reais. Esta tarefa é similar à tarefa de Classificação, com a diferença de que o atributo alvo assume valores
...