O que é data mining ?
Por: Rodrigo.Claudino • 12/1/2018 • 1.415 Palavras (6 Páginas) • 414 Visualizações
...
Exemplos do Mundo Real
Associações à procura de padrões em que um evento é conectado a um outro evento. O exemplo a cerveja-fralda é um exemplo de mineração associativa. Um exemplo clássico da aplicação dessa tarefa é na área de Marketing. Em particular, uma história que já virou folclore na área de Data Mining é o das cervejas e fraldas: durante um processo de Descoberta de Associações em sua base de dados, uma grande rede de mercados norte-americana descobriu que um número razoável de compradores de fralda também comprava cerveja na véspera de finais de semana. Por meio de uma análise das transações de compra, os analistas de dados puderam perceber que os compradores eram homens que, ao comprarem fraldas para seus filhos, compravam também cerveja para consumo enquanto cuidavam das crianças e assistiam aos jogos na televisão durante o final de semana. Este exemplo ilustra a
associação entre fraldas e cervejas. De acordo com a história, essa empresa utilizou o novo conhecimento para aproximar as gôndolas de fraldas e cervejas na rede de mercados, incrementando assim a venda conjunta dos dois produtos.
● Agrupamento (Clusterização): encontrar e documentar visualmente grupos de fatos não previamente conhecidos
Por exemplo, os dados podem ser extraídos para identificar segmentos de mercado ou afinidades de consumo.
Consiste em segmentar os registros do conjunto de dados em subconjuntos ou clusters, de tal forma que os elementos de um cluster compartilhem propriedades comuns que os distingam de elementos nos demais clusters. por exemplo, agrupar clientes com comportamento de compra similar, a fim de melhor recomendar novos produtos para esses clientes.
● Descoberta de Sequências: - à procura de padrões em que um evento leva a um outro evento mais tarde Por exemplo, um varejista de equipamentos ao ar livre poderia prever a probabilidade de uma mochila que está sendo comprado com base na compra de sacos de dormir e sapatos de caminhada do consumidor.o propósito é identificar itens frequentes considerando um determinado período de tempo. considerar a ordem em que os produtos são comprados ao longo do tempo.
Previsão - descobrir padrões nos dados que podem levar a previsões razoáveis sobre o futuro (Esta área de mineração de dados é conhecida como análise preditiva.) Uma série temporal é um conjunto de observações de um fenômeno (variável numérica) ordenadas no tempo. Exemplos de séries temporais: o consumo mensal de energia elétrica de uma casa, registrado durante um ano ou as vendas diárias de um produto no decorrer de um mês, dentre muitos outros. A previsão de uma série temporal tem como objetivo inferir valores que a variável da série deverá assumir no futuro considerando como base valores passados dessa série.
Questões de privacidade
Todas informações depositadas em um banco de dados, onde as pessoas podem acessar.
E se cada telefone chamada que você faz, cada compra de cartão de crédito que você faz, todos os voos que você toma, a cada visita ao médico que você faz, cada cartão de garantia que você enviar, a cada pedido de emprego que você preencher, cada registro da escola que você tem, o seu crédito registro, cada página da web que você visita ... foi tudo recolhidos juntos? Um monte seria conhecido sobre você! Esta é uma possibilidade por demais real. Grande parte deste tipo de informação já está armazenado em um banco de dados. Lembre-se que você deu entrevista por telefone a uma empresa de marketing na semana passada? As suas respostas entrou em um banco de dados. Lembre-se que pedido de empréstimo que você preencheu? Numa base de dados. Muita informação sobre muitas pessoas para ninguém a fazer sentido? Não com ferramentas de mineração de dados em execução em computadores de processamento massivamente paralelo! Você se sentiria confortável sobre alguém (ou lotes de alguém) com acesso a todos esses dados sobre você? E lembre-se, todos estes dados não tem
que residir em um local físico; como a rede cresce, informações deste tipo torna-se mais acessível a mais pessoas.
Dados Ricos, pobres de informação
A quantidade de dados brutos armazenados em bancos de dados corporativos está explodindo. A partir de trilhões de transações e compras com cartão de crédito para imagens pixel-por-pixel de galáxias de ponto-de-venda, bancos de dados são agora medido em gigabytes e terabytes. (Um terabyte = um trilhão de bytes.
Um terabyte equivale a cerca de 2 milhões de livros!) Por exemplo, todos os dias, o Wal-Mart carrega 20 milhões de transações no ponto-de-venda a um sistema massivamente paralelo A & T com 483 processadores rodando um banco de dados centralizado . Os dados brutos por si só, no entanto,
...