Essays.club - TCC, Modelos de monografias, Trabalhos de universidades, Ensaios, Bibliografias
Pesquisar

A Mineração na Web

Por:   •  22/2/2018  •  3.518 Palavras (15 Páginas)  •  257 Visualizações

Página 1 de 15

...

Há duas estratégias para a mineração de conteúdo: uma realiza a mineração diretamente do conteúdo dos documentos e a outra incrementa o poder de busca de outras ferramentas e serviços. Na primeira estratégia, os documentos pretendidos já foram recuperados e já estão prontos para serem minerados. Na segunda estratégia, a mineração de conteúdo ajudam às ferramentas e serviços de recuperação de informação.

2.3.2 Mineração de Estrutura

Na mineração de estrutura o importante são as informações que existem de forma implícita entre os documentos, envolve o que está por trás da interligação entre os documentos da web. O que liga esses documentos são os vínculos de hipertextos.

A Web pode ser entendida como um grafo orientado, onde os nós representam páginas, e as setas entrepares de nós representam vínculos entre as páginas. Essa representação da Web em forma de grafo apresenta uma forte semelhança com as chamadas redes sociais que, juntamente com a análise de citações, inspirou a pesquisa dessa categoria de mineração (MARINHO;GIRARDI,_ apud KUMAR, 2002).

Nas citações bibliográficas quando um artigo é bastante citado isso indica que provavelmente este é um artigo importante e de maior autoridade perante outros que abordam o mesmo tema. Acontece o mesmo com as páginas e documentos da Web. Os vínculos de hipertexto dão indicações interessantes de como as páginas se relacionam entre si, links apontando para uma página, por exemplo, podem indicar a sua importância, enquanto links “saindo” de uma página podem indicar entre outras coisas a continuação ou complemento dos tópicos abordados por ela (MARINHO;GIRARDI,_).

2.3.4 Mineração de Uso

A mineração de uso da Web focaliza-se em técnicas que possam prever o comportamento do usuário enquanto ele interage com a. Enquanto a mineração de conteúdo e a mineração de estrutura utilizam os dados reais ou primários da Web, a mineração de uso lida com os dados secundários provenientes da interação do usuário com a Web (MARINHO;GIRARDI,_ apud .KOSALA, 2000).

Os dados de uso da Web incluem dados provenientes de logs de servidores web, logs de servidores proxy, logs de browsers, perfis de usuário, cookies, seções ou transações de usuários, pasta favoritos, consultas do usuário, cliques de mouse e qualquer outro dado gerado pela interação do usuário com a Web. O processo de mineração de uso da Web pode ser classificado segundo duas abordagens. A primeira mapeia os dados de uso do servidor Web em tabelas relacionais. A segunda utiliza os dados de logs diretamente utilizando técnicas especiais de pré-processamento. Assim como no KDD, a limpeza e pré-processamento dos dados, aqui, é uma parte crucial do processo, pois a qualidade desses dados vai determinar a eficiência dos algoritmos de mineração (MARINHO;GIRARDI,_ apud. BORGES, 1998).

Alguns sites populares de comércio eletrônico já utilizam estas técnicas não só para a adaptação do site de acordo com o perfil do usuário, mas como para fazer recomendações de produtos de acordo com compras anteriores, ou baseadas na similaridade entre perfis de usuários (MARINHO;GIRARDI,_).

- DESCOBERTA DE CONHECIMENTO (KDD)

Os constantes avanços na área de Tecnologia da Informação têm viabilizado o armazenamento de grandes e múltiplas bases de dados. Tecnologias como a Internet, sisteas gerenciadores de banco de dados, leitores de códigos de barras são alguns exemplos de recursos que têm viabilizado a proliferação de inúmeras bases de dados de natureza comercial, administrativa, governamental e cientifica (GOLDSCMIDT, 2005).

Diante disso, surgem algumas questões que são apontadas por Goldschmidt (2005, p.1), “como: “O que fazer com todos os dados armazenados?”, “Como analisar e utilizar de maneira útil todo o volume de dados disponível?”, entre outras”.

Ainda nesse sentido, o autor afirma que a análise de grandes quantidades de dados pelo homem é inviável sem o auxílio de ferramentas computacionais apropriadas. Nesse sentido, torna-se necessário o desenvolvimento de ferramentas que auxiliem o homem na tarefa de analisar, interpretar e relacionar esses dados.

Para atender a esse contexto, surge uma nova área denominada Descoberta do Conhecimento em Base de Dados (Knowledge Discovery in Databases – KDD).

O termo KDD foi formalizado em 1989 em referência ao amplo conceito de procurar conhecimento a partir de bases de dados. Uma das definições mais populares foi proposta em 1996 por um grupo de pesquisadores: “KDD é um processo, de várias etapas, não trivial, interativo e iterativo, para identificação de padrões compreensíveis, válidos, novos e potencialmente úteis a partir de grandes conjuntos de dados” (GOLDSCHMIDT, 2005).

Da mesma forma, o autor caracteriza a Descoberta de Conhecimento em Base de Dados como um processo composto por várias etapas operacionais, como mostra a figura 1:

Figura 1: Etapas operacionais

Fonte: (Elaborada pelo autor).[pic 1]

A etapa de pré-processamento compreende as funções relacionadas à captação, à organização e ao tratamento de dados. Essa etapa tem por objetivo a preparação dos dados, para os algoritmos da etapa seguinte, a Mineração de Dados. Durante a etapa de Mineração de Dados, é realizada a busca efetiva por conhecimentos úteis no contexto da aplicação de KDD. A etapa de pós-processamento abrange o tratamento do conhecimento obtido na Mineração de Dados. Tal tratamento, nem sempre necessário tem por objetivo viabilizar a avaliação da utilidade do conhecimento descoberto (GOLDSCMIDT, 2005).

De acordo com Goldschmidt (2005, p. 06), “ As atividades na área do KDD podem ser organizadas em três grandes grupos: atividades voltadas ao desenvolvimento tecnológico, atividades de execução de processo KDD e atividades a aplicação de resultados”. Como é exemplificado a seguir:

- Desenvolvimento tecnológico: Esse item abrange todas as iniciativas de concepção, aprimoramento e desenvolvimento de algoritmos, ferramentas e tecnologias de apoio que possam ser utilizados na busca por novos conhecimentos em grandes bases de conhecimento.

- Execução de KDD: Esse item refere-se às atividades voltadas à busca efetiva de conhecimento em bases de dados. As ferramentas produzidas pelas atividades de desenvolvimento tecnológico são utilizadas na execução de processo de KDD.

-

...

Baixar como  txt (24.1 Kb)   pdf (80.3 Kb)   docx (23.3 Kb)  
Continuar por mais 14 páginas »
Disponível apenas no Essays.club