SAD RESUMO
Por: Lidieisa • 17/4/2018 • 1.201 Palavras (5 Páginas) • 282 Visualizações
...
[pic 2]
Data Warehouse: coleção de dados organizada de forma a responder eficientemente a perguntas que envolvem um grande quantidade de dados. Características: Orientado aos assuntos (OP: carro, perdas DW: clientes, indenização), integrado (dados consistentes A e B > AB), Variavel em relação ao tempo (dados históricos, 5 a 15 anos de dados é o normal), não é volátil (só carrega e acessa, não altera dados).
Popular um DW: um grande tempo é aplicado na carga dos dados operacionais para o dw, entre os procedimentos estão: limpeza(erros no operacional implicam erro no dw), integração(vários sistemas fonte), carga(copia inicial para o dw), atualização(copia incremental). A etapa de popular um DW pertence ao processo ETL (Extração, tratamento, carga de dados).
Data Mart é um subconjunto logico de um Data Warehouse completo. Data Wharehouse é uma união de vários Data Marts.
[pic 3]
Granularidade: nível de detalhe nas unidades de dados no DW. Quanto mais detalhe, mais baixo o nível de granularidade, maior volume de dados, maior tempo de processamento, maior complexibilidade de consultas. Ex de nível de detalhamento: por tempo (segundos, minutos, horas, dias, meses, anos).
[pic 4]
Níveis Duais de granularidade: para conseguir uma eficiência de armazenamento e acesso aos dados e ao mesmo tempo a possibilidade de analisar os dados em maior detalhe, usa-se diferentes níveis. Por exemplo, um gestor precisa ter em mãos a media dos rendimentos dos investimentos a cada hora, um total de 24 registros por dia, e também precise por ano, desta forma permite-se que armazene a mesma informação diária e sumarizada anualmente.
Ferramentas OLAP: consiste na atividade de questionar e apresentar informações a partir de um data warehouse.
Data Mining: mineração de dados, é o processo de extrair uma informação valida, previamente desconhecida e de máxima abrangência a partir de grandes bases de dados. Identifica padrões escondidos, implícitos em bases de dados.
OLTP: Sistemas que suportam o dia-a-dia da empresa. Caracteristicas: muitas transações, transações pequenas, registradas em tempo real. Ex de software transacionais: RH, vendas, estoque, contabilidade.
OLAP: permite uma analise de diferentes aspectos da atividade/desempenho da empresa.
Caracteristicas: poucas transações, grandes volumes de dados, apenas consultas e exploração de dados, dados provem de diferentes fontes de informação.
OLTP X OLAP: utilizadores diferentes, conteúdo diferenciado, estruturas de dados e a operação diferentes, gestão do sistema e software diferentes. OLTP o que acontece, OLAP o que pode acontecer.
[pic 5]
Metadados: são dados sobre os dados ou sobre a estrutura de dados. Funciona também como documentação, para cada atributo mantido no DW há uma entrada do dicionário de dados. Os dados são processados, atualizados e consultados partindo dos metadados. Os metadados englobam o DW e mantem informações sobre o que e onde estão os dados.
Os metadados devem relatar: a estrutura de dados segundo a visão do programador, dos analistas de SAD, a fonte de dados que alimenta o DW, a transformação sofrida pelos dados no momento de migração para o DW, o modelo de dados, histórico das extrações de dados.
Camadas de metadados: Operacional (definem a estrutura dos dados operacionais), DW (orientados por assunto, informam como os dados foram calculados e devem ser interpretados), Usuario (organiza os metadados no DW com base em conceitos familiares ao usuário).
...