RELATÓRIO EXECUTIVO GERAL DE ANÁLISE DE DADOS PESAGEM E VARRIÇÃO
Por: Salezio.Francisco • 5/10/2018 • 2.404 Palavras (10 Páginas) • 434 Visualizações
...
Primeiramente foi feita a análise da qualidade do banco de dados original do SLU de entulho no Distrito Federal por cada grupo de pesagem e em seguida, uma padronização para facilitar as futuras analises. Assim que a padronização foi feita, cada grupo definiu suas respectivas analises. As análises feitas foram as seguintes:
- MÉTODO DE PESQUISA
O tema de pesagem e de varrição usa como base banco de dados disponibilizado pelo SLU sobre, sendo então uma pesquisa analítica. Com isso, conclusões e sugestões de melhoria foram levantadas e a análise da qualidade do banco de dados originais também foi feita com base em teorias de qualidade de banco de dados do DataFlux, empresa de excelência em gestão de dados.
- PESAGEM
- ANÁLISE DA QUALIDADE DO BANCO DE DADOS DE ENTULHO
Para podermos analisar a qualidade do banco de dados que o Serviço de Limpeza Urbana (SLU) forneceu, é necessário que primeiro observamos o processo que gera este banco de dados para podermos estabelecer expectativas dos dados e avaliar os seis aspectos definidos pelo DataFlux em seu livro, Observing Data Quality Service Level Agreements.
Observamos o processo de pesagem do lixo na visita ao Lixão, da seguinte forma, caminhões entravam com o lixo sobre uma balança na qual mede seu peso e o expõe em um aparelho. O funcionário do SLU da pesagem digita a placa do caminhão além de outras informações como tipo de lixo e de onde vem o lixo e o peso. Assim, o caminhão entra no lixão, despeja o lixo e retorna a mesma balança. Na segunda vez na balança, o funcionário digita a placa novamente e imprime um recibo com informações do tipo horário de entrada e saída, placa, tipo de lixão, origem do lixo, peso de entrada e de saída e peso liquido. Assim, após 24 horas, outro funcionário do SLU recole todos os recibos acumulados, e passa algumas informações de cada recibo para um banco de dados digitalizado, na qual este temos acesso.
De acordo com o artigo Observing Data Quality Service Level Agreetments, podemos avaliar a qualidade de um banco de dados de acordo com seis dimensões principais, acurácia, completude, atualidade, razoabilidade, consistência estrutural e capacidade de identificação. Ao analisarmos o banco de dados de 2013 e 2014 do processo de pesagem em cada aspecto, podemos assim avaliar a qualidade do banco de dados.
A acurácia do banco de dados estar ligado a quanto os dados refletem a realidade na qual ele se propõe a representar. Ou seja, o quanto o banco de dados da pesagem representa a real quantidade de lixo que o Lixão recebe. Após analisar o banco de dados, podemos perceber que ao longo dos dois anos, existem dias que não possuem dados nenhum. Porém, na visita ao Lixão do Jóquei, foi informado que o lixão estar aberto e recebendo lixo 24 horas por dia, todos os dias. Isto evidencia que o banco de dados não representa a realidade do processo de pesagem, cuja compromete a veracidade do banco de dados.
A completude do banco de dados refere se a atributos em um banco de dados. Isto pode ser avaliado em três níveis, atributos obrigatórios, atributos opcionais, atributos inaplicáveis. No caso do banco de dados do SLU, avaliamos todos os atributos como obrigatório pois é necessário que preencha todas as informações, assim como, todo caminhão possui um dado de cada atributo.
A atualidade do banco de dados reflete o quanto o banco de dados estar em dia. Como descrito acima, o processo todo é manual, o que pode causar atrasos na transferência de informações. Hoje em dia, existe tecnologia suficiente para que este processo seja tudo digitalizado e automático para que a sincronia de informações aconteça mais rápido e com facilidade.
A dimensão que mede o quanto as informações do banco de dados fazem sentido com o que este representa é a razoabilidade. Ao observarmos o banco de dados, podemos ver que existem incoerência como repetição de entradas e muitas entradas com exatamente o mesmo peso o que é raro de acontecer, o que também compromete a qualidade do banco de dados
Os dados que temos acesso de 2013 e 2014 possuem somente as informações de peso liquido, tipo de caminhão, origem do lixo, data e empresa coletora. A análise da consistência estrutural é feita a partir dos dados que possuem uma estrutura definida. Por exemplo, placa de caminhão é constituída por três letras e quatro números, nessa ordem. Se no banco de dados, essa estrutura não é mantida, isso evidencia a baixa qualidade dos dados.
A capacidade de identificar mede a facilidade de localizar um certo dado ou conjunto de dados em um banco de dados. Ou seja, a facilidade que temos de achar um registro com qualquer informação inicial. O banco de dados do SLU é dividido por dia, então cada dia tem uma aba diferente e cada mês um documento diferente. Com essa quantidade de documentos e de abas, é difícil localizar o documento desejado. Por exemplo, para localizar um caminhão e obter informações sobre este, é preciso abrir todos os documentos e entrar em cada aba para procurar pelo caminhão desejado. A forma como as informações estão dispostas dificulta este tipo de acesso a informações.
Além da análise das dimensões, podemos analisar a qualidade do banco de dados, pelo processo de controle do banco de dados. Apesar de esforços para assegurar a qualidade do banco de dados em todos os aspectos, é inevitável erros requeridos de atenção e remediação. Porém, se podermos identificar estes erros o quão antes no processo podemos resolver em um tempo razoável para evitar a mal qualidade dos dados. Ao observar o processo que gera o banco de dados, podemos perceber vários pontos critico na qual podem originar erros pelo fato do processo ser praticamente manual. Tanto na hora de registrar o dado na entrada e saída do caminhão quanto na hora de transferir os dados do dia para o banco de dados digital. Se pudermos inserir um sistema na qual identifica estes erros de razoabilidade e completude, evitaremos muitos erros que prejudicam a qualidade do banco de dados.
- ANÁLISE DO TEMA DE PESAGEM
O grupo de pesagem, após a análise da qualidade dos dados, foi decidido uma padronização para um novo banco de dados de pesagem para facilitar as análises de cada grupo. Assim, cada grupo ficou responsável por 4 meses de um ano para formatar de acordo com a padronização decidida.
Com isso, as análises puderam ser feitas com mais facilidade. Cada grupo ficou responsável por uma análise de acordo com a tabela
...