Comparação de técnicas de aprendizagem automática para o Diagnóstico da Doença da Soja

Por: Lidieisa • 27/10/2018 • 1.071 Palavras (5 Páginas) • 507 Visualizações

Página 1 de 5

...

parte do output do Weka.

DATA MINING: CLASSIFICADORES BAYSIANOS e Aprendizagem Baseada Instancias (KNN)

Nesta fase se faz aprendizagem do classificador, com vista

ao objectivo pretendido (descrever ou predizer). Como já

foi dito ao inicio, pretende-se induzir dois classificadores com vista a saber por meio de comparação qual faz melhor a detenção de doenças na soja. É portanto aqui que definimos o nosso objectivo, o modelo e o algoritmo de aprendizagem.Uma vez pretendido o classificador que prediga com alta precisão a dentenção de doenças na soja, para tal iremos construir um modelo de classificação

supervisionada. Neste trabalho optamos por fazer um estudo de comparação sobre classificadores bayesianos e AprendizagemBaseadaInstancias (KNN).

Classificadores Bayesianos:

É uma técnica probabilística baseada no teorema de Bayes.

-Se encontram entre as abordagens mais praticas a

certos tipos de problemas;

– Desde o ponto de vista teorico, proporcionam umaperspectiva util para a analise de varios metodos de aprendizagem.

K- NearestNeighbor(KNN):

É um método de classificação de objectos que tem por base K exemplos de treino mais próximos do objecto a classificar.

MEDIDAS DE DESEMPENHO

Com o objectivo de determinar qual o melhor classificador, torna-se necessário

estabelecer a taxa de erro dos classificadores obtidos, para tal usamos como medida de desempenho:

• Cross Validation

TREINANDO OS ALGORITMOS

• Naive Bayes

Com vista a determinar qual melhor classificador primeiramente começamos por treinar o algoritmo Naive Bayes, fizemos a converçãos dos atributos para valores booleanos. Utilizamos como opção de teste o Cross-Validation(10) no valor padrão para melhor precisão de classificação, como mostra a imagem a seguir respectivamente com o resultado da classificação:

• K- NearestNeighbor(KNN)

Ao treinar com o algoritmo KNN utilizamos para o valor de K=5, como opção de teste o Cross-Validation(10) no valor padrão, os resultados obtidos relativamente a escolha mostram-se na imagem a seguir:

RESULTADOS OBTIDOS

Nesta fase experimental pretende-se comparar os diferentes classificadores. Aplicou-se o Naive Bayes e o KNN com visa a determinar qual o melhor classificador, torna-se necessário estabelecer a taxa de erro dos classificadores.

O algoritmo Naive Baiyes teve uma taxa de sucesso de 93.265% o que corresponde a 637 instancias e uma taxa de erro de 6% que corresponde a 46 instâncias.

O algoritmo KNN teve uma taxa de sucesso de 89.8975 % o que corresponde a 614 instancias e uma taxa de erro de 10% correspondente a 69 instancias.

CONCLUSÃO

Com a elaboração desta comparação, observou-se que os algoritmos tiverem uma facilidade em classificar a detenção da doença, embora apresentam resultados distintos, sendo que o Naive Bayes classificou melhor que o KNN, tendo uma taxa de erro aproximada a 8% o que chega a ser satisfatório.

REFERENCIAS BIBLIOGRAFICAS

http://storm.cis.fordham.edu/~gweiss/data-mining/weka-data/soybean.arff

http://MachineLearningMastery.com

A COMPUTER-BASED ADVISORY SYSTEM FOR DIAGNOSING SOYBEAN DISEASES IN ILLINOIS BY R.S Michalski

...

Baixar como txt (6.2 Kb) pdf (57.5 Kb) docx (15.1 Kb)

Continuar por mais 4 páginas »

Ler documento completo Salvar

Disponível apenas no Essays.club