Comparação de técnicas de aprendizagem automática para o Diagnóstico da Doença da Soja
Por: Lidieisa • 27/10/2018 • 1.071 Palavras (5 Páginas) • 312 Visualizações
...
parte do output do Weka.
DATA MINING: CLASSIFICADORES BAYSIANOS e Aprendizagem Baseada Instancias (KNN)
Nesta fase se faz aprendizagem do classificador, com vista
ao objectivo pretendido (descrever ou predizer). Como já
foi dito ao inicio, pretende-se induzir dois classificadores com vista a saber por meio de comparação qual faz melhor a detenção de doenças na soja. É portanto aqui que definimos o nosso objectivo, o modelo e o algoritmo de aprendizagem.Uma vez pretendido o classificador que prediga com alta precisão a dentenção de doenças na soja, para tal iremos construir um modelo de classificação
supervisionada. Neste trabalho optamos por fazer um estudo de comparação sobre classificadores bayesianos e AprendizagemBaseadaInstancias (KNN).
Classificadores Bayesianos:
É uma técnica probabilística baseada no teorema de Bayes.
-Se encontram entre as abordagens mais praticas a
certos tipos de problemas;
– Desde o ponto de vista teorico, proporcionam umaperspectiva util para a analise de varios metodos de aprendizagem.
K- NearestNeighbor(KNN):
É um método de classificação de objectos que tem por base K exemplos de treino mais próximos do objecto a classificar.
MEDIDAS DE DESEMPENHO
Com o objectivo de determinar qual o melhor classificador, torna-se necessário
estabelecer a taxa de erro dos classificadores obtidos, para tal usamos como medida de desempenho:
• Cross Validation
TREINANDO OS ALGORITMOS
• Naive Bayes
Com vista a determinar qual melhor classificador primeiramente começamos por treinar o algoritmo Naive Bayes, fizemos a converçãos dos atributos para valores booleanos. Utilizamos como opção de teste o Cross-Validation(10) no valor padrão para melhor precisão de classificação, como mostra a imagem a seguir respectivamente com o resultado da classificação:
• K- NearestNeighbor(KNN)
Ao treinar com o algoritmo KNN utilizamos para o valor de K=5, como opção de teste o Cross-Validation(10) no valor padrão, os resultados obtidos relativamente a escolha mostram-se na imagem a seguir:
RESULTADOS OBTIDOS
Nesta fase experimental pretende-se comparar os diferentes classificadores. Aplicou-se o Naive Bayes e o KNN com visa a determinar qual o melhor classificador, torna-se necessário estabelecer a taxa de erro dos classificadores.
O algoritmo Naive Baiyes teve uma taxa de sucesso de 93.265% o que corresponde a 637 instancias e uma taxa de erro de 6% que corresponde a 46 instâncias.
O algoritmo KNN teve uma taxa de sucesso de 89.8975 % o que corresponde a 614 instancias e uma taxa de erro de 10% correspondente a 69 instancias.
CONCLUSÃO
Com a elaboração desta comparação, observou-se que os algoritmos tiverem uma facilidade em classificar a detenção da doença, embora apresentam resultados distintos, sendo que o Naive Bayes classificou melhor que o KNN, tendo uma taxa de erro aproximada a 8% o que chega a ser satisfatório.
REFERENCIAS BIBLIOGRAFICAS
http://storm.cis.fordham.edu/~gweiss/data-mining/weka-data/soybean.arff
http://MachineLearningMastery.com
A COMPUTER-BASED ADVISORY SYSTEM FOR DIAGNOSING SOYBEAN DISEASES IN ILLINOIS BY R.S Michalski
...