Visualizar trabalho
- Cód. Trabalho: 2528 | Palavras-chave: Máquina de vetor suporte, Redes Neurais, Arvore de decisão, Regressão Logística, Vinho Tinto, Vinho Branco
- Título: Análise da qualidade de vinhos com o uso do Aprendizado de Máquinas
- Autor(es): Juliana A. Gualberto (UNESP-Botucatu), Bethina R. Camargo (UNESP-Botucatu), Elizabete J. Pinto (UNESP-Botucatu), Gustavo H. Tomanik (UNESP-Botucatu), Prof. Dr. Silvia H. M. G. da Silva (UNESP-Registro), Orientador: Prof. Dr. José S. Govone (UNESP-Rio Claro)
- Resumo:
Este trabalho comparou técnicas de aprendizado de máquinas, AM (Mitchell, 1998), aplicadas à avaliação da qualidade de vinhos, produzidos na região do Minho (Portugal), utilizando dados de testes analíticos disponíveis na etapa de certificação. O objetivo do trabalho foi comparar técnicas de AM: redes neurais artificiais (RNA), árvores de decisão (AD), máquinas de vetores de suporte (SVM) e regressão logística (RL); na classificação da qualidade do vinho, tendo como entrada 11 variáveis de propriedades relevantes na produção dos vinhos tinto e branco e, como saída, a variável qualidade.
Os dados estão disponíveis no site da UCI, sendo os conjuntos de dados com 1599 e 4898 amostras de vinho tinto e branco, respectivamente. Para as amostras de cada tipo de vinho, avaliadas sensorialmente com valores de 0 a 10, discretizaram-se os valores de 0 a 5, como a classe ruim e, de 6 a 10, como a classe bom. Para execução dos experimentos utilizou-se o software WEKA. Os resultados foram obtidos utilizando-se o método de amostragem 10-fold cross validation, para analisar o desempenho dos modelos. Para comparação das técnicas de AM, utilizaram-se as médias dos valores de acurácia, TDF e kappa, os quais foram próximos para a amostra vinho tinto. Já, analisando os resultados com a curva Roc, as técnicas que tiveram melhores desempenhos, segundo o critério de Hosner Lemeshow (1998), foram RN e RL, para ambos os conjuntos de dados. Por fim, este estudo permitiu concluir que os desempenhos dos métodos avaliados mostraram-se satisfatórios para ambos conjuntos de dados.