Redes Neuronales Artificiales Aplicado A La Industria Alimentaria
August 20, 2022 | Author: Anonymous | Category: N/A
Short Description
Download Redes Neuronales Artificiales Aplicado A La Industria Alimentaria...
Description
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA ESCUELA DE POST GRADO
Maestría en Tecnología de Alimentos
Curso: Ingeniería de alimentos Avanzada
Trabajo Final REDES NEURONALES ARTIFICIALES APLICADO A LA
“
INDUSTRIA ALIMENTARIA ”
I.
INTRODUCCIÓN
Figura N°01: representación de la neurona Biológica
Figura N°02: representación de la neurona Biológica a la neurona artificial
Las neuroredes ser caracterizan principalmente por:
Tener una inclinación natural a adquirir el conocimiento a través de la
experiencia, el cual es almacenado, al igual que en el cerebro, en el peso relativo de las conexiones interneuronales.
Tienen una altísima plasticidad y gran adaptabilidad, son capaces de cambiar
dinámicamente junto con el medio.
Poseen un alto nivel de tolerancia a fallas, es decir, pueden sufrir un daño
considerable y continuar teniendo un buen comportamiento, al igual como ocurre en los sistemas biológicos.
Tener un comportamiento altamente no-lineal, lo que les permite procesar
información procedente de otros fenómenos no-lineales.
II.
DEFINICIÓN DEL PROBLEMA A RESOLVER Se tiene una serie de vinos sin clasificar (1, 2 o 3) basadas en datos analíticos de pruebas fisicoquímicas realizadas a distintos vinos.
Puesto que dicha
clasificación está establecida por su categoría de consumidores y por ende el costo que pagan por él.
Se desea que la red neuronal sea capaz de identificar correctamente la clasificación de los vinos basados en una serie de variables independientes numéricas (datos de pruebas fisicoquímicas)
III.
JUSTIFICACION
Este conjunto de datos incluye datos sobre diferentes vinos. Cada vino se clasifica como 1, 2 o 3, y el objetivo de la red neuronal es clasificar cada vino según uno de estos tipos, basándose en los valores de varias variables químicas. En este caso, la variable dependiente es categórica (aunque se exprese mediante un código numérico) y todas las variables explicatorias son numéricas.
El conjunto de datos ya se ha dividido en datos de entrenamiento (151 casos), datos de prueba (27 casos) y datos de predicción (2 casos). c asos). Tras crear cr ear los l os conjuntos de datos de
NeuralTools en las tres hojas siguientes, se realizó el entrenamiento con los datos de entrenamiento, utilizando el método de red PN/GRN, con los resultados que se muestran en la primera hoja de resumen. Tal como se indica, los 151 casos se clasificaron correctamente. Además, se utilizó la opción "Calcular impactos de variable" y puede ver los resultados en la primera hoja de resumen. Muestra cuáles de las variables explicatorias parecen tener los mayores impactos sobre las clasificaciones, aunque este orden puede ser bastante sensible a los datos elegidos para el entrenamiento.
A continuación, se realizaron las pruebas con los datos de prueba, en los que se conocen los valores de la variable dependiente. Tal como se muestra a la derecha de los datos de pruebas y también en la segunda hoja de resumen, la red neuronal entrenada clasifica correctamente todos estos casos salvo uno.
Por último, se realizó la predicción en los casos de los datos de predicción, con las predicciones que aparecen a la derecha de dicho conjunto de datos. Dado que no se conocen los valores de la variable dependiente de este conjunto, no hay manera de saber si las predicciones son precisas, pero puede confiar bastante en estas predicciones, dado el nivel de éxito obtenido en los conjuntos de datos de entrenamiento y prueba.
IV.
METODOLOGÍA
El modelamiento se realizará mediante el uso de la metodología de redes neuronales, la cual se llevará a cabo mediante la herramienta informática NeuralTools® versión de prueba (duración 15 días) (Pallisade, 2015) complementada con el software Microsoft Excel.
NeuralTools® es una potente herramienta flexible y fácil de usar para hacer predicciones inteligentes basadas en datos, directamente en Excel. Y lo hace analizando las complejas relaciones que existen entre los datos usando redes neuronales (o redes). Una red neuronal es parecida a una ecuación de regresión, pero las variables dependiente (objetivo) e independiente (explicatoria) pueden ser numéricas o de categoría, incluso de texto, y las relaciones estimadas pueden ser lineales o absolutamente no lineales.
Los grupos de datos de NeuralTools tienden a ser mayores, por lo tanto normalmente es posible dividirlos en tres subgrupos: uno para entrenar la red, uno para comprobación (en el que los valores de la l a variable dependiente son conocidos) y uno para la predicción (en el que los valores de la variable dependiente son desconocidos) (Pallisade, 2015).
Por lo que, el análisis que se realizará con el software NeuralTools® se van a emplear datos de pruebas fisicoquímicas realizadas realiz adas a una muestra de 150 vinos.
http://www.palisade-lta.com/neuraltools/, http://www.palisade-lta.com/neuraltools/, pagina donde se descarga el paquete del programa.
V.
ELABORACIÓN DEL MODELO
Figura 3: Iconos a Ejecutar Excel y NeuralTools Una vez ejecutados, existe dentro de las pestañas principales, la pestaña de
NeuralTools.
Figura 4: Cuadro de dialogo de NeuralTools
Figura 5: Cuadro de dialogo de NeuralTools Para Datos
Para toda base de datos el primer paso para empezar a ejecutar el programa, es
necesario: activar el cuadro de Administrador de conjuntos de Datos.
Es necesario activar este cuadro para poder especificar cada variable como lo
muestra la figura siguiente:
Figura 6: Cuadro de dialogo de Administrador de conjuntos de Datos. Como se aprecia en la Figura Figura 5, primero debemos dar nombre a nuestro conjunto de
datos, luego dar el rango (seleccionar nombres de variables y datos).
Luego clasificar el tipo de variables:
Categoría independiente: cualitativa para datos de ingreso Categoría dependiente: cualitativa para datos de salida Numérica independiente: cuantifica para datos de ingreso Numérica dependiente: cuantifica para datos de salida Etiqueta: solo para mencionar Sin usar: variable que no se procesa
Las variables dependientes son para las variables a predecir, que ya según sea el
caso puede ser numérica o de categoría.
Luego de aceptar el encabezado de cuadro con los nombres de las variables cambia
de color a celeste.
Esto se tiene que hacer para las hojas de (aprender-probar y predecir), pueden ser
hojas por separado o en una sola hoja Excel, según lo revisado es mejor repartir en dos hojas. Hoja 1, entrenar y probar. (Al entrenar con la cantidad de datos que se tenga se puede destinar un 20 % a más para probar probar y verificar el porcentaje de error). Hoja 2, hoja de datos a con las variables independientes y los datos a predecir.
Figura 7: Cuadro de dialogo de Opciones de Visor de datos Este cuadro de dialogo es para verificar todos los datos de estadística necesarios
para tomar decisiones.
Figura 8: Cuadro de datos de entrenamiento y prueba son un total de 150 datos
Figura 9. Cuadro de diálogo de redes neuronales.
Figura 10. Cuadro de diálogo entrenamiento En este cuadro de dialogo se planea entrenar y probar, activando el check es probar,
se puede dar el porcentaje que se requiere para probar,
Se puede activar el check de predecir, pero para fines prácticos es mejor hacerlo en otra hoja Excel.
Figura 11. Cuadro de diálogo entrenamiento (configuración de red) Se tiene dos opciones Red PN/GRN y Red MLF, para procesos de la industria alimenticia se
recomienda la primera Red. En la pestaña tiempo de ejecución, se deja los datos definidos por defecto.
Accionar la pestaña siguiente.
Figura 12. Cuadro de diálogo de previsualizar de entrenamiento. En el cuadro de error y advertencia es recomendable que no aparezca ningún
mensaje.
Posteriormente se acciona entrenar.
Luego de entregar aparece 5 columnas en el mismo Excel
Figura 12. Base de datos de entrenamiento y probar, columnas que aparecen a la derecha, que corresponde al 20% de los 150 datos (30 datos)
Cuadro 1. Datos resumen después de ejecutar el entrenamiento y probar la base de datos. Resumen Información de red
Nombre Configuración
Red entrenada en Datos de entrenamiento Predicción de categoría PNN
Localización
Este libro de trabajo
Variable de categoría independiente
0
Variables numéricas independientes
11 (Alcohol, Ácido málico, Ceniza, Alcalinidad de ceniza, Magnesio, Total de fenoles, Flavonoides, Fenoles no flavonoides, Proantocianinas, Intensidad del color, Prolina)
Variable dependiente
Var. de categoría (Tipo de vino)
Entrenando
Número de casos
120
Tiempo de Entrenamiento
00:00:00
Número de pruebas
132
Razón de la parada
Auto-Parada
% de predicciones incorrecta incorrectass
0.0000%
Probabilidad incorrecta media
0.0000%
Desviación estándar de probabilida probabilidad d incorrecta
0.0001%
Probando
Número de casos
30
% de predicciones incorrecta incorrectass
6.6667%
Probabilidad incorrecta media
6.4818%
Desviación estándar de probabilida probabilidad d incorrecta
21.1377%
Conjunto de datos
Nombre
Datos de entrenamiento
Número de filas
150
Etiquetas manuales de caso
NO
Análisis de impacto de variable variable
Alcalinidad de ceniza
27.9053%
Flavonoides
21.4407%
Proantocianinas
14.9250%
Alcohol Prolina
11.8715% 10.9526%
Ceniza
6.9911%
Intensidad del color
4.0321%
Ácido málico
1.8571%
Fenoles no flavonoides
0.0228%
Magnesio
0.0013%
Total de fenoles
0.0004%
Este cuadro Excel aparece en un Excel parte después de haber ejecutado el entrenamiento
y prueba de datos, en este cuadro se aprecia datos estadísticos que son fundamentales para analizar y tomar decisiones sobre esta parte. Sobre todo las predicciones, es importante notar el porcentaje de error.
Cuadro 2. Datos de matriz de clasificación para par a entrenamiento y prueba Matriz de clasificación (para casos de entrenamient entrenamiento) o) 1
1 40
2 0
3 0
Incorrecto (%) 0.0000%
2
0
46
0
0.0000%
3
0
0
34
0.0000%
Matriz de clasificación (para casos de prueba) 1
1 8
2 0
3 0
Incorrecto (%) 0.0000%
2
1
11
1
15.3846%
3
0
0
9
0.0000%
Datos de matriz que son necesarios para saber cuál es porcentaje de resultados de prueba
incorrectos, y saber si es necesario adicionar más datos de entrenamiento o cambiar las variables.
Figura 13. Este cuadro aparece después de entrenar y probar Si se desea tener más datos estadísticos se acciona sí, pero esto demora unos minutos.
Figura 12. Base de datos a predecir 30 en total la columna de tipo de vino se encuentra vacío.
Figura 13. Cuadro de dialogo para accionar predecir
Figura 14. Cuadro de dialogo para predecir Se acciona el check todos los casos y colocar la predicción de color c olor valores de predicción
Luego se acciona siguiente
Figura 15. Cuadro de diálogo de previsualizar para predecir. En el cuadro de error y advertencia es recomendable que no aparezca ningún
mensaje.
Posteriormente se acciona predecir.
Figura 16. Cuadro de datos con los datos predichos, con un alto porcentaje de acierto. Cuadro 3. Resultados de predicción Informe de predicción: "Red entrenada en Datos de entrenamiento"
Etiqueta usada predecir predecir predecir predecir predecir predecir predecir
Predicción Predicción% 1 100.00% 1 100.00% 1 99.99% 1 100.00% 1 100.00% 1 100.00% 1 100.00%
predecir predecir predecir predecir predecir predecir predecir
1 1 1 1 2 2 3
100.00% 100.00% 100.00% 100.00% 78.07% 99.96% 75.86%
predecir predecir predecir predecir predecir predecir predecir predecir predecir predecir predecir predecir
2 2 2 2 2 2 2 2 2 3 3 3
100.00% 100.00% 99.90% 99.98% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00%
predecir
3
100.00%
Solo dos datos de la predicción tienen un porcentaje de predicción alrededor del
75%, esto habla del alto porcentaje de acierto que tiene t iene este programa.
Para interpretar los resultados se puede usar los datos estadísticos, pero es esencial
conocer que al ejecutar el programa es que solo se puede obtener una variable respuesta (numérica o de categoría)
A mayor base de datos para entrenamiento, mayor precisión de acierto se tiene en
los resultados de predicción.
A mayor cantidad de variables mayor será el porcentaje de predicción.
VI.
REFERENCIAS BIBLIOGRÁFICAS Cortez, P; Cerdeira, A; Almeida, F; Matos, T; Reis, J. . 2009. Modeling wine preferences by data d ata mining from physicochemical properties. Decision Support Systems 47(4): 547-553.
Cárdenes, R.. 2015. Inteligencia Artificial – Redes Neuronales. Disponible en: http://www2.ulpgc.es/hege/almacen/download/38/38584/practica_ia_2.pdf
PALLISADE. 2015. NeuralTools® versión de prueba. Disponible en: http://www.palisade-lta.com/neuraltools/
Cortez, P. 2009. UCI Machine Learning Repository. University of California. School of Information and Computer Science. Irvine. California. Disponible en: http://archive.ics.uci.edu/ml/datasets/Wine+Quality
View more...
Comments