Redes Neuronales Artificiales Aplicado A La Industria Alimentaria

August 20, 2022 | Author: Anonymous | Category: N/A

Share Embed Donate

Report this link

Short Description

Download Redes Neuronales Artificiales Aplicado A La Industria Alimentaria...

Description

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA ESCUELA DE POST GRADO

Maestría en Tecnología de Alimentos

Curso: Ingeniería de alimentos Avanzada

Trabajo Final REDES NEURONALES ARTIFICIALES APLICADO A LA

“

INDUSTRIA ALIMENTARIA ”

I.

INTRODUCCIÓN

Figura N°01: representación de la neurona Biológica

Figura N°02: representación de la neurona Biológica a la neurona artificial

Las neuroredes ser caracterizan principalmente por:

Tener una inclinación natural a adquirir el conocimiento a través de la



experiencia, el cual es almacenado, al igual que en el cerebro, en el peso relativo de las conexiones interneuronales.

Tienen una altísima plasticidad y gran adaptabilidad, son capaces de cambiar



dinámicamente junto con el medio.

Poseen un alto nivel de tolerancia a fallas, es decir, pueden sufrir un daño



considerable y continuar teniendo un buen comportamiento, al igual como ocurre en los sistemas biológicos.

Tener un comportamiento altamente no-lineal, lo que les permite procesar



información procedente de otros fenómenos no-lineales.

II.

DEFINICIÓN DEL PROBLEMA A RESOLVER Se tiene una serie de vinos sin clasificar (1, 2 o 3) basadas en datos analíticos de pruebas fisicoquímicas realizadas a distintos vinos.

Puesto que dicha

clasificación está establecida por su categoría de consumidores y por ende el costo que pagan por él.

Se desea que la red neuronal sea capaz de identificar correctamente la clasificación de los vinos basados en una serie de variables independientes numéricas (datos de pruebas fisicoquímicas)

III.

JUSTIFICACION

Este conjunto de datos incluye datos sobre diferentes vinos. Cada vino se clasifica como 1, 2 o 3, y el objetivo de la red neuronal es clasificar cada vino según uno de estos tipos, basándose en los valores de varias variables químicas. En este caso, la variable dependiente es categórica (aunque se exprese mediante un código numérico) y todas las variables explicatorias son numéricas.

El conjunto de datos ya se ha dividido en datos de entrenamiento (151 casos), datos de prueba (27 casos) y datos de predicción (2 casos). c asos). Tras crear cr ear los l os conjuntos de datos de

NeuralTools en las tres hojas siguientes, se realizó el entrenamiento con los datos de entrenamiento, utilizando el método de red PN/GRN, con los resultados que se muestran en la primera hoja de resumen. Tal como se indica, los 151 casos se clasificaron correctamente. Además, se utilizó la opción "Calcular impactos de variable" y puede ver los resultados en la primera hoja de resumen. Muestra cuáles de las variables explicatorias parecen tener los mayores impactos sobre las clasificaciones, aunque este orden puede ser bastante sensible a los datos elegidos para el entrenamiento.

A continuación, se realizaron las pruebas con los datos de prueba, en los que se conocen los valores de la variable dependiente. Tal como se muestra a la derecha de los datos de pruebas y también en la segunda hoja de resumen, la red neuronal entrenada clasifica correctamente todos estos casos salvo uno.

Por último, se realizó la predicción en los casos de los datos de predicción, con las predicciones que aparecen a la derecha de dicho conjunto de datos. Dado que no se conocen los valores de la variable dependiente de este conjunto, no hay manera de saber si las predicciones son precisas, pero puede confiar bastante en estas predicciones, dado el nivel de éxito obtenido en los conjuntos de datos de entrenamiento y prueba.

IV.

METODOLOGÍA

El modelamiento se realizará mediante el uso de la metodología de redes neuronales, la cual se llevará a cabo mediante la herramienta informática NeuralTools® versión de prueba (duración 15 días) (Pallisade, 2015) complementada con el software Microsoft Excel.

NeuralTools® es una potente herramienta flexible y fácil de usar para hacer predicciones inteligentes basadas en datos, directamente en Excel. Y lo hace analizando las complejas relaciones que existen entre los datos usando redes neuronales (o redes). Una red neuronal es parecida a una ecuación de regresión, pero las variables dependiente (objetivo) e independiente (explicatoria) pueden ser numéricas o de categoría, incluso de texto, y las relaciones estimadas pueden ser lineales o absolutamente no lineales.

Los grupos de datos de NeuralTools tienden a ser mayores, por lo tanto normalmente es posible dividirlos en tres subgrupos: uno para entrenar la red, uno para comprobación (en el que los valores de la l a variable dependiente son conocidos) y uno para la predicción (en el que los valores de la variable dependiente son desconocidos) (Pallisade, 2015).

Por lo que, el análisis que se realizará con el software NeuralTools® se van a emplear datos de pruebas fisicoquímicas realizadas realiz adas a una muestra de 150 vinos.

http://www.palisade-lta.com/neuraltools/, http://www.palisade-lta.com/neuraltools/, pagina donde se descarga el paquete del programa.

V.

ELABORACIÓN DEL MODELO

Figura 3: Iconos a Ejecutar Excel y NeuralTools Una vez ejecutados, existe dentro de las pestañas principales, la pestaña de



NeuralTools.

Figura 4: Cuadro de dialogo de NeuralTools

Figura 5: Cuadro de dialogo de NeuralTools Para Datos

Para toda base de datos el primer paso para empezar a ejecutar el programa, es



necesario: activar el cuadro de Administrador de conjuntos de Datos.

Es necesario activar este cuadro para poder especificar cada variable como lo



muestra la figura siguiente:

Figura 6: Cuadro de dialogo de Administrador de conjuntos de Datos. Como se aprecia en la Figura Figura 5, primero debemos dar nombre a nuestro conjunto de



datos, luego dar el rango (seleccionar nombres de variables y datos).

Luego clasificar el tipo de variables:



Categoría independiente: cualitativa para datos de ingreso Categoría dependiente: cualitativa para datos de salida Numérica independiente: cuantifica para datos de ingreso Numérica dependiente: cuantifica para datos de salida Etiqueta: solo para mencionar Sin usar: variable que no se procesa

Las variables dependientes son para las variables a predecir, que ya según sea el



caso puede ser numérica o de categoría.

Luego de aceptar el encabezado de cuadro con los nombres de las variables cambia



de color a celeste.

Esto se tiene que hacer para las hojas de (aprender-probar y predecir), pueden ser



hojas por separado o en una sola hoja Excel, según lo revisado es mejor repartir en dos hojas. Hoja 1, entrenar y probar. (Al entrenar con la cantidad de datos que se tenga se puede destinar un 20 % a más para probar probar y verificar el porcentaje de error). Hoja 2, hoja de datos a con las variables independientes y los datos a predecir.

Figura 7: Cuadro de dialogo de Opciones de Visor de datos Este cuadro de dialogo es para verificar todos los datos de estadística necesarios



para tomar decisiones.

Figura 8: Cuadro de datos de entrenamiento y prueba son un total de 150 datos

Figura 9. Cuadro de diálogo de redes neuronales.

Figura 10. Cuadro de diálogo entrenamiento En este cuadro de dialogo se planea entrenar y probar, activando el check es probar,



se puede dar el porcentaje que se requiere para probar,



Se puede activar el check de predecir, pero para fines prácticos es mejor hacerlo en otra hoja Excel.

Figura 11. Cuadro de diálogo entrenamiento (configuración de red) Se tiene dos opciones Red PN/GRN y Red MLF, para procesos de la industria alimenticia se



recomienda la primera Red. En la pestaña tiempo de ejecución, se deja los datos definidos por defecto.



Accionar la pestaña siguiente.



Figura 12. Cuadro de diálogo de previsualizar de entrenamiento. En el cuadro de error y advertencia es recomendable que no aparezca ningún



mensaje.

Posteriormente se acciona entrenar.



Luego de entregar aparece 5 columnas en el mismo Excel



Figura 12. Base de datos de entrenamiento y probar, columnas que aparecen a la derecha, que corresponde al 20% de los 150 datos (30 datos)

Cuadro 1. Datos resumen después de ejecutar el entrenamiento y probar la base de datos. Resumen Información de red

Nombre Configuración

Red entrenada en Datos de entrenamiento Predicción de categoría PNN

Localización

Este libro de trabajo

Variable de categoría independiente

0

Variables numéricas independientes

11 (Alcohol, Ácido málico, Ceniza, Alcalinidad de ceniza, Magnesio, Total de fenoles, Flavonoides, Fenoles no flavonoides, Proantocianinas, Intensidad del color, Prolina)

Variable dependiente

Var. de categoría (Tipo de vino)

Entrenando

Número de casos

120

Tiempo de Entrenamiento

00:00:00

Número de pruebas

132

Razón de la parada

Auto-Parada

% de predicciones incorrecta incorrectass

0.0000%

Probabilidad incorrecta media

0.0000%

Desviación estándar de probabilida probabilidad d incorrecta

0.0001%

Probando

Número de casos

30

% de predicciones incorrecta incorrectass

6.6667%

Probabilidad incorrecta media

6.4818%

Desviación estándar de probabilida probabilidad d incorrecta

21.1377%

Conjunto de datos

Nombre

Datos de entrenamiento

Número de filas

150

Etiquetas manuales de caso

NO

Análisis de impacto de variable variable

Alcalinidad de ceniza

27.9053%

Flavonoides

21.4407%

Proantocianinas

14.9250%

Alcohol Prolina

11.8715% 10.9526%

Ceniza

6.9911%

Intensidad del color

4.0321%

Ácido málico

1.8571%

Fenoles no flavonoides

0.0228%

Magnesio

0.0013%

Total de fenoles

0.0004%

Este cuadro Excel aparece en un Excel parte después de haber ejecutado el entrenamiento



y prueba de datos, en este cuadro se aprecia datos estadísticos que son fundamentales para analizar y tomar decisiones sobre esta parte. Sobre todo las predicciones, es importante notar el porcentaje de error.



Cuadro 2. Datos de matriz de clasificación para par a entrenamiento y prueba Matriz de clasificación (para casos de entrenamient entrenamiento) o) 1

1 40

2 0

3 0

Incorrecto (%) 0.0000%

2

0

46

0

0.0000%

3

0

0

34

0.0000%

Matriz de clasificación (para casos de prueba) 1

1 8

2 0

3 0

Incorrecto (%) 0.0000%

2

1

11

1

15.3846%

3

0

0

9

0.0000%

Datos de matriz que son necesarios para saber cuál es porcentaje de resultados de prueba



incorrectos, y saber si es necesario adicionar más datos de entrenamiento o cambiar las variables.

Figura 13. Este cuadro aparece después de entrenar y probar Si se desea tener más datos estadísticos se acciona sí, pero esto demora unos minutos.



Figura 12. Base de datos a predecir 30 en total la columna de tipo de vino se encuentra vacío.

Figura 13. Cuadro de dialogo para accionar predecir

Figura 14. Cuadro de dialogo para predecir Se acciona el check todos los casos y colocar la predicción de color c olor valores de predicción



Luego se acciona siguiente



Figura 15. Cuadro de diálogo de previsualizar para predecir. En el cuadro de error y advertencia es recomendable que no aparezca ningún



mensaje.

Posteriormente se acciona predecir.



Figura 16. Cuadro de datos con los datos predichos, con un alto porcentaje de acierto. Cuadro 3. Resultados de predicción Informe de predicción: "Red entrenada en Datos de entrenamiento"

Etiqueta usada predecir predecir predecir predecir predecir predecir predecir

Predicción Predicción% 1 100.00% 1 100.00% 1 99.99% 1 100.00% 1 100.00% 1 100.00% 1 100.00%

predecir predecir predecir predecir predecir predecir predecir

1 1 1 1 2 2 3

100.00% 100.00% 100.00% 100.00% 78.07% 99.96% 75.86%

predecir predecir predecir predecir predecir predecir predecir predecir predecir predecir predecir predecir

2 2 2 2 2 2 2 2 2 3 3 3

100.00% 100.00% 99.90% 99.98% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00% 100.00%

predecir

3

100.00%

Solo dos datos de la predicción tienen un porcentaje de predicción alrededor del



75%, esto habla del alto porcentaje de acierto que tiene t iene este programa.

Para interpretar los resultados se puede usar los datos estadísticos, pero es esencial



conocer que al ejecutar el programa es que solo se puede obtener una variable respuesta (numérica o de categoría)

A mayor base de datos para entrenamiento, mayor precisión de acierto se tiene en



los resultados de predicción.



A mayor cantidad de variables mayor será el porcentaje de predicción.

VI.

REFERENCIAS BIBLIOGRÁFICAS Cortez, P; Cerdeira, A; Almeida, F; Matos, T; Reis, J. . 2009. Modeling wine preferences by data d ata mining from physicochemical properties. Decision Support Systems 47(4): 547-553.

Cárdenes, R.. 2015. Inteligencia Artificial – Redes Neuronales. Disponible en: http://www2.ulpgc.es/hege/almacen/download/38/38584/practica_ia_2.pdf

PALLISADE. 2015. NeuralTools® versión de prueba. Disponible en: http://www.palisade-lta.com/neuraltools/

Cortez, P. 2009. UCI Machine Learning Repository. University of California. School of Information and Computer Science. Irvine. California. Disponible en: http://archive.ics.uci.edu/ml/datasets/Wine+Quality

Redes Neuronales Artificiales Aplicado A La Industria Alimentaria

Short Description

Description

Comments

We need your help!