Proyecto Ciencia de Datos

October 3, 2022 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download Proyecto Ciencia de Datos...

Description

 

 

UTILIZANDO LA CIENCIA DE DATOS EN UNA EN LA LIBRERÍA IZTACCIHUATL Elaborado por Johan Sánchez para curso introductorio de Ciencia de Datos

 

INDICE

INTRODUCCIÓN En este documento se presenta un caso de estudio en Ciencia de Datos para l a Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México cuyo gerente ha decidido desarrollar un proyecto basado en ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor

estrategia en la toma de decisiones. Finalmente se mostrarán los beneficios la ciencia de datos aplicada a la venta de libros y una posible implementación de la misma.

INFORMACIÓN SUMINISTRADA La librería Iztaccihuatl nos suministró e n la carpeta denominada “datasets_books” los siguientes archivos: books; top_books; raitings; to_read. Se detalla la estructura e información de cada archivo: El archivo “books” contiene los siguientes datos:  

                         









 















Id - Identificador del registro Book Id - Identificador del libro Number Editions - Número de ediciones ISBN - Clave estándar internacional del libro ISBN13 - Clave estándar extendida internacional del libro Authors - Autor del libro Original Publication - Fecha de publicación Original Title - Título original del libro Title - Título del libro Language Code - Clave de idioma del libro Average Rating - Promedio de la clasificación del libro Image - Enlace a la imagen de la portada del libro Small Image - Enlace a la imagen en versión optimizada de la portada del libro.

El archivo “top_books” contiene los siguientes datos:          

 







   



Position - Posición del libro en la clasificación del libro ISBN - Clave estándar extendida internacional del libro Title - Título del libro Author - Autor del libro Imprint - Editorial Publisher Group - Grupo Editorial

 

             















 



Volume - Volumen de ventas hasta el 2010 Value - Ventas determinadas por el volumen RRP - Precio recomendado para minoristas ASP - Precio promedio para venta Binding - Tipo de encuadernación Publ Date - Fecha de publicación Product Class - Clasificación del libro Classification - Clasificación General del libro

El archivo “ratings” contiene los siguientes datos:  

     







Book Id - Identificador del libro User Id - Identificador del cliente/usuario que clasifico un libro Rating - Nivel de clasificación del libro.

El archivo “to_read” contiene los siguientes datos:  

   





User Id - Identificador del cliente/usuario que clasifico un libro Book Id - Identificador del libro

El archivo “books” contiene los datos generales de cada libro existente en la librería y además  menciona el

promedio de clasificación de cada libro de acuerdo a las votaciones y compras del cliente.

El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a una clasificación general.   El archivo “raitings” contiene los datos de  los libros más votados vota dos por los clientes dentro del sitio web de la

librería. El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio web sobre

libros para leer.

TIPO DE ANÁLISIS El tipo de investigación será de corto plazo ya que la información suministrada es concisa y estructurada. El tipo de análisis a utilizar será el descriptivo, ya que presenta pequeñas fuentes de datos estructuradas e históricos que nos permite ver una fotografía de la situación actual de la librería. Basado en la información analizada el análisis descriptivo nos permitirá categorizar a los clientes c lientes según sus preferencias de libros y su etapa de vida. Toda la información recaba nos permitirá mejorar los análisis y los algoritmos que recomiendan a cada cliente de la librería que libros debería leer, incrementando la efectividad en las ventas de la librería.

 

 

ESTRATEGIA DE IMPLEMENTACIÓN Debido a la cantidad de datos y plazo en el que se pueden obtener resultados la estrategia a utilizar para la implementación, será la estrategia lineal donde al final tendremos un resultado. Dicha estrategia se basa en que los datos están estructurados y buscamos beneficios a corto plazo. Para llevar dicha estrategia a cabo se definirá un equipo basado en metodologías ágiles donde se tendrán las siguientes premisas:  



 



   





Comunicación completa con todos los miembros del equipo, la comunicación es el factor fundamental en el éxito de cualquier proyecto. Reuniones diarias de seguimiento, donde cada uno de los miembros indique si tiene alguna problemática y entre los miembros del proyecto encontrar la mejor forma de resolverlo. Reuniones de resultados, en dichas reuniones se mostrarán el avance y los resultados del proyecto. Reunión de cierre, dicha reunión se realizará una vez finalizado el proyecto y se verán las lecciones aprendidas.

Las etapas por las que se deberá pasar para concluir este proyecto serán las siguientes: REVISIÓN DE LITERATURA Se revisará información en Internet sobre las librerías que más venden, casos como Amazon y los modelos de ventas en línea serán analizados en esta etapa. EXPLORACIÓN DE DATOS En esta etapa se revisarán los datos de la carpeta denominada “datasets_books” , suministrada por la tienda, se extraerán e integrarán los datos más relevantes para lograr posteriormente un análisis predictivo eficiente y efectivo para los objetivos que busca la librería. DESARROLLO DE ALGORITMOS Se procederá con el desarrollo y prueba de algoritmos que permitan a la librería tener un modelo predictivo que finalmente sea más efectivo en la recomendación de los libros que deberían leer los diferentes clientes. ANÁLISIS DE RESULTADOS Se realizarán cargas ficticias de datos en el sistema de la librería para lograr analizar qué tan efectivo es el algoritmo desarrollado, de igual forma se probará con datos históricos y se cruzará con las ventas reales históricas para verificar la efectividad del algoritmo. REVISIÓN El equipo realizará la revisión completa del algoritmo al igual que pruebas del mismo en el caso de detectar fallas se volverá el mismo a desarrollo.

 

IMPLEMENTACIÓN Se realizará la modificación del sitio web de la librería para incluir el nuevo algoritmo, para tal caso se realizará mediante el equipo de desarrollo de software.

INDICADORES “KPI”  

Los indicadores KPIs mas relevantes que se desprenden d esprenden del análisis realizado son los siguientes: 1.  1.  Clasificación de libros menos vendidos del inventario de la Librería Es importante conocer cuál o cuáles son las clasificaciones de libros de menos venta en la librería, para así lograr la optimización del gasto y manejar el mínimo de existencias para las clasificaciones menos vendidas. 2.  2.  ¿Cuántos clientes han comprado libros de la tabla “to_read” ?  Con esto se determinará la efectividad del algoritmo de recomendación de libros, dando la capacidad de mejorar dicho algoritmo. 3.  3.  Cantidad de libros vendida del raiting Al hacer el cruce entre la tabla de “raiting” y la tabla de libros más vendidos nos permitirá observar que

tan efectivo es el rating de los libros con respecto a sus ventas reales.

DESCUBRIMIENTOS DE LA INFORMACIÓN Luego de analizada la información la librería podría tomar las siguientes decisiones basadas en modelos mod elos predictivos: Cuál debería ser la existencia de libros en cada una de las clasificaciones, optimizando el inventario y las ganancias. Qué tan rápido se deben adquirir los nuevos títulos de libros por la librería tomando en cuenta las preferencias de los clientes. Según el entorno cultural de la ciudad de Monterrey, Nuevo León, México definir un perfil más acertado de los gustos y preferencias de los clientes de la ciudad donde se encuentra ubicada la librería, así como las ciudades en la que la misma logra colocar la venta de sus libros mediante el sitio Web.

 

CONCLUSIONES Es fundamental para la librería Iztaccihuatl desarrollar un proyecto de ciencia de datos q que ue le permita maximizar los inventarios de libros y las la s ventas lo que finalmente permita a la librería crecer y mejorar en cuanto a las preferencias del cliente. c liente. Mediante poder predecir y mejorar el manejo de las preferencias de los lo s clientes la librería logrará vender más y los clientes quedarán más felices f elices al tener recomendaciones que realmente se acoplan a sus gustos.

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF