Evaluación Final (A) 2019 – 10 10 Semipresencial – Programa Programa a Distancia
Asignatura
Inteligencia de Negocios Docente
: Esther Balbuena Alarcón
Consigna de trabajo A. Diseña una solución de inteligencia de negocios de mediana complejidad haciendo uso de metodología y herramientas de inteligencia de Negocios empleadas en clase: MySql Workbench, PowerBI desktop y la suite de Pentaho para la creación de un proyecto BI. B. Instrucciones: - Desarrolla las preguntas planteadas: - Revisa la rúbrica de evaluación en la que podrás conocer los aspectos que se evaluarán en el producto que estás entregando. - Guarda el archivo y envíalo a través del ícono Evaluación Final de tu aula virtual.
PREGUNTAS: 1. Identificar del cuadro de información mostrado: dimensiones, hecho y medidas, y con ello elabora un modelo dimensional de alto al to nivel. (5 puntos)
Temáticas sobre los que les gusta informarse en Redes Sociales FACEBOOK TIPO DE INFORMACIÓN
TWITTER
BAJO
MEDIO
ALTO
BAJO
MEDIO
ALTO
1-4
5-7
8-10
1-4
5-7
8-10
Deportes
47
20
33
45
19
30
Política
22
34
44
23
30
47
General
10
27
63
0
27
53
Social
19
28
53
40
29
31
Espectáculos/Farándula
20
32
48
9
29
62
Vida familiar
20
32
42
54
28
18
Cultura
10
27
55
26
27
47
Relacionada con la escuela
11
29
65
53
34
23
Inteligencia de Negocios
Bajo, medio, alto: Frecuencia de accesos accesos semanales Hechos: Frecuencia en redes sociales Dimensiones - Tipo de información - Tipo de Red social Medidas - Cuenta de ingresos por tipo de red social s ocial - Cuenta de ingresos por tipo de información - Cuenta de ingresos por tipo de red social e información Modelo de alto nivel
2. CASO Datos Abiertos. (9 puntos) Elija un conjunto de datos del portal de datos abiertos:
https://www.datosabiertos.gob.pe/,, u otra fuente de su elección y https://www.datosabiertos.gob.pe/ desarrolle lo siguiente: -
Describa la fuente elegida.
La fuente que se ha elegido para la realización del presente trabajo es el tipo de cultivo c ultivo por comunidad de la zona Loreto y Amazonas teniendo en cuenta los nombres de las comunidades como también el tipo de manchales por comunidad, así como también el cultivo que se cultiva en esa región y el año de la encuesta,
-
Modelo dimensional, que contenga como mínimo una tabla de hecho y tres dimensiones. (Presentar Modelo lógico)
El modelo lógico de datos que se tiene es el siguiente:
Evaluación Final 2019 – 10 - A
Página 2
Inteligencia de Negocios
-
Realice proceso ETL para carga de datos al datamart. (Presente loa archivos de trabajo y pantallas de desarrollo y resultados)
-
¿Cuáles son las preguntas analíticas que puede responder con su modelo? (Indique por lo menos 2)
Tipo de vegetales x comunidad + cantidad Tipo de vegetales x manchales. o Tipo de vegetales x zonas y cuecas o
o
-
Qué tipo de gráficos usaría para presentar su resultado. Justifique su respuesta.
Evaluación Final 2019 – 10 - A
Página 3
Inteligencia de Negocios
Gráficos circulares: esto se debe a que la cantidad de datos que se puede mapear por ejemplo las comunidades con sus cantidades de tipos de vegetales ingresan perfectamente en un gráfico circular. Gráfico linear: con esto podemos comprar dos variables por ejemplo el tipo de producto, su cantidad y la cantidad de productos de este tipo que se encuent encuentra ra en una determinara región o en una comunidad.
3. CASO BASKETBALL. (6 puntos) En el conjunto de datos Basketball.csv se encuentran las siguientes columnas para diferentes jugadores:
height: altura en pies weight: peso en libras success_field_goals: porcentaje de tiros de campo exitosos success_free_throws: porcentaje de tiros libres exitosos avg_points_scored: puntos promedio anotados por juego
Enlace a fuente de datos:
https://raw.githubusercontent.com https://raw.githubusercontent.com/Feynman2 /Feynman27/PythonSandbox/m 7/PythonSandbox/master/data/ aster/data/ basketball.csv basketball.csv Intentar predecir el porcentaje de tiros de campo exitosos para un jugador en base al resto de variables utilizando la regresión lineal. Los datos se han de dividir en un conjunto de entrenamiento que contenga el 80% de los datos y otro de test con el resto.
Cuestiones: ¿Cuál es el modelo planteado? El modelo que se plantea es uno un o de regresión lineal ya que se encuentra normalizado la BD solo se utilizará un elemento el emento del programa Pentaho:
¿Cuál es el R2 del modelo? El R2 del modelo es 0.8
Thank you for interesting in our services. We are a non-profit group that run this website to share documents. We need your help to maintenance this website.