BIG DATA Termino que describe el gran volumen de datos, tanto estructurados como no estructurados, que inundan los negocios cada día. Big data es la posibilidad de explotar comercialmente una gran cantidad de datos para crear nuevos servicios comerciales.
Objetivo del Big Data Analizar millones de millones de datos y orientar con ellos la toma de decisiones acerca de grandes problemas transversales.
Por que el big data es muy importante? Proporciona
un punto de referencia.
Ayuda
a identificar i dentificar rápidamente llos os problemas de forma comprensible.
Búsqueda Ayuda
de información de manera eficiente.
a las organizaciones a aprovechar sus datos y utilizarlos para identificar nuevas oportunidades.
Como funciona el big data? Nuestros dispositivos generan datos. 1.- recibe los datos 2.- los almacena 3.- los distribuye entre distintos procesadores. 4.- procesa los datos 5.- reúne de nuevo los datos 6.- utiliza algoritmos predictivos y prescriptivos para interpretarlos. 7.- extrae la información requerida. 8.- factor humano.
Desafíos de la calidad de datos en Big Data Las cinco características del big data ´provocan que las empresas problemas datos reales y yde alta calidad, detengan conjunto de datospara tan extraer masivos, cambiantes complicados. Algunos desafíos que se enfrenta la calidad de datos de big data 1.- muchas fuentes y tipos de datos 2.- tremendo volumen de datos 3.- mucha volatilidad. 4.- no existen estándares de calidad de datos unificados.
Tipos de datos en el big data o
Datos Estructurados.- datos ordenados y bien definidos en cuanto a su formato, tamaño y longitud.
o
Datos No estructurados.- no tienen una estructura interna identificable. Los datos son desorganizados y no tienen valor hasta que se ordenan, se identifican y se almacenan.
o
Datos semiestructurados.- informaciones no regulares regulares y que no se pueden gestionar de manera estándar.
Las cinco Vs del big data
Ventajas de big data.
Mejora en la toma de decisiones Reducción de costes Realimentación en tiempo real. Velocidad en la toma de decisiones Detección de nuevas oportunidades oportunidades
Desventajas del big data •
•
•
•
El exceso de datos Ciberseguridad Las políticas de protección de datos. Tecno fobia
8 Herramientas de big data para una empresa 1.Hadoop 2.- MongoDB 3.- Elasticsearch 4.- Apache Spark 5.- Apache storm 6.- Lenguaje R 7.- Python 8.-Tableau 8.Tableau
Big data hadoop
Hadoop es un framework opensource para almacenar datos y ejecutar aplicaciones en clústers de hardware básicos. Proporciona un almacenamiento masivo para cualquier tipo de datos, un enorme poder de procesamiento y la capacidad de manejar tareas o trabajos prácticamente ilimitados y de forma muy concreta. ¿Por que es importante hadoop?¿como se utiliza hadoop?
Almacenamiento y archivo de datos de bajo coste. Sandbox para descubrimiento de análisis,. Data lake para almacenar datos en su formato original. Complementa tu data warehouse.
Big data y data mining Data mining y las técnicas de minería de datos estan muy relacionados, especialmente en el actual contexto digital, entre ellos hay claras e importantes diferencias. Es importante avanzar que aunque el data mining alude a un conjunto de técnicas de extracción de datos aplicables para el análisis de información estructurada, también permite su exploración y clasificación búsqueda de patrones en clave de big data. Ellopara es la posible gracias a que la ejecución de un conjunto de técnicas de data analytics, que permiten realizar análisis predictivos y de tendencias.
Thank you for interesting in our services. We are a non-profit group that run this website to share documents. We need your help to maintenance this website.