Big Data
July 31, 2022 | Author: Anonymous | Category: N/A
Short Description
Download Big Data...
Description
INSTITUTO POLITÉCNICO NACIONAL ESCUELA SUPERIOR DE INGENIERÍA MECÁNICA Y ELÉCTRICA UNIDAD ZACATENCO
HUMANIDADES V Profesora:
CARMINA CELIA DE LA PAZ LOPEZ TRABAJO DE INVESTIGACION
BIG DATA ALUMNOS:
BELLO GERMÁN LAURA ENRIQUEZ PEREZ JOSUE ARGUETA ALEJANDRO LUIS F ORTEGA SANCHEZ LUIS A
1
INDICE INDICE INTRODUCCIÓN............. ............................ ............................. ............................. .............................. ............................. ............................. .............................. ........................3 .........3 ANTECEDENTES.............. ............................ ............................. .............................. ............................. ............................. ................................................... .................................... 5 ESTADO DEL ARTE............... ............................. ............................. ............................. ............................. .............................. ............................. ...............................9 .................9 ............................. ............................. ............................. .............................. ............................. ...............................10 .................10 Estado actual de Big Data..............
Dimensiones de Big Data.............. ............................. .............................. ............................. ............................. .............................. ................................ ................. 11 Análisis de Big Data............. ............................ .............................. ............................. ............................. .............................. .......................................... ........................... 12 ............................ .............................. ............................. ............................. .............................. ............................. ............................. ......................................... .......................... 13 USOS............. ............................ .............................. ............................. ............................. ..................................13 ...................13 Big Data en Marketing y Ventas............. ............................ ............................. .............................. ..................................13 ...................13 Big Data para la lucha contra el crimen.............. ............................. .............................. ............................. ............................. ............................. ............................. .......................13 ........13 Big Data en Deportes.............. ........................... ............................. .............................. ............................. ............................. ............................. ...........................13 .............13 Big Data en Política ............. ............................. ............................. ............................. ............................. .............................. ................ 14 Big Data en Telecomunicaciones.............. ............................. ............................. ............................. ............................. ..................................... ....................... .14 Big Data en Salud y Sanidad ..............
Cuáles son las aplicaciones del Big Data ambiental ......................................................14 La lucha contra el cambio climático y el calentamiento global ...................................15
USUARIOS............. ............................ ............................. ............................. ............................. ............................. .............................. ............................. ................................16 ..................16 ............................. ............................. .............................. ............................. ............................. ............................. ............................... ................. 18 MARCO JURIDICO...............
COSTO-BENEFICIO............... ............................. ............................. ............................. ............................. .............................. ............................. .............................23 ...............23 ALCANCES Y LIMITACIONES LIMITACIONES...................................................................................................24 ............................ .............................. ............................. ............................. ............................. ........................................26 ..........................26 IMPACTO AMBIENTAL............. ............................. ............................. ............................. .............................. ............................. ..................................................... ....................................... 27 Green data':..............
BIBLIOGRAFIA.............. ............................ .............................. ............................. ............................. ............................. ............................. .............................. ........................ ......... 29
2
INTRODUCCIÓN El mundo es cada vez más un gigant gigantesco esco yacimient yacimiento o de infor información mación digital, digital, en el que el 90% de los datos existentes se han generado en los dos últimos años. Y como en todas las fiebres del oro, los mineros toman posiciones para extraer el mayor beneficio al nuevo manantial. Bienvenidos al «Big Data». Así denominan los expert exp ertos os a est este e «or «oro o negro» negro» inv invisi isible ble de la era dig digita ital,l, alb alberga ergado do en eno enorme rmess base ba sess de da dattos do dond nde e alm lmac acen enam amos os la hu huel ella la virt virtua uall de casi asi tod odas as las dimensiones de nuestra existencia: nuestra vida privada, nuestra actividad pública, laboral y económica, y nuestras andanzas en Internet y las redes sociales. El primer cuestionamiento que posiblemente llegue a su mente en e n este momento es ¿Qué es Big Data y porqué se ha vuelto tan importante? pues bien, en términos generales podríamos referirnos como a la tendencia en el avance de la tecnología que ha abierto las puertas hacia un nuevo enfoque de entendimient entendimiento oy toma de decisiones, la cual es utilizada para describir enormes cantidades de datos dat os (es (estru tructu cturad rados, os, no est estruc ructur turado adoss y sem semii est estruc ructur turado ados) s) que tom tomarí aría a demasiado demas iado tiempo y sería muy costoso cargarlos cargarlos a un base de datos relac relacional ional para su análisis. De tal manera que, el concepto de Big Data aplica para toda aquella información que no puede ser procesada o analizada utilizando procesos o herramientas tradicionales. Sin embargo, Big Data no se refiere a alguna cantidad en específico, ya que es usualmente utilizado cuando se habla en términos de petabytes y exabytes de datos. Entonces ¿Cuánto es demasiada info in form rmac ació ión n de ma maner nera a qu que e se sea a el eleg egib ible le pa para ra se serr pr proc oces esad ada a y an anal aliz izad ada a utilizando Big Data? Analicemos primeramente en términos de bytes: Gigabyte = 10 9 = 1,000,000,000 Terabyte = 10 12 = 1,000,000,000,000 Petabyte = 10 15 = 1,000,000,000,000, 1,000,000,000,000,000 000 Exabyte = 10 18 = 1,000,000,000,000, 1,000,000,000,000,000,000 000,000 Además del gran volumen de información, información, esta existe existe en una gran variedad de de datos que pueden ser representados de diversas maneras en todo el mundo, por ejempl eje mplo o de dis dispos positi itivos vos móv móvililes, es, aud audio, io, vid video, eo, sis sistem temas as GPS GPS,, inc incont ontabl ables es sensores digitales en equipos industriales, automóviles, medidores eléctricos, vele ve lettas as,, ane nemó móm met etro ross, et etc. c.,, lo loss cu cua ale less pu pue ede den n med ediir y com omun unic icar ar el posici pos iciona onami mient ento, o, mov movimi imient ento, o, vib vibrac ración ión,, tem temper peratu atura, ra, hum humeda edad d y has hasta ta los cambios químicos que sufre el aire, de tal forma que las aplicaciones que analizan estos datos requieren que la velocidad de respuesta sea lo demasiado 3
rápida para lograr obtener la información correcta en el momento preciso. Estas son las características principales de una oportunidad para Big Data. Es importante entender que las bases de datos convencionales son una parte important impor tante e y relev relevante ante para una solución analítica. analítica. De hecho hecho,, se vuelv vuelve e mucho más vital cuando se usa en conjunto con la plataforma de Big Data. Pensemos en nuestras manos izquierda y derecha, cada una ofrece fortalezas individuales para cada tarea en específico. Por ejemplo, un beisbolista sabe que una de sus manos es mejor lanzar la pelota otrasinpara atraparla; puede ser que cada mano intentepara hacer la actividad de yla la otra, embargo, el resultado no será el mejor. El sector empresarial presenta gran desconocimiento sobre lo que significa Big Data; hoy las compañías no saben qué hacer con el gran volumen de datos e información almacenada en diferentes medios o bases de datos, los cuales pueden ser de gran importancia, principalmente en la toma de decisiones. Es por ello por lo que la presente investigación se orientó a evidenciar la importancia de la Big Data y a mostrar que los datos se generan con cierta velo ve loci cida dad d y va vari ried edad ad,, oc ocas asio iona nand ndo o el cr crec ecim imie ient nto o en vo volu lume men. n. Co Como mo un problema de Big Data se puede contemplar la forma como hoy crecen los datos en volumen,develocidad y variedad; debido al gran avance uso de las tecnologías información, y al uso esto diarioes que las personas hacen dey ellas. La pr pres esent ente e in inve vest stig igac ació ión n es út útilil pa para ra la lass pe pers rson onas as qu que e no titien enen en ma mayo yor r cono co noci cimi mien ento to so sobr bre e lo qu que e si sign gnif ific ica a Bi Big g Da Data ta,, so sobr bre e su suss al alca canc nces es,, su suss tecn te cnol olog ogía íass y su ap apro rove vech cham amie ient nto. o. De la mi mism sma a fo form rma, a, a la lass em empr pres esas as,, independientemente su tamaño, siempre y cuando desconozcan el uso de Big Data, de forma que puedan gestionar datos y convertirlos en conocimiento útil en sus labores diarias
4
ANTECEDENTES La historia del Big Data es muy poco conocida. Como sucede frecuentemente con las tendencias, parece que cuando explotan es algo muy novedoso que acaba de apar ap arec ecer er;; pe pero ro en mu much chos os caso casoss son son la eclo eclosi sión ón de algo algo qu que e ha esta estado do madurando durante largo tiempo. Como hemos comentado en otras ocasiones, el Big Data es el análisis de un gran volumen de conjuntos de datos. Para recolectar, tratar y analizar esa ingente cantid can tidad ad de inform informaci ación ón se nec necesi esitan tan fór fórmul mulas as de proc procesam esamien iento to potent potentes es y rápidas. Por ello, estas técnicas parecen haber surgido recientemente, gracias a los avances tecnológicos. Esto,, en gran Esto gran me medi dida da es así: así: el térm términ ino o se comi comien enza za a util utiliz izar ar de form forma a gene ge nera raliliza zada da a fina nalles de los añ años os 90 y el bo boom om lle llega con con los los av avan ance cess experimentados en campos como internet, dispositivos móviles y conexión. Sin embargo, la historia del Big Data se remonta a mucho antes. Hay incluso quienes lo sitúan en el paleolítico, con una lógica que relaciona el término con el primitivo interés de los seres humanos por lograr y procesar la info inform rmac ació ión. n. A cont contin inua uaci ción ón,, ah ahon onda damo moss un poco poco má máss en esta esta cues cuestitión ón compartiendo la historia del Big Data: 2400 AC. En Babilonia se extiende el uso del ábaco, un sistema para realizar cálculos. En esta época surgen también las primeras bibliotecas como lugares para almacenar y consultar conocimiento. 48 AC. Los Romanos, había logrado reunir medio millón de documentos con la intención de almacenar todo el conocimiento de la Humanidad. Siglo II AC. Se desarrolla la primer primera a computadora computadora mecánica conocida en Grecia Grecia.. El mecanismo de Anticitera era un aparato analógico de bronce diseñado para predecir posiciones astronómicas. Se empleó para el estudio astrológico y para marcar marc ar el cale calendar ndario, io, fundam fundament entalm alment ente e las fec fechas has exac exactas tas de los ant antigu iguos os Juegos griegos. 1663. John Graunt realiza el primer experimento de análisis de datos estadísticos conocido. Con los datos de defunciones, teoriza un sistema de alerta para la peste bubónica en toda Europa. 1792 se asocia el término a la “colección y clasificación de datos “. 1865. Aparece por primera vez el término business intelligence, en la enciclopedia comercial de Richard Millar Devens. En ella describe cómo el banquero Henry 5
Furnese logró una importante ventaja competitiva recogiendo, estructurando y analizando datos clave de su actividad. La inteligencia de negocio es sin duda uno de los grandes motores de la analítica dentro de la historia del big data. 1880. Herm 1880. Herman an Holler Hollerith ith,, emp emplea leado do del cen censo so est estadou adounid nidens ense, e, des desarro arrolla lla su máquina tabuladora. Con ella consigue reducir un trabajo de 10 años a 3 meses. Este ingeniero funda una compañía que posteriormente se conocería como IBM. 1926. Nikola Tesla predice la tecnología inalámbrica. Según su visión, el planeta en un gran cerebro en el que todo está conectado, por lo que deberíamos ser capaces simplificar el uso del teléfono. Predice que cada hombre llevará uno en su propio bolsillo. 1928. El ingeniero alemán Fritz Pfleumer patenta el primer sistema magnético para almacenar datos. Sus principios de funcionamiento se utilizan hoy en día. 1944. Primer intento de conocer la cantidad información que se crea. Se trata de un estudio académico de Fremont Rider, que pronostica 200 millones de libros en la Universidad de Yale en 2040, almacenados 6.000 millas de estanterías. 1958. El informático alemán Hans Peter Luhn, define la inteligencia de negocio: la habilidad de percibir las interrelaciones de los hechos presentados para guiar acciones hacia un objetivo deseado. En 1941 pasó a ser Gerente de Recuperación de Información en IBM. 1962. Se presenta IBM Shoebox en la Expo de 1962. Creada por William C. Dersch supone el primer paso en el reconocimiento de voz, capaz de registrar palabras en inglés en formato digital. 1965. Se pr 1965. proy oyect ecta a el pr prim imer er data data cen cente terr en Est Estad ados os Un Unid idos os,, par para a gu guar ardar dar documentación de impuestos y huellas dactilares en cintas magnéticas. Un año antes comienzan a surgir voces que alertan del problema de guardar la ingente cantidad de datos generada. 1970. IBM desarrolla el modelo relacional de base de datos, gracias al matemático Edgar F. Codd. Este científico inglés es también responsable de las doce leyes del procesamiento analítico informático y acuño el término OLAP. 1976.. Se po 1976 popu pula lari riza za el uso uso de MRP MRP (s (sof oftw twar are e de ge gest stió ión n de mate materi rial ales es), ), antecedentes de los ERP actuales, que mejoran la eficiencia de las operaciones en la empresa; además de generar, almacenar y distribuir datos en toda la organización. 1989. Erik Larson habla por primera vez de Big Data en el sentido que conocemos la expresión hoy en día. La revista Harpers Magazine recoge su artículo, en el que especula sobre el origen del correo basura que recibe. En torno a este año se empiezan a popularizar las herramientas de business intelligence para analizar la actividad comercial y el rendimiento de las operaciones. 6
1991.. Na 1991 Nace ce inter nterne nett, a la po post stre re,, la gr gran an re revo volluc ució ión n de la re reco collec ecci ció ón, alm almac acen enam amie ient nto o y an anál ális isis is de da dattos os.. Tim Bern Berner erss-Le Lee e es esttable ablece ce las las espec es pecifific icaci acion ones es de un sist sistem ema a de re red d co con n in inte terco rcone nexi xion ones es a nive nivell mu mund ndia iall accesible para todos en cualquier lugar. 1993.. Se fund 1993 funda a Qlik QlikTe Tech ch,, ge germ rmen en de la actu actual al Qlik Qlik,, qu que e cr crea ea un sist sistem ema a revolucionario de business intelligence (en 2012, Gartner comienza a hablar de business discovery para definir ese tipo de análisis). 1996. Los precios del almacenamiento de datos empiezan a ser accesibles con un coste eficiente eficiente en lo que es una de las grandes revolucione revolucioness en la historia del big data. El libro La evolución de los sistemas de almacenamiento, de 2003, establece esta fecha como el primer año en el que el almacenami almacenamiento ento digital es más barato que el papel. 1997. Google lanza su sistema de búsqueda en internet y en los siguientes años será de largo el primer lugar al que acudir en busca de datos en internet. Este mismo año, se publica el estudio ¿Cuánta información hay en el mundo?, de Michael Lesk. La conclusión es que hay tanta y crece a tal velocidad, que gran parte de ella no será vista por nadie jamás. 1999. El término Big Data es analizado por primera vez en un estudio académico. La Asociación de Sistemas Informáticos recomienda centrarse en el análisis de información ya que existe gran cantidad de datos y no todos son útiles. Recuerdan el propósito de la computación, que es el entendimiento, no los números. 2001. Doug Laney, de Gartner, define las 3 V’s del Big Data. Este es un hito clave en la historia del big data. Se trata de tres conceptos que definen el término: volumen, velocidad y variedad. Al mismo tiempo, se populariza el concepto SaaS (software as a service). 2005. Nace la Web 2.0, una web donde predomina el contenido creado por los usuarios. Este mismo año se crea Hadoop, un entorno de trabajo Big Data de software libre. 2007. La revista Wired publica un artículo que lleva el concepto de Big Data a las masas. 2010. Los datos que se generan en dos días equivalen a la cantidad de datos gener ge nerad ados os des desde de el in inic icio io de la civi civililiza zaci ción ón hast hasta a 20 2003, 03, segú según n Er Eric ic Sc Schm hmid idtt (Google). 2013. El archivo de mensajes públicos de Twitter en la Biblioteca del Congreso de Estados Unidos llega a los 170 billones de mensajes, creciendo a ritmo de 500 millones al día. Según la institución que alberga algunos de los documentos históricos más importantes del mundo, dicho archivo ofrece una imagen más amplia de las normas culturales, diálogos, tendencias y eventos de hoy en día. De
7
este modo, contribuye a una mejora de la información en procesos legislativos, educación, definición de autoría de nuevos trabajos y otras cuestiones.
2014. Los móviles superan a los ordenador ordenadores es en accesos a internet. La conexión casi continua contribuye a generar muchos más datos y mejora la conectividad con otros dispositivos. 2016 20 16.. El Big Big Da Data ta se conv convie iert rte e en la pa pala labr bra a de mo moda da.. Se gene genera raliliza za la contratación de expertos en Big Data, el Machine Learning llega a las fábricas y el Internet de las Cosas empieza a impregnarlo todo. 2017. Los datos llegan a las masas. La gente controla sus patron patrones es de descans descanso o con pulseras, sabe en qué se gasta el dinero con aplicaciones móviles y se informa sobre la posesión de balón de su equipo de fútbol. Los datos están en todas partes y la población está ya predispuesta a usarlos.
8
ESTADO DEL ARTE Para iniciar, se presentan algunas definiciones sobre el término Big Data, del cual existen innumerables definiciones, entre ellas se tienen: Segúni, el término aplica a la información que no puede ser procesada o analizada mediante procesos tradicionales. Para, Big Data son “cantidades “cantidades masivas de datos que se acumulan con el tiemp tiempo o que son difíci difíciles les de ana analiz lizar ar y man maneja ejarr utiliz utilizand ando o herram herramien ientas tas comune comuness de gestión de bases de datos”, [3], Big Data se refiere “al tratamiento y análisis de enormes repositorios de datos, tan desproporcionadamente grandes que resulta impo imposi sibl ble e trat tratar arlo loss con con las las herr herram amie ient ntas as de ba base sess de da dato toss y an anal alít ític icas as convencionales”. Por parte, el analist analista a Dan Kusnetzky, zky, del Grupo Kusnetzky [4], señala que que “La frasesuBig Data se refiere a Kusnet las herramientas, procesos y procedimientos permitan permit an a una organizació organización n crear, manipul manipular ar y admin administrar istrar grandes conjunto conjuntoss de datos e instalaciones de almacenamiento”. En [5],“Forrester define Big Data como las técnicas y tecnologías que hacen que sea económico hacer frente a los datos a una escala extrema. Big Data trata de tres cosas: 1) Las técnicas y la tecnología, lo que significa que la empresa tenga personal, el cual tenga gran representación y análisis de datos para tener un valor agregado con información que no ha sido manejada. 2) Escala extrema de datos que supera a la tecnología actual debido a su volumen, velocidad y variedad. 3) El valor económico, haciendo que las soluciones sean asequibles y ayuden a la inversión de los negocios”. Según [7], Big Data “se refiere a las herramien herramientas, tas, los procesos y procedimient procedimientos os que permitan a una organización organización crear, manipu manipular lar y gesti gestionar onar conjuntos de datos muy grandes y las instalaciones de almacenamiento”. Gartner [5] define el Big Data como “un gran volumen, velocidad o variedad de información que demanda formas costeables e innovadoras de procesamiento de información que permitan ideas extendidas, toma de decisiones y automatización del proceso”.
9
Y [4] indica que “Big Data consiste en consolidar toda la información de una organización y ponerla al servicio del negocio”
Estado actual de Big Data Las investigaciones en Big Data son bastantes en la actualidad; aquí se presentan algunas de ellas: Una encuesta realizada por LogLogic encuentra que el 49% de las organizaciones están algo o muy preocupados por la gestión de Big Data, pero que el 38% no entiende lo que es, y el 27% dice que tiene una comprensión parcial; además, la encuesta encontró que 59% de las organizaciones carecen de las herramientas necesarias para gestionar los datos de sus sistemas de TI. Khera explicó que: “Big Data Da ta se tr trat ata a de mu much chos os te tera rabyt bytes es de da dato toss no es estr truc uctu turad rados os”, ”, do dond nde e “L “La a info inform rmac ació ión n es po pode der, r, y Bi Big g Da Data ta,, si se ge gest stio iona na corr correc ecta tame ment nte, e, pued puede e proporcionar una cantidad de conocimiento”. Según la encuesta, el 62% mencionó que ya había gestionado más de un terabyte de datos; eso indica que el volumen de datos en el mundo está aumentando a un ritmo casi incomprensible. Señala Beyer de Gartner y otros expertos que: “los grandes volúmenes de datos, o Big Big Da Data ta,, re requ quie iere ren n gr grand andes es cam cambi bios os en el se servi rvido dor, r, la in infr frae aest stru ruct ctura ura de al alma mace cena nami mien ento to y la arq arqui uite tect ctura ura de ad admi mini nist strac ració ión n de la in info forma rmaci ción ón en la mayoría de las empresas”. McKinsey dice que es necesario prepararse para contratar o reciclar personal, pues las empresas u organizaciones carecen de personas capacitadas en Big Data Da ta.. Ad Adem emás ás,, “p “pro roye yect cta a qu que e pa para ra el 20 2018 18,, solo solo en Es Esta tado doss Unid Unidos os,, se necesitarán entre 140 mil y 190 mil nuevos expertos en métodos estadísticos y tecnologías tecnol ogías de análi análisis sis de datos, incluy incluyendo endo el ampli ampliament amente e public publicitado itado papel de científico de datos”. Señala Williams de Catalina, “La gente que construyó las bases de datos del pasado no son necesariamente las personas que van a construir las bases de datos del futuro”. Según el estudio de Worldwide Big DataTechnology and Services 2013-2017 de IDC, “La tecnología y servicios de Big Data crecerá con una tasa anual de crecimiento compuesto del 27% hasta llegar a los 32.400 millones de dólares en 2017, unas seis veces la tasa de crecimiento del mercado general de tecnologías de la información y comunicaciones”.
10
Dimensiones de Big Data Existen tres características o dimensiones: Volumen, Velocidad y Variedad. 1) Volumen: Cada día, las empresas registran un aumento significativo de sus datos (terabytes, petabytes y exabytes), creados por personas y máquinas. En el año 2000 se generaron 800.000 petabytes (PB), de datos almacenados y se espera que esta cifra alcance los 35 zettabytes (ZB) en el 2020. Las redes sociales también generan datos, es el caso de Twitter, que por sí sola genera más de 7 terabytes (TB) diariamente, y de Facebook, 10 TB de datos cada día. Algunas empresas generan terabytes de datos cada hora de cada día de año, es decir, las empresas están inundadas de datos [1]. 2) Variedad: Se puede mencionar que va muy de la mano con el volumen, pues de acuerdo con éste y con el desarrollo de la tecnología, existen muchas formas de representar los datos; es el caso de datos estructurados y no estructurados; estos últimos son los que se generan desde páginas web, archivos de búsquedas, redes socia soc iale les, s, fo foros ros,, co corre rreos os elect electrón rónic icos os o pr produ oduct cto o de se sens nsore oress en dife difere rent ntes es actividades de las personas; un ejemplo [1] es el convertir 350 mil millones de lecturas de los medidores por año para predecir el consumo de energía. 3) Velocidad: Se refiere a la velocidad con que se crean los datos, que es la medida medid a en que aument aumentan an los product productos os de desarrollo desarrolloss de software (páginas web, archivos de búsquedas, redes sociales, foros, correos electrónicos, entre otros). Las tres características tienen coherencia entre sí; por ejemplo [2], analizar 500 millones clientes. de registros de llamadas al día en tiempo real para predecir la pérdida de
11
Análisis de Big Data El Big Data crece diariamente, como ya se mencionó,y una de las justificaciones es que los datos provienen de gran variedad de fuentes, tales como la Web, bases de datos, rastros de clics, redes sociales, Call Center, datos geoespaciales, datos semie sem iest struc ructu turad rados os (XML, (XML, RS RSS) S),, pr prove oveni nient entes es de aud audio io y vi vide deo, o, lo loss dat datos os generados por los termómetros, datos de navegación de sitios web durante cierto tiem tiempo po,, las RFI RFID (R (Rad adiio Fre requ quen ency cy Ide dent ntif ific icat atio ion n - ide dent ntif ific icac ació ión n por radiofrecuencia) [5]. Existen algunos beneficios del análisis de Big Data para las organizaciones, tal como se observó en el área de marketing, demostrados en la encuesta realizada por TDWI (The Data Warehousing Institute), cuando preguntó: “¿Cuál de los siguientes beneficios se produciría si la organización implementa alguna forma de análisis de Big Data?”. El 61% respondió que influye de manera social; el 45%, que habrá más puntos de vista de negocio; el 37% se inclinó por las decisiones automatizadas en los procesos en tiempo real; el 29% mencionó que se mejoraría la planificación planificación y la previsión, y el 27%, que se entend entendería ería el compor comportamien tamiento to del consumidor [6]. Según la misma encuesta, se encontraron ciertos inconvenientes del análisis del Big Data, entre ellos: la falta de personal y de habilidades del recurso humano (46%), la dificultad en la arquitectura de un sistema de análisis de Big Data (33%), problemas con el Big Data utilizable para los usuarios finales (22%), la falta de patr pa troc ocin inio io em empr pres esari arial al (3 (38% 8%)) y la def defic icie ienc ncia ia de un ar argu gume ment nto o em empre presa sari rial al convincente carencia de rapidez análisis en de las bases de datos (32%), problemas de escalabilidad(28%), de BiglaData (23%), consultas (22%) y dificultad para cargar los datos lo suficientemente rápido (21%), entre otros [6]. Ante la pregunta sobre cada cuánto realizan análisis de Big Data, se halló que anualmente, el 15%; mensual, el 35%; semanal, el 14%; diario, 24%; cada poca hora, 5%; cada hora, 4%; en tiempo real, 4%. Lo anterior fue el resultado de 96 entr en trev evist istad ados os [1 [16] 6].. El ob obje jetitivo vo del del anál anális isis is de da dato toss es exam examin inar ar gr grand andes es cant cantid idad ades es de dato datoss con con un una a vari varied edad ad de clas clases es,, con con el fin fin de de desc scub ubri rir r información que sea relevante y útil para la empresa, de manera que le permita tomar las mejores decisiones y obtener ventajas competitivas en comparación con otras de su clase.
12
El análisis de datos se realiza con tecnologías de bases de datos como NoSQL, Hadoop y MapReduce, las cuales soportan el procesamiento del Big Data.
USOS Existen múltiples herramientas para trabajar el Big Data como, por ejemplo, Hadoop, Spark, BBDD NoSQL, etc. A continuación, vamos a comentar algunos ejemplos concretos de utilización del Big Data:
Big Data en Marketing y Ventas
Los datos de los clientes se analizan y procesan obteniendo información relativa a sus gustos gustos,, prefere preferencias, ncias, comportam comportamientos ientos.. Así se pueden clasifica clasificarr o segmentar segmentar a los mismos en diferentes categorías y utilizar modelos predictivos para que las organ or ganiz izac acio iones nes pue puedan dan te tene nerr in indi dicad cador ores es de ace acept ptac ació ión n de sus pro produc ducto tos, s, potenciales ventas, etc. Big Data para la lucha contra el crimen
En Estados Unidos los cuerpos y fuerzas de seguridad disponen de aplicaciones que, haciendo uso del Big Data, pueden predecir la probabilidad de qu que e se pr prod oduz uzca ca un cr crim imen en en un una a zo zon na de dete term rmiina nada da.. Con ello llo ha han n desa de sarr rrol olla lado do el deno denomi mina nado do At Atla lass de Ri Ries esgo go (a (apl plic icac ació ión n Smar Smartt St Step epss en Massachusets). Big Data en Deportes
En la NBA y la NFL se emplean aplicaciones que hacen uso del Big Data para definir las estrategias a utilizar en cada partido, prevenir lesiones de los jugadores, conocer las preferencias de los aficionados, etc.
Big Data en Política
13
Antes de las elecciones norteamericanas de 2012, Obama decidió junto con su equipo utilizar el Big Data durante la campaña electoral para analizar los datos que recogían de potenciales votantes. Llegaron a la conclusión de que, para poder ganar, tenían que centrarse en dirigirse a los votantes dudosos de una manera eficaz y, al mismo tiempo, incidir en que los votantes demócratas convencidos fueran a votar. Utilizaron la plataforma HP Vertica, que les permitió recoger los datos, notificar de mane ma nera ras pa efic eficie nte y inar rá rápi da la inse form rmac ión, n,s rec y segm se gmen enta tar a blic los loidad s ad po pote tenc ncia iale less, vot votan ante tes para raient dete deeterm rmin arpida cuál cu áles es info serí rían anació má más recep epti tivos vos ar pu publ icid en TV TV, periódicos, redes sociales… El equipo de campo, el digital y el de comunicación trabajaron con una estrategia basada en los datos obtenidos, consiguiendo así su reelección. Big Data en Telecomunicaciones
Algunos operadores de telefonía móvil utilizan el Big Data para analizar qué se dice de ellas en las redes sociales, examinar los datos de sus tickets de soporte a clientes o sus quejas.Esto posibilita implementar estrategias que permiten reducir el número de portabilidades o incrementar la captación de nuevos clientes. Big Data en Salud y Sanidad
Tanto en la industria farmacéutica en el campo de la investigación de nuevos medi me dica came ment ntos os co como mo en el diag diagnós nóstitico co de enfe enferme rmeda dade des, s, ca cada da vez es má máss amplia amp liamen mente te utiliz utilizado ado el proc procesad esado o del Big Data Data col colect ectivo ivo (hi (histo storia riall méd médico ico,, materi mat erial al gené genétic tico, o, pred predicc icción ión de rei reingr ngresos esos hosp hospita italar larios ios…) …) para opt optimi imizar zar y probar modelos que mejoren los resultados, faciliten las pruebas en los ensayos clínicos con nuevas terapias o mejoren los diagnósticos. El Big Data también es útil para una gestión administrativa más eficiente de la salud. El Big Big Da Data ta es fund fundam amen enta tall pa para ra las las em empr pres esas as,, or orga gani nism smos os pú públ blic icos os e instituciones del mundo actual. Capacitarse en este campo resulta esencial para aquellas personas que quieren desempeñarse en una de las profesiones con más futuro. Para ello, el Máster en Big Data online de UNIR ofrece los conocimientos conocim ientos más completos q que ue requiere el mercad mercado. o. Es una disciplina con un uso muy amplio, y se puede aplicar a diferentes sectores con las características comunes de reducir costes, ser más eficientes y rápidos. Cuáles son las aplicaciones del Big Data ambiental
14
El Big Big Da Data ta am ambi bient ental al está está sien siendo do ap aplilicad cado o de di diver versa sass fo form rmas as qu que e está están n cont co ntri ribuy buyen endo do,, de una ma mane nera ra mu muyy im impo port rtan ante te,, a lo loss avan avances ces en ecol ecolog ogía ía,, conservación y ciencia. Estas son algunas de esas aplicaciones, con ejemplos reales:
La lucha contra el cambio climático y el calentamiento global
Desde Desd e 20 2010 10,, la NASA NASA llllev eva a ut utililiz izan ando do el Bi Big g Da Data ta am ambi bien enta tall par para a ca capt ptar ar y almacenar información del clima más completa y global que nunca. Eso permite crear modelos climáticos que realizan los pronósticos más precisos que hemos tenido nunca. Del mismo modo, y desde 2013, el gobierno británico anunció una inversión a gran esccal es ala a en Big Data ambient nta al. Uno de sus principales obj objetivo voss es la monitorización y la lucha contra el cambio climático. climático. La mejora de la agricultura
La combinación de Big Data ambiental, la tecnología y el sector agrícola se suele denominar Agritech. Con una población cada vez mayor, y una presión sobre los recursos del planeta, la la única manera de equilibrar ambas cosas será a través de la tecnología aplicada a los alimentos. El uso óptimo de la tierra de cultivo, el análisis de nutrientes del suelo, la limitación de la deforestación, la gestión del agua o el desarrollo de mejores métodos de cultivo (que usen menos terreno y recursos) son ejemplos de Big Data ambiental aplicado al sector agrícola.
Salud pública y salud ambiental
El Big Data ambiental está permitiendo, por primera vez, que podamos analizar el efecto del medio ambiente en la salud. Hasta ahora, establecer relaciones siempre había sido algo difuso y complejo. Con la cantidad de datos actuales, y la capacidad capaci dad de análi análisis sis conjunto, por fin podemos controlar esas variables y ver su verdadero efecto. Environment nmental al Protection Protection Agency) Agency) es líde La EPA EPA estado estadouniden unidense se (Enviro líderr en esta estass 15
aplicaciones. Gracias al Big Data ambiental hemos visto mejoras en el control y la mitigación de los efectos tóxicos de los químicos liberados a la atmósfera. «La Ciencia Ciudadana» Esta es una rama Esta rama y un una a apli aplica caci ción ón de dell Bi Big g Data Data am ambi bien enta tall espe especi cial alme ment nte e interesante. intere sante. La Citiz Citizen en Science Science, o «C «Cien ienci cia a Ciuda Ciudada dana na», », hace hace re refe fere renc ncia ia a la recogida de datos suministrada, voluntariamente, por los habitantes de diversas zonas. Eso permite conocer información sobre lo que ocurre exactamente en algunos lugares, qu que e no es posible re reccog oge er ahor ora a mismo de otras mane anera rass. Aunque esos datos se filtran bien, para evitar bulos o información falsa, se invita a aficionados y voluntarios a ayudar. En realidad, esto no es algo nuevo y hay ejemplos tan antiguos como el Censo de aves de Navidad que se hizo en Estados Unidos en 1900. Hoy día, la clave es, de nuevo, la cantidad, calidad calidad y veloci velocidad dad a la que se puede obtener y transmitir el Big Data ambiental.
USUARIOS Los científicos e investigadores han analizado datos desde ya hace mucho tiempo, lo que ahora representa el gran reto es la escala en la que estos son generados. Esta explosión de «grandes datos» está transformando la manera en que se conduce una investigación adquiriendo habilidades en el uso de Big Data para resolver resol ver probl problemas emas comp complejos lejos relac relacionad ionados os con el descu descubrimi brimiento ento cient científi ífico, co, investigación ambiental y biomédica, educación, salud, seguridad nacional, entre otros. De entre los proyectos que se pueden mencionar donde se ha llevado a cabo el uso de una solución de Big Data se encuentran: El La Lang ngua uage, ge, Inte Intera ract ctio ion n and and Comp Comput utat atio ion n Labo Labora rato tory ry (CLI (CLIC) C) en conjunto con la Universidad de Trento en Italia, son un grupo de investiga inves tigadores dores cuyo interés interés es el estudio de la comunicac comunicación ión verbal y no verbal tanto con métodos computacionales como cognitivos. Li Line nebe berg rger er Co Comp mpre rehe hens nsiv ive e Ca Canc ncer er Ce Cent nter er – Bi Bioi oinf nfor orma mati tics cs Group utiliza Hadoop y HBase para analizar datos producidos por los Group investigadores de The Cancer Genome Atlas(TCGA) para soportar las investigaciones relacionadas con el cáncer. India , analiza múltiples secuencias de El PSG College of Technology, India proteínas para determinar los enlaces evolutivos y predecir estructuras
moleculares.
La
natura ralleza
del
algoritmo
y
el
paralelismo 16
computacional de Hadoop mejora la velocidad y exactitud de estas secuencias. La Universidad Distrital Francisco Jose de Caldas utiliza Hadoop para apoyar su proyecto de investigación relacionado con el sistema de inteligencia territorial de la ciudad de Bogotá. La Univ Universid ersidad ad de Maryland Maryland es una de las seis universidades que cola colabo bora ran n en la inic inicia iatitiva va acad académ émic ica a de cómp cómput uto o en la nube nube de IBM/Google. Sus investigaciones incluyen proyectos en la lingüistica co comp mput utac acio iona nall, aná (mac (machi hine ne tran ansl slat atio ion) n),ctrón , rónico mo mode dela lado de dellamien leng le ngua je,, bioinf bio inform ormát ática ica, anális lisis is de tr correo cor reo elect ele ico y do pro proces cesam iento touaje de imágenes.
El Ins Insti titut tuto o de Tec Tecnol nologí ogía a de la Uni Univer versid sidad ad de Ont Ontari ario o (UO (UOIT) IT) junto con el Hospital Hospi tal de Toron Toronto to utilizan utilizan una plataforma plataforma de big data para análisis análisis en tie tiempo mpo rea re al de IBM (IBM Inf InfoSp oSpher here e Str Stream eams s ), la cu cual al pe perm rmitite e mo moni nito tore rear ar be bebé béss prematuros en las salas de neonatología para determinar cualquier cambio en la presión arterial, temperatura, alteraciones en los registros del electrocardiograma y ele electr ctroen oencef cefalo alogra grama, ma, etc etc., ., y así det detect ectar ar has hasta ta 24 hor horas as ant antes es aqu aquell ellas as condiciones que puedan ser una amenaza en la vida de los recién nacidos. Los labor laboratori atorios os Pac Pacifi ific c Nor Northw thwest est Nat Nation ional al Lab Labs__ s__(PN (PNNL) NL) ut utililiz izan an de ig igua uall manera IBM InfoSphere Streams para analizar eventos de medidores de su red eléc el éctr tric ica a y en titiem empo po re real al ve veri rififica carr aq aque uellllas as ex exce cepc pcio ione ness o fa fallllas as en lo loss componentes de la red, logrando comunicar casi de manera inmediata a los consumidor consu midores es sobre el probl problema ema para ayuda ayudarlos rlos en admin administr istrar ar su consumo de energía eléctrica.[3] La esclerosis múltiple es una enfermedad del sistema nervioso que afecta al cerebro y la médula espinal. La comunidad de investigación biomédica y la _Universidad _Univers idad del Estado de Nueva York (SUNY)_está (S UNY)_están n aplicando aplica ndo análisis anál isis con big data para contribuir en la progresión de la investigación, diagnóstico, tratamiento, y quizás hasta la posible cura de la esclerosis múltiple.[4] Con la ca Con capa paci cida dad d de ge gene nera rarr to toda da es esta ta in info form rmac ació ión n va valilios osa a de di dife fere rent ntes es sistemas, las empresas y los gobiernos están lidiando con el problema de analizar los datos para dos propósitos importantes: ser capaces de detectar y responder a los acontecimientos actuales de una manera oportuna, y para poder utilizar las predicciones del aprendizaje histórico. Esta situación requiere del análisis tanto de datos en movimiento (datos actuales) como de datos en reposo (datos históricos), que son representados a diferentes y enormes volúmenes, variedades y velocidades.
17
MARCO JURIDICO Cada vez, la vida cotidiana está siendo observada en todo momento, desde el momento de abandonar nuestra casa hasta cuando se conecta un dispositivo digital; como el GPS del automóvil, se está dejando un rastro digital cargado de información. Al igual que cuando se envía un email o se maneja un teléfono inteligente, se crea una cuenta en alguna red social, consultar el saldo de una tarjeta de crédito o el simple hecho de tomar una fotografía utilizando el teléfono inteligente. El desarrollo de fenómenos como el Big Data, el internet de las cosas, la decisión algorítmica, el aprendizaje automático o la inteligencia artificial ponen en jaque elementos fundantes del sistema de protección de datos, tal como la noción de consentimiento. La adopción de decisiones automatizadas y la elaboración de perfiles mediante algoritmos que pocos conocen o entienden, paradójicamente excluyen a su protagonista principal, que es el titular de los datos personales (Gil, 2016). Por todo lo anterior y debido al impacto de las tecnologías de la información, el cual ha ocupado un lugar preeminente en el debate científico y jurídico resulta conveniente hacer referencia a la regulación normativa de la protección de datos en la Unión Europea con carácter previo a la reciente publicación en el Diario Oficial de la Unión Europea, de fecha 4 de mayo de 2016, del Reglamento (UE) 2016/679 del Parlamento Europeo y del Consejo de 27 de abril de 2016 relativo a la protección de las personas físicas en lo que respecta al tratamiento de datos personales y a la libre circulación de estos datos y por el que se deroga la Directiva 95/46/CE (Reglamento general de protección de datos). Así, en cuanto a la regulación jurídica de la protección de datos en Europa, cabe señalar que las normas más relevantes en este ámbito han tenido una influencia indudable en las
18
normativas nacionales de los Estados miembros de la Unión Europea, implicando un aumento del nivel de protección.
Reglamento General de Protección de Datos (RGPD) en la Unión Europea
En cuanto a la estructura del RGPD, está constituida por 173 considerandos previos, y 99 artículos divididos en 11 capítulos: CAPÍTULO I. Disposiciones Generales (artículos 1-4) CAPITULO II. Principios (artículos 5-11) CAPÍTU CAPÍ TULO LO II III. I. Dere Derecho choss de dell in inte teres resado ado (ar (artí tícu culo loss 12 12-2 -23), 3), divi divido do en ci cinc nco o secciones: 1. Tra Transp nsparen arencia cia y m modal odalidad idades es 2. Inf Inform ormaci ación ón y acces acceso o a los dat datos os pers persona onales les 3. Rec Rectif tifica icació ción n y supr supresi esión ón 4. Derech Derecho o de opo oposición sición y decis decisiones iones iindivid ndividuales uales automa automatizada tizadass 5. Limi Limita taci cion ones es CAPÍTULO IV. Responsable del tratamiento y encargado del tratamiento (artículos 24-43), divido en cinco secciones: 1. Ob Obliligac gacion iones es gen gener eral ales es 2. Seg Seguri uridad dad d de e lo loss dat datos os pe person rsonale aless 3. Evalu Evaluación ación de impact impacto o relativa relativa a la p protecci rotección ón de dat datos os y consu consulta lta prev previa ia 4. Del Delega egado do d de e prote protecci cción ón d de e dat datos os 5. Cód Código igoss de conduc conducta ta y cer certif tifica icació ción n CAPÍTU CAPÍ TULO LO V. Tr Tran ansf sfer eren enci cias as de da dato toss pe pers rson onal ales es a terc tercer eros os país países es u organizaciones internacionales (artículos 44-50) CAPÍTULO VI. Autoridades de control independiente” (artículos 51-59), dividido en dos secciones: 1. Inde Indepe pend nden enci cia a 2. Com Compet petenc encia, ia, ffunci unciones ones y pod poderes eres CAPÍTULO CAPÍTU LO VII VII.. Coo Coopera peració ción n y coh coheren erencia cia (art (artícu ículos los 60-7 60-76), 6), dividi dividido do en tre tress secciones: 19
1. Co Coop opera eraci ción ón y coh coher erenc encia ia 2. Coh oher eren enci cia a 3. Com Comité ité euro europeo peo de pro protec tección ción de da datos tos CAPÍTULO VIII. Recursos, responsabilidad y sanciones (artículos 77-84) CAPÍTULO IX. Disposiciones relativas a situaciones específicas de tratamiento (artículos 85-91) CAPÍTULO X. Actos delegados y actos de ejecución (artículo 92 y 93) CAPÍTULO XI. Disposiciones finales (artículo 94-99) Por otra parte, el RGPD deroga expresamente expresamente la Direct Directiva iva 95/46/CE con efecto a partir del 25 de mayo de 2018, indicando además que cualquier referencia que se contenga conten ga a la citada Directi Directiva va que se deroga, se entenderá hecha a dicho RGPD. De la misma manera, cualquier referencia al Grupo de protección de las personas en lo que refiere al tratamient tratamiento o de datos personales personales establecid establecido o por el artículo 29 de la Directiva 95/46/CE se tiene que entender hecha al Comité Europeo de Prote Pro tecc cció ión n de Da Dato toss esta establ blec ecid ido o por este este RG RGPD PD (ar (artí tícul culo o 94) 94).. Ta Tamb mbié ién n se contempla que el RGPD no impondrá obligaciones adicionales a las personas físicas o jurídicas, en materia de tratamiento en el marco de la prestación de serv servic icio ioss pú públ blic icos os de comu comuni nica caci cion ones es elec electr trón ónic icas as en re rede dess pú públ blic icas as de comunicación de la Unión en ámbitos en los que estén sujetas a obligaciones específicas con el mismo objetivo establecidas en la Directiva 2002/58/CE (artículo 95). Respecto a los acuerdos internacionales que impliquen la transferencia de datos personales a terceros países u organizaciones internacionales que hubieren sido ya celebrados por los Estados miembros con anterioridad al 24 de mayo de 2016, y que cumplan lo dispuesto en el Derecho de la Unión aplicable antes de dicha fecha, se dispone que seguirán en vigor hasta que sean modificados, sustituidos o revocados (artículo 96). En cuanto a la entrada en vigor y aplicación de este RGPD, se declara que entrará en vigor a los veinte días de su publicación en el Diario Oficial de la Unión Europea, aunque será aplicable a partir del 25 de mayo de 2018 (artículo 99). Finalmente, en relación con el ámbito territorial de aplicación del RGPD hay que subrayar como novedad que se ha producido una importante extensión, ya que conf co nfor orme me a lo disp dispue uest sto o en su art artíc ícul ulo o 3 se apli aplica ca al tr trat atam amie ient nto o de da dato toss pers pe rson onal ales es en el cont contex exto to de las las acti activi vida dade dess de un esta establ blec ecim imie ient nto o del del respo res ponsa nsabl ble e o de dell en enca carga rgado do en la Un Unió ión, n, in inde depe pend ndie ient ntem emen ente te de que el tratamiento tenga lugar en la Unión Europea o no. Además, el RGPD se aplica también al tratamiento de datos personales de residentes en la Unión Europea por parte de un responsable o encargado no establecido en la Unión Europea, cuando las actividades de tratamiento estén relacionadas con los aspectos que enumera: a) la oferta de bienes o servicios a dichos interesados en la Unión Europea, 20
independientemente de si a estos se les requiere su pago, o b) el control de su comportamient comport amiento, o, en la medida en que este tenga lugar en la Unión. En definit definitiva, iva, el RGPD resulta también de aplicación al tratamiento de datos fuera de la Unión Europea, lo que amplía de forma considerable su ámbito de aplicación ya que permitirá, por ejemplo, que sea aplicable a empresas que, hasta este momento, podían estar tratando datos de personas en la Unión Europea y que, sin embargo, se regían por normativas de otras regiones o países que no siempre ofrecen el mismo nivel de protección que la normativa europea (Mayor Gómez, 2016).
Protección de Datos para Latinoamérica (Chile, México, Brasil y Argentina)
Los sistemas legales latinoamericanos, que comparten la tradición del derecho civi ci vill co cont ntin inent ental al europ europeo eo,, ha han n re recon conoc ocid ido o ta tamb mbié ién n co como mo ent entid idade adess le lega gales les diferentes, el derecho a la privacidad y el derecho a la protección de los datos pers pe rson onal ales es.. El dere derech cho o a la pr prot otec eccción ión de da dattos tiene iene re reco cono noci cimi mien ento to constitucional. En general, las constituciones de la región reconocen el derecho a la privacidad, pero también incluyen el llamado recurso de hábeas data, que es el derecho a la protecc protección ión de los datos personales personales,, tal el caso de las consti constitucion tuciones es de Argentina, Brasil, Colombia, México, Perú o Venezuela. Pero aun cuando esta previsión no esté contenida en forma expresa en los textos constitucionales, las Cortes pertinentes han reconocido el derecho de control de la propia información. Así, se destaca que el constitucionalismo latinoamericano ha sido, comparativamente, más eficiente en la protección del derecho a la protección de los datos personales que las protecciones constitucionales desarrolladas en otros países, e identifica tres elementos:
El reconocimiento del derecho a la protección de datos personales como derecho autónomo. El otorgamiento de remedios constitucionales para dicha protección. Y siguie siguiendo ndo aún más la tra tradic dición ión con consti stituc tucion ional al euro europea pea,, med median iante te el reconocimiento de derecho y otorgamiento de acciones no sólo respecto del sector público, sino también contra actores no estatales.
Sin embarg embargo, o, la pro protec tecció ción n consti constituc tucion ional al no es suf sufici icient ente, e, debido debido a cau causas sas bastante comunes en la región, por ejemplo: los altos costos transaccionales, la ineficiencia en la prevención del incumplimiento, la falta de stare decisis de las decisiones judiciales ya que, salvo contadas excepciones, sólo aplican al caso suje su jeto to a de deci cissión ión judi judici cial al.. A es eso o pu pued ede e agr greg egar arse se que que las las pr prev evis isio ione ness cons constititu tuci cion onal ales es son son mu muyy ge gene nera rale les, s, de deja jand ndo o así así mu much cho o ma marg rgen en pa para ra la interpretación judicial, por lo que al ser aplicados a casos concretos pueden generarse decisiones ambiguas o equivocadas, generando así falta de certeza 21
legal. América Latina en general ha adoptado mayormente durante la década de 1990 leyes comprensivas para el procesamiento de datos personales, es decir, leyes que regulan el procesamiento automático y manual de datos personales tanto por el sector público como por el sector privado. De tal suerte ha seguido también la tradición europea de protección comprensiva, a diferencia por ejemplo de los Estados Unidos, cuya protección es fragmentada por sector y se basa, muy sucintamente, en criterios de privacidad y datos de alta sensibilidad, no en la autodeterminación informativa (Serrano, 2017). El modelo de protección de datos personales latinoamericano se encuentra en una fase de transición. La mayor parte de las principales economías de la región cuentan con protecciones constitucionales y leyes comprensivas de protección que regulan el procesamiento de datos personales tanto por el sector público como el privado. Por último, un análisis por país respecto de lo cual es posible identificar que hay diferencias importantes entre los países: La ley argentina establece como regla general que todo tratamiento de datos debe realizarse con el consentimiento libre, expreso e informado del titular; de acuerdo con las circunstancias, deberá ser hecho por escrito o por un medio que se le equipare. Así, el consentimiento tácito o presunto no es considerado válido por la ley, aunque dicha regla tiene excepciones. Por su parte, la ley chilena establece que el consentimiento del titular de los datos es necesario para el tratamiento de sus datos, salvo que una disposición legal lo haya autorizado. La normativa establece que el consentimiento desde ser expreso, informado y por escrito; y también contiene los casos en que el consentimiento estará exceptuado. En México, como regla general, los datos personales sólo podrán ser tratados con el consentimiento consentimiento de su titular, obtenido de manera libre, específ específica ica e infor informada. mada. El consentimiento consentimiento deberá ser expreso si se trata de datos persona personales les sensibles y financieros o patrimoniales. En Brasil, que no cuenta con una ley general de protección de datos personales, varias disposiciones sectoriales requieren el consentimiento expreso del titular. Así surge de la Ley General de Telecomunicaciones, del Código de Protección del Consumidor y del Marco Civil de Internet.
22
COSTO-BENEFICIO Las em Las empre presa sass qu que e sa sabe ben n sac sacar ar pr prove ovech cho o de dell Bi Big g Da Data ta pu pued eden en me mejo jora rarr su estrategia y así permanecer en el mercado posicionadas, pues hará uso de nuevos conocimientos, con el gran volumen de datos o información que maneja a diario, que inicialmente no se les dio la suficiente importancia, por no tener una herramienta tecnológica que permitiera procesarla. Con la tecnología de Big Data, las empresas pueden ofrecer mejores productos, desarrollar excelentes relaciones con sus clientes, además, se transforman en más ágiles y competitivas [7]. Es importante tener en cuenta algunos pasos para la implementación de Big Data, como se menciona en [2].
Entender el negocio y los datos. Este primer paso pide un análisis detallado con las personas que hoy laboran y entienden los procesos y los datos que la empresa maneja. El segundo paso consiste en determinar los problemas y cómo los datos pueden ayudar. Al momento de conocer los procesos es muy posible que se encuentren los problemas de la empresa o del negocio. Establecer expectativas razonables, es decir, definir metas alcanzables; esto se puede lograr si al implementar la solución de un problema éste no presenta alguna mejora, y se debe buscar otra solución. Exis Ex iste te una una rec recom omen enda daci ción ón es espec pecia ial,l, y es qu que e cuan cuando do se in inic icia ia un proyecto de Big Data es necesario trabajar en paralelo con el sistema que hoy está funcionando. 23
Al tratar de implementar un proyecto de Big Data se debe ser flexible con la metodología y las herramientas; esto se debe a que las dos ante an teri riore oress son re reci cien ente tess y pue pueden den lllleg egar ar a pr pres esent entar ar pr prob oble lema mass al implementarlas. Esto se puede solucionar realizando investigación e inversión en este tipo de tecnología. Es importante mantener el objetivo de Big Data en mente; esto porque el proceso es pesado y porque no es tedioso, máxime cuando los métodos y herramientas que usan Big Data para el análisis de datos aún pueden presentar problemas, y la idea es que se mantenga en mente la meta final del proyecto sin desanimarse pronto
LIMITACIONES ALCANCES Y LIMITACIONES Si bien la idea del Big Data y la capacidad capacidad de su procesamie procesamiento nto están recibiend recibiendo o cada vez más atención, se enfatiza el punto introductorio acerca de que estas nueva nu evass in inic iciat iativ ivas as y ava avance ncess en la rec recop opililaci ación ón de da dato toss aú aún n de depe pend nden en de métodos que tienen limitaciones importantes. Muchos proy Muchos proyect ectos os lan lanzad zados os por orga organiz nizaci aciones ones intern internaci acional onales es junto junto con los gobiernos son ciertamente ambiciosos e impresionantes en su alcance, pero se presentan con una apariencia de certidumbre y objetividad que no merecen. Con ese fin, los defensores del Big Data evitan o minimizan la discusión de las dificultad dific ultades es metodológic metodológicas as de la evalua evaluación ción de impact impacto, o, ni tampoco tampoco reconoce reconocen n la dinámica política y organizacional que afecta la recolección de datos. Por ejemplo, cuan cu ando do los los po polí líti tico coss asign signan an a las co com mun uniidade dadess qu que e pa part rtic icip ipan an en las las intervenciones (en lugar de ser asignadas al azar), así como la interpretación de los hallazgos, que necesariamente está limitada por agendas institucionales y por la estructura de incentivos en la que está inmerso el investigador (Edwards, 2018). Sin duda, los macrodatos y los métodos de evaluación de impacto pueden ser insumos útiles para las discusiones sobre políticas en el contexto de las reformas de políticas y la gobernanza global. Sin embargo, es esencial que sus limitaciones sean comprendidas por quienes los producen y los utilizan para las reformas de 24
políticas, así como por los actores en todos los niveles. En la medida en que dichos métodos se utilicen cada vez más para guiar la política pública en todo el mundo, es esencial que los actores interesados, dentro y fuera de los sistemas educativos, educat ivos, estén al tanto de sus debilidad debilidades es metodológic metodológicas as y de su incapa incapacidad cidad para eliminar la política de la formulación de políticas. En efecto, si bien las prom pr omesa esass de dell Bi Big g Da Data ta so son n se sedu duct ctor oras, as, en ge gener neral al,, no ha re reem empl plaz azad ado o el elemento humano de la toma de decisiones. Es decir, aunque los datos pueden construir una cierta visión del mundo, y la interpretación de esos datos, ya sea por un investigador o por un programa de computadora, puede sugerir ciertas medidas de política, es poco probable que las decisiones de políticas importantes se auto au toma matitice cen n pr pron onto to.. La im impl plic icac ació ión n es, ent entonc onces es,, qu que e lo loss po polílítiticos cos y alto altoss funcionarios y los métodos en los que se basan deben sujetarse a un estándar más alto, uno que vaya más allá de la combinación de Big Data y la evaluación de impacto. En lugar de llevar a la mejor o a las mejores prácticas, la intersección de los macrodatos y las técnicas de evaluación de impacto puede conducir a estudios y, posteriormente, a reformas que son costosas, perjudiciales, contextualmente irrelevantes y/o inefectivas.
La atención debecondotras irigirseestrategias a mod(cualitativas) erar el usyo cambiando de estola s naturaleza métodos, complementándolos de la toma de decisiones, de un ejercicio que busca ser tecnocrático a uno que sea abierta e inevitablemente político. El Big Data no genera políticas sin política, más bien, oculta gran parte de los sesgos y el aspecto político del proceso con una apariencia de tecnificación. En el contexto actual de la gobernanza global, que se encuentra bajo la influencia de instituciones internacionales y los gobiernos nacionales que cooperan con ellas, es probable que esta situación no produzca benefic bene ficios ios sig signif nifica icativ tivos os par para a los más mar margin ginados ados,, ya que nin ningun guno o de est estos os actores se moviliza por un cálculo político que responda a las necesidades de los pobres. Comprender de manera crítica las limitaciones del Big Data y de las evaluaciones de impacto es solo un primer paso para desafiar el estatus quo de la gobernanza global enque general, es decir,impregnan pensar más allá de los métodos, la política política y las cosmovisiones actualmente y limitan el campo de la educativa global.
25
IMPACTO AMBIENTAL Con el Big Data ambiental, podemos tomar mejores decisiones que nunca y saber realmente qué está pasando con nuestro planeta y sus habitantes. Ejemplos de Big Data ambiental Algunas muestras de los múltiples datos que se recogen y analizan en el Big Data ambiental son, por ejemplo:
La evolución de especies, tanto en peligro de extinción como invasoras, y sus movimientos debido al cambio climático u otras circunstancias. Información de satélites sobre evolución, en tiempo real y de manera global, de desertización desertización,, reforestación, efectos de desastres ambientales, sequías sequías,, etc. Información globalizada y en tiempo real del clima en todas las partes del planeta. Calidad del aire y contaminación, contaminación, etc.
Las fuentes de datos son muchísimas, y no se ciñen solo a un ámbito estricto. El Big Data ambiental implica usar datos de campos relacionados, como el de la salud de las personas, para ver la conexión que existe.
'BIG DATA': HACIA UNA RESPONSABILIDAD SOCIAL DE DATOS 26
Debido a su actividad, las empresas son uno de los agentes que producen un mayor impacto impacto negativo sobre el medio ambient ambiente. e. Desde el cambi cambio o de milenio ya estamo est amoss vie viendo ndo en las estrat estrategi egias as y acc accion iones es que est están án imp implem lement entand ando o para minimizar dicho impacto. En los últimos años, el green data está contribuyendo contribuyendo a hacer a las empresas más sostenibles a través de su participación en:
La optimización de la gestión energética y el uso de los recursos. La reducción de las emisiones de dióxido de carbono derivadas de la producción. La reducción de las emisiones de las flotas de vehículos al mejorar las rutas. La anticipación a las necesidades de reparación y sustitución de la maquinaria monitorizada a través de sensores.
En definitiva, ayuda a las empresas a ser conscientes, no solo de sus impactos directos, sino de los más difíciles de controlar, los producidos a lo largo de toda su cadena de valor. El big data aplicado al medio ambiente persigue conseguir un mundo mejor para todos y ya se ha convertido en una poderosa herramienta de monitorización y control del desarrollo sostenible .
Green data': ¿Puede la estadística ayudar al medio ambiente? Solo en 2017 hemos generado más datos que en los 5.000 años previos. El 'big data da ta'' es la te tecn cnol olog ogía ía qu que e nos es está tá pe perm rmititie iend ndo o anal analiz izar ar esa exp explo losi sión ón de información para desarrollar nuevos avances y soluciones. La aplicación de datos masivos para la protección del medio ambiente está contribuyendo, asimismo, a optitimi op miza zarr la efic eficie ienc ncia ia de dell sec secto torr en energ ergét étic ico, o, a hac hacer er a la lass em empr presa esass má máss sostenibles y a crear ciudades inteligentes, por citar tan solo algunos ejemplos. La información se está multiplicando de manera exponencial: el 90% de los datos que existen hoy en Internet se han generado —únicamente— desde 2016. Y de acuerdo con estimaciones de IBM, en 2020 habrá en el mundo 300 veces más información de la que había en 2005. Un caótico universo de datos en perpetua expansión. Y es que la vida en el siglo XXI aparece codificada en forma de números, palabras clave y algoritmos. La aplicación de datos masivos para frenar el calentamiento global es lo que se conoce ya como green data. Europa cuenta con diferentes modelos generadores de gree green n da data ta y un uno o de ello elloss es Co Cope pern rnic icus us.. Se tr trat ata a de un pr prog ogra rama ma de observación de la Tierra por satélite capaz de calcular, entre otras cosas, la influencia del aumento de las temperaturas en el caudal de los ríos. Copernicus ya está est á apo aport rtan ando do in info form rmac ació ión n clav clave e par para a op optitimi miza zarr la ge gest stió ión n de lo loss rec recurs ursos os 27
hídricos, la biodiversidad hídricos, biodiversidad,, la calida calidad d del aire aire, la pesca o la agricultura. Otros proyect proy ectos os intern internaci aciona onales les que utiliz utilizan an el gree green n data data para para com combat batir ir el cam cambio bio climático son: Aqueduct: mide los peligros asociados al agua, analizando su calidad y cantidad, y pone a disposición del público mapas de riesgo interactivos. Global Forest Change: calcula la deforestación contando los árboles de uno en uno gracias a imágenes por satélite de alta resolución. Danger Dang er Ma Map: p: det determ ermin ina a la conta contami minac nació ión n gra graci cias as a lo loss da dato toss apo aport rtad ados os por por millones de ciudadanos.
'BIG DATA' Y ENERGÍAS RENOVABLES Apostar porfrente los datos puedefósiles. fortalecer la competitividad de aportaciones las energías renovables a losmasivos combustibles Veamos algunas de las del big data ambiental a las diferentes tecnologías limpias:
Energía eólica: el uso de algoritmos complejos para construir modelos predictivos de las condiciones eólicas ayuda a determinar la cantidad de energía que se va a producir. Energía fotovoltaica: los datos masivos optimizan la eficiencia de las centrales al permitir que vayan adaptándose a la intensidad lumínica del momento. Energía hidroeléctrica: el manejo de grandes volúmenes de datos puede contribuir, contri buir, entre otros avances, a evitar fugas en las centra centrales les y a tener un mayor control de los caudales de agua.
Asimismo, los consumidores del sector renovable también se verán beneficiados porr esta po esta re revo volu luci ción ón info inform rmat ativ iva. a. Po Porr un lado lado,, la cone conexi xión ón de los los da dato toss de los contadores inteligentes inteligentes con con las previsiones meteorológicas permitirá ajustar la dema de mand nda a en tiem tiempo po re real al,, favo favore reci cien endo do la cr crea eaci ción ón de tari tarifa fass tota totalm lmen ente te persona pers onaliz lizada adas. s. Por otr otro, o, el In Inte terne rnett de la lass Co Cosa sass pe perm rmititir irá á red reduci ucirr el ga gast sto o energético, por ejemplo, adaptando la iluminación y temperatura ambiental o el consumo de ciertos electrodomésticos a las necesidades de cada momento.
BIG DATA' Y CIUDADES INTELIGENTES
28
La ONU ONU aseg asegur ura a que que en 2030 2030 dos dos te terc rcio ios s de la pobl poblac ació ión n mund mundia iall se con co ncentr entra ará en las gra ran ndes ciudades. Es Estta re real aliida dad d plan planttea re rettos medioa med ioambi mbient entale aless que el gree green n data data ya está está ayud ayudan ando do a res resol olve ver. r. En Entr tre e la lass
iniciativas que están utilizando el análisis de datos masivos para crear ciudades más inteligentes y sostenibles destacan:
El proyecto Trash Track instala sensores con GPS en la basura para comprender mejor los caminos del reciclaje. El sis sistem tema a All AllAbo Aboard ard opt optim imiza iza la pla planif nifica icació ción n del tra transpo nsporte rte públic público o utilizando los datos de localización de los teléfonos móviles. La comunidad Crisis Mappers Net analiza datos de diferentes fuentes (imágenes (imáge nes de satélite, satélite, plataformas plataformas geoespa geoespaciales ciales,, simul simuladores, adores, etc.) para alertar de desastres naturales y favorecer una rápida respuesta. La Cop Copenh enhagen agen Whe Wheel el es una rue rueda da de bic bicicl icleta eta que rec recoge oge dat datos os sobre la calidad del aire, el nivel de ruido y las condiciones de la carretera. La empresa empresa Solar Roadways Roadways prete pretende nde sembrar el mundo de carret carreteras eras inteligentes hechas con paneles solares que permiten generar energía. Dispositivos que monitorizan la contaminación en las ciudades y que se han utilizado para realizar restricciones de tráfico.
29
BIBLIOGRAFIA.
30
i
Referencias [1] ZDNet.com, CBS Interactive,What is “Big Data?”. Disponible en: http://www.zdnet.com/ topic-big-data/, 2013. [2] thinkupapp.com,(2012). Disponible en: http:// thinkupapp.com/, 2012. [3] E. Dans. Disponible en: http://www.enriquedans.com/2011/10/big-dataunapequenaintroduccion.html, 2011. [4] E. Plugge, P. Membrey & T. Hawkins, The Definitive Guide to MongoDB: The NoSQL Database for Cloud and Desktop Computing, Published Apress Media LLC, New York, 2010 . [5] B. Hopkins, Beyond the Hype of Big Data. Disponible en: http://www.cio.com/ article/692724/Beyond_the_Hype_of_Big_Data, 2011. [6] Business Software, Disponible en: http://www. businessoftware.net/que-es-big-data/, 2013. [7] Zdnet.com, Big Data. Disponible en: http:// www.zdnet.com/search?q=big+data, 2010 [8] Big data, privacidad y protección de datos, Elena Gil Disponible en https://ignsl.es/historia-del-big-data/#:~:text=Sin%20embargo%2C%20la %20historia%20del,se%20remonta%20a%20mucho%20antes.&text=Si%20bien%20las %20cantidades%20no,un%20sistema%20para%20realizar%20c%C3%A1lculos.. %20cantidades%20no,un%20sistema%20para%20realizar%20c%C3%A1lculos Deaton,, Ang Deaton Angus us (20 (2010). 10). “In “Instr strume uments nts,, rand randomi omizat zation ion,, and lea learni rning ng abou aboutt dev develo elopme pment” nt”,, Jou ourrnal of Econom omiic Litera rattur ure e, vol. 48, núm. 2, pp. 424-4 -45 55. Disponible en: https://www.princeton.edu/~deaton/downloads/deaton%20instruments%20randomization %20learning%20about%20development%20jel%202010.pdf Deaton, Aangus y Cartwright, Nancy (2016). “The limitations of randomized controlled trials”, Vox, 9 de noviembre. noviembre . Disponible en: http://voxeu.org/article/limitations-randomised-controlledtrials Edwards Jr., D. Brent (2018). Global education policy, impact evalua evaluations, tions, and altern alternatives atives:: The political economy of knowledge production, Nueva York: Palgrave MacMillan. Disponible en: https://www.academia.edu/36174726/Global_Education_Policy_Impact_Evaluations_and_Alt ernatives_The_Political_Economy_of_Knowledge_Production?source=swp_share
Gorur, Radhika; Sellar, Sam y Steiner-Khamsi, Gita (2018). “Big Data and even bigger consequences”, en R. Gorur, S. Sellar y G. Steiner-Khamsi (eds.), World Yearbook of Education 2019: Comparative methodology in the era of Big Data and global networks, Nueva York: Routledge. Grek, Gre k, Sot Sotiri iria a (20 (2009). 09). “Governin “Governing g by num numbers bers:: The PISA PISA ‘effec ‘effect’t’ in Eur Europe” ope”,, Jour Journal nal of Education Policy, vol. 24, núm. 1, pp. 23-37. Disponible https://www.research.ed.ac.uk/portal/files/14608705/Governing_by_Numbers.pdf
en:
Klees, Steven (2016). “Inferences from regression analysis: Are they valid?”, Real-world Economics Review, vol. 74, pp. 85-97. Disponible en: http://www.paecon.net/PAEReview/issue74/Klees74.pdf
Gil, E. (2016). Big data, privacidad y proteccio proteccio n de datos. In Agencia In Agencia Estatal Boletín Boletín Oficial de dell Estado (Issue Estado (Issue June 2016). https://www.researchgate.net/profile/Elena_Gil_Gonzalez/pub https://www.researchgate.n et/profile/Elena_Gil_Gonzalez/publication/324831404_Big_dat lication/324831404_Big_dat a_privacidad_y_proteccion_de_datos/links/5ae6082207e9b9793c79b21/Big-dataprivacidad-y-proteccion-de-datos.pd Mayor Go Go mez, R. (2016). Contenido Y Novedades Del Re Reglamento glamento General De Proteccio Proteccio n De Datos De La Ue (Reglamento Ue 2016/679, De 27 De Abril De 2016). Gabilex: Revista Del Gabinete Juridico de Castilla-La Mancha, Mancha , 6, 25. www.gabilex.jccm.es Serrano, I. (2017). Transparencia & sociedad .
View more...
Comments