Unidad 1 Inteligencia de Negocios
Short Description
Download Unidad 1 Inteligencia de Negocios...
Description
ÍNDICE GENERAL 1. UNIDAD1: INTRODUCCIÓN A LA INTELIGENCIA DE NEGOCIOS. 1.1 Tipos de sistemas de información. 1.1.1 Sistemas OLTP. 1.1.2 Sistemas OLAP. 1.2 Inteligencia de Negocios. 1.2.1 Definición. 1.2.2 Importancia. 1.2.3 Componentes de la inteligencia de negocios. 1.2.3.1 Aplicaciones Analíticas. 1.2.3.2 Sistemas de reportes. 1.2.3.3 Bases de Datos Multidimensionales y Data Warehouse. 1.2.3.4 Data Mining. 1.2.3.5 Administración del Conocimiento. 1.3 Principales herramientas de la Inteligencia de Negocios.
Capítulo 1. Unidad1: Introducción a la Inteligencia de Negocios. Competencia específica a desarrollar Identificar los conceptos básicos, herramientas y componentes de la inteligencia de negocios. La Inteligencia de Negocios (Business Intelligence) se ha visto marcada por una clara evolución que lo destaca como un mercado maduro en los últimos años. La inteligencia de negocios es la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios.
Se ha producido un fortalecimiento mediante la compra de empresas pequeñas por parte de los principales agentes del mercado (SAP, IBM, Microsoft). Se ha enriquecido con soluciones open source que cubren la gama de necesidades de una organización para la explotación de la información. Han aparecido nuevas empresas enfocadas en la innovación cubriendo nuevos nichos en el mercado de la inteligencia de negocio como la visualización, y el análisis predictivo.
1.1TIPOS DE SISTEMAS DE INFORMACIÓN. La introducción de los sistemas de información (SI), en las empresas a contribuido al proceso de toma de decisiones, facilitan el logro de ventajas competitivas y automatizan los procesos operativos de las empresas. Para poder entender que es un sistema de información, primeramente se definen algunos conceptos relacionados al tema como son :
Sistema: Conjunto de elementos que interactúan para realizar un conjunto de funciones específicas. Datos: Representación formal de hechos, conceptos o instrucciones adecuada para su comunicación, interpretación y procesamiento por seres humanos o medios automáticos. Información: El significado que un ser humano le asigna a los datos.
Existen varios tipos de Sistemas de Información, desde el punto de vista administrativo éstos se pueden clasificar como se muestra en la siguiente imagen.
Nivel operativo
Apoyan a los gerentes operativos en el seguimiento de las actividades y transacciones elementales de la organización como ventas, ingresos, depósitos en efectivo, nomina, decisiones de crédito y flujo de materiales en una fábrica. Ejemplo: Un sistema para registrar los depósitos realizados en un cajero automático o uno que lleve el registro del número de horas trabajadas cada día por los empleados de una fábrica.
Sistema de Procesamiento de Transacciones (TPS)
Recolectan, almacenan, modifican y recuperan la información generada por las transacciones producidas en una organización. Si durante una transacción se produce un error, el TPS debe ser capaz de deshacer las operaciones realizadas hasta ese momento. Es muy útil para el procesamiento de transacciones on-line.
Nivel de conocimiento
Se utilizan para el mejoramiento de la calidad de los servicios de la organización y aporte de nuevos conocimientos, además de incrementar la productividad de los usuarios del sistema.
Sistemas de Conocimiento (KWS) (Knowledgeworksystem) (Sistemas del trabajo del conocimiento)
Auxilian a los trabajadores en la creación e integración de nuevo conocimiento en la organización. Están diseñados para aumentar la productividad de los trabajadores. Ejemplo: aplicaciones como Photoshop con la que diseñadores pueden crear arte publicitario.
Sistemas de Automatización de Oficina (OAS)
Aplicaciones destinadas a ayudar al trabajo diario del administrativo de una organización, forman parte de este tipo de software los procesadores de textos, las hojas de cálculo, los editores de presentaciones, los clientes de correo electrónico, etc. Ejemplo: Microsoft Office.
Nivel administrativo
Son utilizados por los administradores de nivel medio en la toma de decisiones. Tratan y comparan resultados notables para la compañía, y estudian sus trayectorias.
Sistemas de Información Gerencial (MIS)
Son el resultado de interacción participativa entre perso nas, tecnologías y procedimientos. Apoyan a nivel administrativo entregando información útil para el planteamiento, control y toma de decisiones. Ejemplo: sistema que reúna información de sistemas de información de nivel productivo sobre los productos (pedidos, costos y gastos) y genere reportes para la toma de decisiones. La mayoría de los informes para control administrativo están basados en resúmenes de las transacciones.
Sistemas de Apoyo a la Toma de Decisiones (DSS)
Herramienta para realizar el análisis de las diferentes variables de un negocio con la finalidad de apoyar el proceso de toma de decisiones. Su principal característica es la capacidad de análisis multidimensional (OLAP)(Procesamiento Analítico en Línea) que permite profundizar en la información hasta llegar a un alto nivel de detalle, analizar datos desde diferentes perspectivas, realizar proyecciones de información para pronosticar lo que puede ocurrir en el futuro, análisis de tendencias, análisis prospectivo, etc. Ejemplo: el sistema implantado por la New York State Office of General Services que permite que los ejecutivos verifiquen el estado por programa, comparando presupuestos y gastos y mostrando el gasto estimado hasta el final del año fiscal.
Nivel estratégico
Están basados en los resultados estratégicos a largo plazo de la compañía, son útiles para poder hacer frente a los impactos producidos por cambios en los negocios.
Sistemas de Soporte Gerencial (SSG)
Trabajan con información interna y externa a la organización y están diseñados para abordar la toma de decisiones que requieren juicio, evaluación y comprensión.
Ejemplo: un ejecutivo puede utilizar el sistema para conocer las ventas por país, línea de producto y, además, obtener el crecimiento esperado del segmento para los próximos 5 años en bases de datos externos.
Sistemas Expertos (SE)
Es una aplicación informática capaz de solucionar un conjunto de problemas que exigen un gran conocimiento sobre un determinado tema. Imitan el comportamiento de un experto en un dominio concreto y en ocasiones son usados por éstos. Con los sistemas expertos se busca una mejor calidad y rapidez en las respuestas dando así lugar a una mejora de la productividad del experto. Ejemplo: un sistema MRP (ManufacturingResourePlanning; Fabricación y Planificación de Recursos) diseñado para reducir el desperdicio en el proceso productivo.
Los Sistemas de Planificación de Recursos Empresariales (ERP)
Los ERP son sistemas que integran y manejan todo lo asociado con las operaciones de producción y aspectos de distribución y que son necesarios para el funcionamiento de los procesos de negocio de una organización, es decir, permiten la disponibilidad de toda la información para todo el mundo todo el tiempo. Son también llamados back office ya que no se involucra directamente a clientes y público general.
1.1.1
Sistemas OLTP
OLTP es la sigla en inglés de Procesamiento de Transacciones En Línea (OnLineTransactionProcessing) es un tipo de procesamiento que facilita y administra aplicaciones transaccionales, usualmente para entrada de datos y recuperación y procesamiento de transacciones (gestor transaccional). Los Sistemas de tipo OLTP lo conforman todos los sistemas de información que ejecutan datos operacionales del día a día y aumentar la capacidad de procesamiento de transacciones. Estos sistemas realizan principalmente 3 tipos de acciones sobre una Base de Datos, las cuales son: INSERT, DELETE y UPDATE que se manejan a nivel de transacciones Entre algunos ejemplos de sistemas OLTP de tienen los siguientes:
SAP Business One de la compañía SAP SAP R3 de la compañía SAP E-Business Suite de la compañía Oracle JD Edwards Enterprise One de la compañía Oracle PeopleSoft ERP de la compañía Oracle ERP O7/Solution
Estos tipos de sistema consisten principalmente de transacciones de tipo DML ( Data ManipulationLanguage(Lenguaje de Manipulación de Datos), sentencias de tipo insert, update o delete para el manejo de datos) dentro de la Base de Datos.
En la imagen de abajo se puede observar el flujo principal dentro de un sistema OLTP
Algunas de las características más comunes de este tipo de transacciones podrían ser: Altas/Bajas/Modificaciones Consultas rápidas, escuetas y predecibles Poco volumen de información e información disgregada Transacciones rápidas Gran nivel de concurrencia Modo de actualización on-line Baja redundancia de datos
Algunos ejemplos de este tipo de aplicaciones son: Compras Ventas Inventario Sueldos La tecnología OLTP se utiliza en innumerables aplicaciones, como en banca electrónica, procesamiento de pedidos, comercio electrónico, supermercados o industria.
Requisitos.
El proceso de transacciones en línea cada vez necesita más recursos para las transacciones que se transmiten por una red y que pueden integrar a más de una empresa. Por esta razón, el software actual para sistemas OLTP utiliza procesamiento clienteservidor y software de intermediación (middleware) que permite a las transacciones correr en diferentes plataformas en una red. Middleware: Es un software que asiste a una aplicación para interactuar o comunicarse con otras aplicaciones, software, redes, hardware y/o sistemas operativos. En grandes aplicaciones, la eficiencia del OLTP puede depender de lo perfeccionado que sea el software de gestión de transacciones (como CICS en plataformas IBM) o de que
tácticas de optimización se utilizan para facilitar la gran cantidad de actualizaciones concurrentes que se pueden producir en una base de datos orientada a OLTP. En los sistemas de bases de datos descentralizados más exigentes, los programas de intermediación OLTP distribuyen el procesamiento de transacciones entre varios ordenadores en una red. A menudo OLTP se integra en una arquitectura orientada a servicios o en un servicio Web. El OLTP emplea una estrategia de consignación o recuperación para asegurar que cada transacción sea procesada de manera correcta. Esta estrategia es esencial, porque las transacciones requieren una secuencia de pasos, y cada paso debe de llevarse a cabo de manera correcta para que se concluya la transacción.
Función de la Consignación o Recuperación
Se explica por medio del siguiente ejemplo: Si una persona retira efectivo de un cajero automático, la computadora del banco verifica que su cuenta contenga fondos suficientes antes de deducir el retiro de su cuenta y permitir que el cajero entregue el efectivo. Sin embargo, si el cajero no tiene efectivo, la transacción no procede, y el retiro no se deduce de su cuenta. Un TPS (sistema de procesamiento de transacciones) manda (consigna) una transacción y actualiza de manera permanente los registros de una base de datos solo si cada paso de la transacción se procesa de manera satisfactoria. Si falla un paso, fracasa toda la transacción y una recuperación devuelve los registros a su estado original. En la siguiente imagen se muestran los procesos que ocurren en un TPS
Un sistema de procesamiento de transacciones (TPS) se caracteriza por su capacidad para:
Recopilar, exhibir y modificar transacciones. Guardar transacciones. Enlistar transacciones.
Limitaciones de un TPS
1.1.2
Su capacidad para generar informes es limitada. Solo genera informes de detalles que ofrecen solo un registro básico de las transacciones concluidas.
Sistemas OLAP
OLAP es la sigla en inglés de Procesamiento Analítico en Línea (On-Line AnalyticalProcess). Son aplicaciones que se encargan de analizar datos del negocio para generar información táctica y estratégica que sirve de soporte para la toma de decisiones. Mientras que las transacciones OLTP utilizan Bases de Datos Relacionales u otro tipo de archivos, OLAP logra su máxima eficiencia y flexibilidad operando sobre Bases de datos Multidimensionales. Podemos nombrar las siguientes características como las más sobresalientes de estas aplicaciones:
Estructura de datos transparente al usuario. Solo Consulta, trabajan sobre la información operacional generada por los sistemas OLTP. Consultas sobre grandes volúmenes de datos no predecibles. Información histórica. Modo de actualización Batch. Alta redundancia de datos para facilitar la generación de consultas y obtener buenos tiempos de respuesta. Poderoso Back-end analítico para múltiples aplicaciones de usuarios. Trabaja con resúmenes de miles de registros condensados en una sola respuesta.
Su objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de Datos (un data warehouse, por ejemplo). Estos tipos de sistemas analíticos buscan facilitar la creatividad, centrándose en la estrategia a largo plazo y la ventaja competitiva dentro del negocio de una empresa.
Diferencias entre sistemas OLTP y OLAP
Sistemas OLTP
Sistemas OLAP
Datos
Valores actuales
Datos históricos y/o calculados
Organización
Por aplicación
Por áreas de la empresa
Acceso
Muy frecuente (lectura/escritura)
Baja frecuencia
Actualizaciones
Actualizaciones de campo
No se actualiza se manipula
Tiempo de respuesta
Medido por el tiempo de la transacción (del orden de segundos)
Medido por el tiempo de la consulta (del orden de minutos)
Tamaño de la BD
100 MB – GB
100 GB – TB
Usuarios
Miles
Cientos
Unidad de Trabajo
Transacciones
Consultas complejas
1.2
Ventajas de OLAP Es un poderoso paradigma de visualización. Proporciona tiempos de respuesta rápidos. Permite realizar consultas de manera interactiva. Es bueno para analizar grupos de datos organizados por series de tiempo. Permite identificar semejanzas y diferencias en la data. Permite realizar Pivot. Permite realizar Slice&Dice. Permite realizar Drill&Down.
INTELIGENCIA DE NEGOCIOS
1.2.1 Definición Se entiende por inteligencia de negocios (Business Intelligence) al conjunto de metodologías, aplicaciones, prácticas y capacidades enfocadas a la creación y administración de información que permite tomar mejores decisiones a los usuarios de una organización.
Algunas de las tecnologías que forman parte de la inteligencia de negocios son: Data warehouse:Es una colección de datos que es extraída desde diferentes fuentes de información a lo largo de la empresa Reporting:Herramientas para la elaboración de informes y listados, tanto en detalle como sobre información agregada Análisis OLAP (On-Line AnalyticalProcessing):Herramientas que manejan cuestiones complejas de bases de datos relacionales, proporcionando un acceso multidimensional a los datos Análisis visual: Permite comunicar complejos datos de negocios de forma rápida e intuitiva. Análisis predictivo:Es el proceso de seleccionar, explorar, y modelar grandes volúmenes de datos que develen información previamente desconocida para beneficio del negocio. Cuadro de mando: Es un conjunto de indicadores que aportan información sumarizada e inteligente al usuario. Cuadro de mando integral: Es un instrumento o metodología de gestión que facilita la implantación de la estrategia de la empresa de una forma eficiente Minería de datos:Es una técnica orientada a extraer información desde grandes volúmenes de datos. Gestión del rendimiento: Describe la metodología, las métricas, los procesos y sistemas empleados para supervisar y gestionar el rendimiento de una compañía
Reglas de negocio: Son un componente clave en cómo se toman las decisiones en
una empresa. Dashboards: Son resúmenes visuales de información del negocio, que muestran de una mirada la comprensión del global de las condiciones del negocio mediante métricas eIndicadores Clave de Desempeño (KPIs). Integración de datos (que incluye ETL,Extraccion, Transformacion y Carga):Permiten operar con fuentes de datos de cualquier tipo (integrando los datos
en una base de datos única (Datamart, Datawarehouse, etc.).
1.2.2 Importancia Un sistema de inteligencia de negocios es de gran importancia para las empresas en la actualidad ya que con su implantación proporciona diversos beneficios entre los que podemos destacar:
Crear un circulo integro de la información, esto se lograría con la transformación de los datos en información y esta genera un conocimiento que le permite a la empresa tomar mejores decisiones que se traducen en mejores resultados y que generan nuevos datos. Permitir una visión única, conformada, histórica, persistente y de calidad de toda la información. Crear, manejar y mantener métricas, indicadores claves de rendimiento (KPI, Key Performance Indicador) e indicadores claves de metas (KGI, Key GoalIndicator) fundamentales para la empresa. Aportar información actualizada tanto a nivel agregado como en detalle. Reducir las diferencias de enfoque de negocio entre el departamento de TI y la organización. Mejorar la comprensión y documentación de los sistemas de información en el contexto de una organización. Mejora de la competitividad de la organización como resultado de ser capaces de: Diferenciar lo relevante sobre lo innecesario. Acceder más rápido a la información. Tener mayor agilidad en la toma de decisiones.
Los beneficios de la inteligencia de negocios pueden clasificarse en tres categorías principales, las cuales son:
Reducción de costos. Incremento de ingresos. Mejoramiento de la satisfacción de los clientes.
Y esta lista no es exhaustiva ni detallada, pues los usuarios continúan encontrando formas nuevas de implementar inteligencia de negocios
1.2.3 Componentes de la Inteligencia de Negocios. Todas las soluciones de BI tienen funciones parecidas, pero deben de reunir al menos los siguientes componentes:
Multidimensionalidad: La información multidimensional se puede encontrar en hojas de cálculo, bases de datos, etc. Una herramienta de BI debe de ser capaz de reunir información dispersa en toda la empresa e incluso en diferentes fuentes para así proporcionar a los departamentos la accesibilidad, poder y flexibilidad que necesitan para analizar la información. Por ejemplo, un pronóstico de ventas de un nuevo producto en varias regiones no está completo si no se toma en cuenta también el comportamiento histórico de las ventas de cada región y la forma en que la introducción de nuevos productos se ha desarrollado en cada región en cuestión.
Data Mining (minería de datos): Las empresas suelen generar grandes cantidades de información sobre sus procesos productivos, desempeño operacional, mercados y clientes. Pero el éxito de los negocios depende por lo general de la habilidad para ver nuevas tendencias o cambios en las tendencias. Las aplicaciones de data mining pueden identificar tendencias y comportamientos, no sólo para extraer información, sino también para descubrir las relaciones en bases de datos que pueden identificar comportamientos que no muy evidentes.
Agentes: Los agentes son programas que piensan. Ellos pueden realizar tareas a un nivel muy básico sin necesidad de intervención humana. Por ejemplo: un agente pueden realizar tares un poco complejas, como elaborar documentos, establecer diagramas de flujo, etc.
Data Warehouse (almacén de datos): Es la respuesta de la tecnología de información a la descentralización en la toma de decisiones. Coloca información de todas las áreas funcionales de la organización en manos de quien toma las decisiones. También proporciona herramientas para búsqueda y análisis.
1.2.3.1 Aplicaciones Analíticas.
Data Mining, herramientas para minería de datos. OLAP, herramientas de procesamiento analítico de datos.
Herramientas de consulta y reporte de datos.
Herramientas de producción de reportes personalizados. ELT, herramientas de extracción, traducción y carga de datos.
Herramientas de administración de sistemas.
Portales de información empresarial.
Sistemas de base de datos.
Sistemas de administración del conocimiento.
Simulación y predicción. Son aplicaciones para simular escenarios y predecir tendencias en el futuro. “Si el precio de la materia prima crece un 5% a lo largo del
año y en tres meses el dólar sube 10%, ¿cómo afecta a nuestra venta al final del año?” “Si invertimos 10% más en esta línea de productos, ¿cómo cambia nuestra productividad y ROI?”
Activity-BasedCosting (actividad basada en costos). La determinación de los costes basados en actividades descubre los costes reales de los productos, servicios o clientes más allá de la contabilidad tradicional y desvela que por ejemplo dos clientes aparentemente igual de rentables según sus compras, en realidad causan costes muy diferentes, o que 25% de la actividad de la empresa causa80% de los costes.
Minería de Datos. Sistemas basados en algoritmos matemáticos para descubrir tendencias escondidas entre grandes volúmenes de datos. Aplicada desde la detección de fraude hasta el análisis de cesta de compra.
BalancedScorecard/Cuadro de Mando Integral. Un concepto de gestión de la estratégica empresarial desarrollado por Norton y Kaplan. Permite ver la empresa no sólo bajo la perspectiva financiera, sino también bajo otras como clientes, procesos o potenciales. Los objetivos estratégicos de las empresas se definen y su alcance se mide constantemente con datos reales.
Gestión de riesgo. Especialmente las entidades financieras y las aseguradoras, pero también otras empresas, necesitan calcular riesgos y simular escenarios. Las aplicaciones BI proporcionan todo el proceso.
Alertas y vigilancia. Ya no es necesario leer cada mañana muchas páginas de informes o mirar cada hora una pantalla para detectar si existe una situación crítica en algún lugar de la empresa. Se pueden vigilar automáticamente los indicadores de la actividad empresarial y generar avisos por email o SMS si un indicador está fuera de su rango normal, a cualquier ritmo y hora del día.
Fidelización de Clientes. Las aplicaciones ayudan a identificar que son los mejores o más rentables clientes y porque clientes abandonan la empresa. Proporcionan los datos para campañas y evalúan las respuestas y el impacto.
Consolidación. Automatización de consolidaciones contables entre empresas de un mismo grupo oentre sucursales. También se aplican en fusiones de empresas y adquisiciones.
1.2.3.2 Sistemas de Reportes.
Consultas y reportes
Se usa con propósito analítico Manipular los datos Realiza un pedido de datos Realiza la carga de los datos Darle formato a los datos Presentar los datos
QueryTool (herramienta de consultas): Un tipo específico de herramientas de acceso a datos por usuarios finales que invita al usuario a formas sus propias consultas manipulando directamente las tablas relacionales y sus uniones. Se diseñan Reportes de todo tipo incluyendo gráficos y parámetros de ingreso dejándolos en una librería para ser accedidos, mediante permisos, por los usuarios que correspondan.
1.2.3.3 Base de Datos Multidimensionales y Data Warehouse.
Base de datos multidimensionales Modelos Multidimensionales Técnica de diseño lógico para diseño de Data Warehouses. Proporcionan los mejores resultados. Diseños de acuerdo a un estándar que es intuitivo y fácil de entender. Permite accesos de alto rendimiento. Formado por una tabla cuya clave es compuesta, TableFact (tabla de hechos) y un conjunto de tablas más pequeñas denominadas Tablas de Dimensión. Su apariencia hace que se les denomine diagramas STAR.
Data Warehouse
Un Data Warehouse (DW) o almacén de datos es una colección de datos que es extraída desde diferentes fuentes de información a lo largo de la empresa (bases de datos departamentales, intranet, sistemas transaccionales, etc.) con la finalidad de permitir la realización de consultas y análisis, fundamentalmente, para ayudar a la toma de decisiones. Un sistema de DW apunta a disponer de una visión única de los clientes y proveer la mayor cantidad posible de información a los usuarios de la empresa, facilitándose el monitoreo del negocio. Los datos del DW poseen algunas cualidades fundamentales. La primera de ellas es que están orientados a temas, diferenciándose así de los sistemas transaccionales que estructuran los datos en procesos funcionales. Por otro lado, se trata de datos integrados, es decir, están consolidados, lo cual supone un proceso previo de depuración y homogeneización, etapa que puede ser una de las más complejas al implementar un DW. Por último, los datos son historiados, ya que mantienen el registro histórico de sus valores, lo cual redunda en que, a diferencia de los sistemas transaccionales, no sean “volátiles”.
1.2.3.4 Data Mining (minería de datos). Las técnicas de Data Mining son el resultado de un largo proceso de investigación y desarrollo de productos. Esta evolución comenzó cuando los datos de negocios fueron almacenados por primera vez en computadoras, y continuó con mejoras en el acceso a los datos, y más recientemente con tecnologías generadas para permitir a los usuarios navegar a través de los datos en tiempo real. Data Mining toma este proceso de evolución más allá del acceso y navegación retrospectiva de los datos, hacia la entrega de información prospectiva y proactiva. Data Mining está lista para su aplicación en la comunidad de negocios porque está soportado por tres tecnologías que ya están suficientemente maduras:
Recolección masiva de datos. Potentes computadoras con multiprocesadores. Algoritmos de Data Mining.
Principales características y objetivos de la Minería de Datos
Explorar los datos que se encuentran en las profundidades de las bases de datos, como los almacenes de datos, que algunas veces contienen información almacenada durante varios años. En algunos casos, los datos se consolidan en un almacén de datos y en mercados de datos; en otros, se mantienen en servidores de Internet e Intranet. El entorno de la minería de datos suele tener una arquitectura cliente servidor. Las herramientas de la minería de datos ayudan a extraer el mineral de la información enterrado en archivos corporativos o en registros públicos, archivados. El minero es, muchas veces un usuario final con poca o ninguna habilidad de programación, facultado por barrenadoras de datos y otras poderosas herramientas indagatorias para efectuar preguntas ad-hoc y obtener rápidamente respuestas.
Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos e inesperados. Las herramientas de la minería de datos se combinan fácilmente y pueden analizarse y procesarse rápidamente. Debido a la gran cantidad de datos, algunas veces resulta necesario usar procesamiento en paralelo para la minería de datos.
La minería de datos produce cinco tipos de información: Asociaciones. Secuencias.
Clasificaciones.
Agrupamientos. Pronósticos. Los mineros de datos usan varias herramientas y técnicas.
1.2.3.5 Administración del Conocimiento. De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algún significado especial pasan a convertirse en información. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación de la información y ese modelo representen un valor agregado, entonces nos referimos al conocimiento. El objetivo fundamental del KDD es encontrar conocimiento útil, válido, relevante y nuevo sobre un fenómeno o actividad mediante algoritmos eficientes, dadas las crecientes
órdenes de magnitud en los datos. Al mismo tiempo hay un profundo interés por presentar los resultados de manera visual o al menos de manera que su interpretación sea muy clara. Otro aspecto es que la interacción humano- máquina deberá ser flexible, dinámica y colaboradora. El resultado de la exploración deberá ser interesante y su calidad no debe ser afectada por mayores volúmenes de datos o por ruido en los datos. En este sentido, los algoritmos de descubrimiento de información deben ser altamente robustos. En la siguiente figura se ilustra la jerarquía que existe en una base de datos entre datos, información y conocimiento. Se observa igualmente el volumen que presenta en cada nivel y el valor que los responsables de las decisiones le dan en esa jerarquía. El área interna dentro del triángulo representa los objetivos que se han propuesto. La separación del triángulo representa la estrecha unión entre dato e información, no así entre la información y el conocimiento.
Jerarquía del Conocimiento.
1.3 PRINCIPALES HERRAMIENTAS DE LA INTELIGENCIA DE NEGOCIOS.
Herramientas Esenciales
Una solución de BI incluye la implementación de una serie de herramientas y técnicas orientadas a gestionar, explotar, distribuir y estructurar información. Entre ellas, destacan las siguientes:
Query&Report
Las herramientas de Query (consulta) y Report (reporte) son quizá las más conocidas en este ámbito, ya que son fundamentales para el desarrollo y manejo de listados e informes basados en la información presente en los almacenes de datos y Data Marts.
Data Warehouse
Un Data Warehouse (DW) o almacén de datos es una colección de datos que es extraída desde diferentes fuentes de información a lo largo de la empresa (bases de datos departamentales, intranet, sistemas transaccionales, etc.) con la finalidad de permitir la realización de consultas y análisis, fundamentalmente, para ayudar a la toma de decisiones.
Data Mart
Aunque para algunos se trata casi de un sinónimo de Data Warehouse, un Data Mart o cubo de datos puede entenderse como un subconjunto del repositorio de datos, que se orienta a un área específica del negocio, como recursos humanos, ventas o marketing, por ejemplo. En otras palabras, un Data Mart corresponde a un almacén de datos más restringido que un DW en cuanto al volumen de datos que contiene y al alcance dentro de la organización.
Herramientas OLAP
OLAP (On Line AnalyticalProcessing) son un conjunto de herramientas capaces de responder rápida y ágilmente a las solicitudes de información de los usuarios y que deben reflejar cualquier lógica de negocio por las que se consulte. En contraste con los sistemas transaccionales, OLTP (On Li ne TransactionProcessing), las herramientas OLAP presentan información multidimensional, es decir, desde múltiples perspectivas. Del mismo modo, los sistemas analíticos, al igual que los datos del Data Warehouse, están orientados a temas, y no sólo operan con datos actuales, sino también con datos históricos. Una de las principales cualidades de las herramientas de OLAP es identificar tendencias, es decir, permiten apoyar la toma decisiones considerando diversas variables, así como también permiten identificar cambios en las preferencias de los clientes. Sin embargo, aunque pueden responder consultas complejas y ratificar información, lo hacen siempre dependiendo del usuario, que es quien define las relaciones a considerar.
Data Mining
El Data Mining (DM) o minería de datos es una técnica orientada a extraer información desde grandes volúmenes de datos y corresponde a una de las claves de la inteligencia de negocios. El DM es un proceso conocido como KDD (KnowledgeDiscovery in Databases; Descubrimiento de Conocimiento en Bases de Datos) que consta de tres fases: preparación de los datos, extracción de información e interpretación de los resultados. Normalmente, el DM se realiza con las llamadas “técnicas de verificación” -en donde se prueba una hipótesis del usuario- y los “métodos de descubrimiento” -búsqueda de
patrones (incluyendo las técnicas de predicción)-. Lo anterior se traduce en análisis exploratorios, los cuales se apoyan en herramientas de visualización de datos y construcción de modelos, con el objetivo de realizar predicciones utilizando los patrones detectados en los datos conocidos con información del pasado.
View more...
Comments