Hogar / Consolas de juegos / Concepto de tecnologías olap. Tecnologías OLAP. Tipos de bases de datos

Concepto de tecnologías olap. Tecnologías OLAP. Tipos de bases de datos

Propósito del informe

Este informe se centrará en una de las categorías de tecnologías inteligentes que son una herramienta analítica conveniente: las tecnologías OLAP.

El propósito del informe: revelar y resaltar 2 cuestiones: 1) el concepto de OLAP y su importancia aplicada en la gestión financiera; 2) implementación de la funcionalidad OLAP en soluciones de software: diferencias, oportunidades, ventajas, desventajas.

Me gustaría señalar de inmediato que OLAP es una herramienta universal que se puede utilizar en cualquier área de aplicación, y no solo en finanzas (como se desprende del título del informe), lo que requiere el análisis de datos utilizando varios métodos.

Gestión financiera

La gestión financiera es un área en la que el análisis es más importante que cualquier otra. Cualquier decisión financiera y de gestión surge como resultado de determinados procedimientos analíticos. Hoy en día, la gestión financiera está adquiriendo importancia para el funcionamiento exitoso de una empresa. A pesar de que la gestión financiera es un proceso auxiliar en una empresa, requiere una atención especial, ya que las decisiones financieras y de gestión erróneas pueden provocar grandes pérdidas.

La gestión financiera tiene como objetivo dotar a la empresa de recursos financieros en los volúmenes necesarios, en el momento y en el lugar adecuados para obtener el máximo efecto de su uso mediante una distribución óptima.

Quizás sea difícil definir el nivel de “máxima eficiencia de recursos”, pero en cualquier caso,

El director financiero siempre debe saber:

  • ¿Cuántos recursos financieros hay disponibles?
  • ¿De dónde vendrán los fondos y en qué cantidades?
  • ¿Dónde invertir más eficazmente y por qué?
  • ¿Y en qué momentos es necesario hacer todo esto?
  • ¿Cuánto se necesita para garantizar el funcionamiento normal de la empresa?

Para obtener respuestas razonables a estas preguntas es necesario disponer, analizar y saber analizar un número suficientemente amplio de indicadores de desempeño. Además, FU cubre una gran cantidad de áreas: análisis del flujo de caja (flujo de caja), análisis de activos y pasivos, análisis de rentabilidad, análisis de márgenes, análisis de rentabilidad, análisis de surtido.

Conocimiento

Por tanto, un factor clave en la eficacia del proceso de gestión financiera es la disponibilidad de conocimientos:

  • Conocimiento personal en el área temática (se podría decir teórico y metodológico), incluida la experiencia, la intuición de un financiero/director financiero.
  • Conocimiento general (corporativo) o información sistemática sobre los hechos de las transacciones financieras en una empresa (es decir, información sobre el estado pasado, presente y futuro de la empresa, presentada en varios indicadores y mediciones)

Si el primero está en el alcance de las acciones de este financiero (o del director de recursos humanos que contrató a este empleado), entonces el segundo debe crearse intencionalmente en la empresa mediante los esfuerzos conjuntos de los empleados de los servicios financieros y de información.

¿Qué hay ahora?

Sin embargo, ahora en las empresas es típica una situación paradójica: hay información, hay mucha, demasiada. Pero se encuentra en un estado caótico: desestructurado, inconsistente, fragmentado, no siempre confiable y a menudo erróneo, es casi imposible de encontrar y obtener. Se lleva a cabo una generación larga y a menudo inútil de montañas de estados financieros, lo que resulta inconveniente para el análisis financiero y difícil de entender, ya que no se crea para la gestión interna, sino para su presentación a autoridades reguladoras externas.

Según los resultados de un estudio realizado por la empresa Reuters Entre 1.300 directivos internacionales, el 38 % de los encuestados afirma que dedica mucho tiempo a intentar encontrar la información que necesita. Resulta que un especialista altamente calificado dedica un tiempo muy bien remunerado no al análisis de datos, sino a recopilar, buscar y sistematizar la información necesaria para este análisis. Al mismo tiempo, los directivos están sobrecargados de datos que a menudo son irrelevantes, lo que reduce de nuevo la eficacia de su trabajo. El motivo de esta situación: exceso de información y desconocimiento.

Qué hacer

La información debe convertirse en conocimiento. Para las empresas modernas, la información valiosa, su adquisición, síntesis, intercambio y uso sistemáticos es una especie de moneda, pero para recibirla es necesario gestionar la información, como cualquier proceso empresarial.

La clave para la gestión de la información es entregar la información correcta en la forma correcta a las partes interesadas dentro de la organización en el momento adecuado. El objetivo de dicha gestión es ayudar a las personas a trabajar mejor juntas utilizando cantidades cada vez mayores de información.

Tecnología de la información en en este caso actuar como un medio mediante el cual sería posible sistematizar la información en una empresa, brindar acceso a ella a ciertos usuarios y brindarles las herramientas para transformar esta información en conocimiento.

Conceptos básicos de las tecnologías OLAP.

Tecnologías OLAP (del inglés On-Line Analytical Processing) no es el nombre de un producto específico, sino de toda una tecnología para el análisis operativo de datos multidimensionales acumulados en un almacén. Para comprender la esencia de OLAP es necesario considerar el proceso tradicional de obtención de información para la toma de decisiones.

Sistema tradicional de apoyo a la decisión.

Aquí, por supuesto, también puede haber muchas opciones: un completo caos de información o la situación más típica cuando la empresa tiene sistemas operativos con la ayuda de los cuales los hechos de determinadas operaciones se registran y almacenan en bases de datos. Para extraer datos de bases de datos con fines analíticos, se ha construido un sistema de consultas para muestras de datos específicas.

Pero este método de apoyo a las decisiones carece de flexibilidad y tiene muchas desventajas:

  • Se utiliza una cantidad insignificante de datos que pueden ser útiles para la toma de decisiones.
  • a veces se crean informes complejos de varias páginas, de las cuales en realidad se utilizan 1 o 2 líneas (el resto es por si acaso): sobrecarga de información
  • Respuesta lenta del proceso a los cambios: si se necesita una nueva representación de datos, la solicitud debe ser descrita y codificada formalmente por el programador, y luego ejecutada. Tiempo de espera: horas, días. O tal vez se necesite una solución ahora, de inmediato. Pero luego de recibir nueva información, surgirá una nueva pregunta (aclaradora)

Si los informes de consultas se presentan en un formato unidimensional, los problemas comerciales suelen ser multidimensionales y multifacéticos. Si desea obtener una imagen clara del negocio de una empresa, debe analizar los datos desde varias perspectivas.

Muchas empresas crean excelentes bases de datos relacionales, idealmente organizando montañas de información no utilizada, que por sí solas no proporcionan una respuesta rápida ni suficientemente competente a los acontecimientos del mercado. SÍ, las bases de datos relacionales fueron, son y serán la tecnología más adecuada para almacenar datos corporativos. No es acerca nueva tecnología DB, sino más bien de herramientas de análisis que complementen las funciones de los DBMS existentes y sean lo suficientemente flexibles para proporcionar y automatizar diferentes tipos análisis intelectual inherente a OLAP.

Entendiendo OLAP

¿Qué proporciona OLAP?

  • Herramientas avanzadas de acceso a datos de almacenamiento
  • Manipulación dinámica de datos interactivos (rotación, consolidación o desglose)
  • Visualización clara de datos
  • Rápido: el análisis se realiza en tiempo real
  • Presentación de datos multidimensionales: análisis simultáneo de una serie de indicadores en varias dimensiones.

Para obtener el efecto del uso de tecnologías OLAP, es necesario: 1) comprender la esencia de las tecnologías mismas y sus capacidades; 2) definir claramente qué procesos necesitan ser analizados, qué indicadores se caracterizarán y en qué dimensiones es recomendable verlos, es decir, crear un modelo de análisis.

Los conceptos básicos sobre los que operan las tecnologías OLAP son los siguientes:

Multidimensionalidad

Para comprender la multidimensionalidad de los datos, primero se debe presentar una tabla que muestre, por ejemplo, el desempeño de los Costos Empresariales por elementos económicos y unidades de negocio.

Estos datos se presentan en dos dimensiones:

  • artículo
  • unidad de negocio

Esta tabla no es informativa, ya que muestra las ventas durante un período de tiempo específico. Para diferentes períodos de tiempo, los analistas deberán comparar varias tablas (para cada período de tiempo):

La figura muestra una tercera dimensión, el Tiempo, además de las dos primeras. (Artículo, unidad de negocio)

Otra forma de mostrar datos multidimensionales es representarlos en forma de cubo:

Los cubos OLAP permiten a los analistas obtener datos en varios sectores para obtener respuestas a las preguntas planteadas por el negocio:

  • ¿Qué costos son críticos en qué unidades de negocio?
  • ¿Cómo cambian los costos unitarios de negocio con el tiempo?
  • ¿Cómo cambian los elementos de costo con el tiempo?

Las respuestas a tales preguntas son necesarias para la toma de decisiones de gestión: reducir ciertas partidas de costos, el impacto en su estructura, identificar las razones de los cambios en los costos a lo largo del tiempo, las desviaciones del plan y su eliminación, optimizando su estructura.

En este ejemplo, sólo se consideran 3 dimensiones. Es difícil representar más de 3 dimensiones, pero funciona de la misma manera que con 3 dimensiones.

Normalmente, las aplicaciones OLAP le permiten obtener datos en 3 o más dimensiones, por ejemplo, puede agregar una dimensión más: plan-real, categoría de costo: directo, indirecto, por pedidos, por meses. Las dimensiones adicionales le permiten obtener más sectores analíticos y proporcionar respuestas a preguntas con múltiples condiciones.

Jerarquía

OLAP también permite a los analistas organizar cada dimensión en una jerarquía de grupos, subgrupos y totales que reflejan la medida en toda la organización: la forma más lógica de analizar un negocio.

Por ejemplo, es recomendable agrupar los costes jerárquicamente:

OLAP permite a los analistas observar la métrica de resumen general (en el nivel superior) y luego profundizar hasta el nivel inferior y los niveles posteriores para descubrir la razón exacta por la que cambió la métrica.

Al permitir a los analistas utilizar múltiples dimensiones en un cubo de datos, con la capacidad de construir dimensiones jerárquicamente, OLAP proporciona una imagen del negocio que no está comprimida por la estructura del almacén de información.

Cambiar direcciones de análisis en un cubo (datos rotativos)

Como regla general, operan en conceptos: las dimensiones se especifican en columnas, filas (puede haber varias), el resto forma sectores, el contenido de la tabla forma dimensiones (ventas, costos, efectivo)

Normalmente, OLAP le permite cambiar la orientación de las dimensiones del cubo, presentando así los datos en diferentes vistas.

La visualización de los datos del cubo depende de:

  • orientaciones de dimensiones: qué dimensiones se especifican en filas, columnas, sectores;
  • grupos de indicadores, resaltados en filas, columnas, secciones.
  • Cambiar las dimensiones está dentro del alcance de las acciones del usuario.

Así, OLAP permite realizar varios tipos de análisis y comprender sus relaciones con sus resultados.

  • El análisis de desviaciones es un análisis de la implementación del plan, que se complementa con un análisis factorial de las causas de las desviaciones detallando los indicadores.
  • Análisis de dependencia: OLAP le permite identificar varias dependencias entre varios cambios, por ejemplo, cuando se eliminó la cerveza del surtido durante los primeros dos meses, se descubrió una caída en las ventas de cucarachas.
  • Comparación (análisis comparativo). Comparación de los resultados de los cambios en un indicador a lo largo del tiempo, para un determinado grupo de bienes, en diferentes regiones, etc.
  • El análisis de la dinámica nos permite identificar ciertas tendencias en los cambios de indicadores a lo largo del tiempo.

Eficiencia: podemos decir que OLAP se basa en las leyes de la psicología: la capacidad de procesar solicitudes de información en "tiempo real", al ritmo del proceso de comprensión analítica de los datos por parte del usuario.

Si una base de datos relacional puede leer alrededor de 200 registros por segundo y escribir 20, entonces un buen servidor OLAP, utilizando filas y columnas calculadas, puede consolidar entre 20.000 y 30.000 celdas (equivalente a un registro en una base de datos relacional) por segundo.

Visibilidad: Cabe destacar que OLAP proporciona medios avanzados de presentación gráfica de datos al usuario final. El cerebro humano es capaz de percibir y analizar información que se presenta en forma de imágenes geométricas, en un volumen varios órdenes de magnitud mayor que la información presentada en forma alfanumérica. Ejemplo: Digamos que necesitas encontrar una cara familiar en una de cien fotografías. Creo que este proceso no le llevará más de un minuto. Ahora imagine que en lugar de fotografías le ofrecen cien descripciones verbales de las mismas personas. Creo que no podrás resolver el problema propuesto en absoluto.

Sencillez : Caracteristica principal de estas tecnologías es que están destinadas a ser utilizadas por no especialistas en el campo tecnologías de la información, no un experto en estadística, sino un profesional en el campo aplicado: director del departamento de crédito, director del departamento de presupuesto y, finalmente, director. Están diseñados para que el analista se comunique con el problema, no con la computadora..

A pesar de las grandes capacidades de OLAP (además, la idea es relativamente antigua: años 60), su uso real prácticamente nunca se encuentra en nuestras empresas. ¿Por qué?

  • no hay información o las posibilidades no están claras
  • hábito de pensar en dos dimensiones
  • barrera de precio
  • Contenido tecnológico excesivo de los artículos dedicados a OLAP: los términos inusuales dan miedo: OLAP, "minería y división de datos", "consultas ad hoc", "identificación de correlaciones significativas"

Nuestro enfoque y el occidental sobre el uso de OLAP.

Además, también tenemos una comprensión específica de la utilidad de la aplicación de OLAP incluso al mismo tiempo que entendemos sus capacidades tecnológicas.

Nuestros autores rusos y nuestros de diversos materiales dedicados a OLAP expresan la siguiente opinión sobre la utilidad de OLAP: la mayoría percibe a OLAP como una herramienta que permite expandir y contraer datos de manera simple y conveniente, llevando a cabo las manipulaciones que le vienen a la mente al analista durante el proceso. proceso de análisis. Cuantos más “porciones” y “secciones” de datos ve el analista, más ideas tiene, lo que, a su vez, requiere cada vez más “porciones” para su verificación. No está bien.

La comprensión occidental de la utilidad de OLAP se basa en un modelo de análisis metodológico que debe incorporarse al diseñar soluciones OLAP. El analista no debe jugar con el cubo OLAP y cambiar sin rumbo sus dimensiones y niveles de detalle, orientación de los datos, visualización gráfica de los datos (¡y esto realmente requiere!), sino comprender claramente qué vistas necesita, en qué secuencia y por qué (por supuesto , los elementos "puede haber descubrimientos aquí, pero no es fundamental para la utilidad de OLAP).

Aplicaciones de OLAP

  • Presupuesto
  • Flujo de fondos

Una de las áreas de aplicación más fértiles de las tecnologías OLAP. No en vano ningún sistema presupuestario moderno se considera completo sin la presencia de herramientas OLAP para el análisis presupuestario. La mayoría de los informes presupuestarios se crean fácilmente sobre la base de sistemas OLAP. Al mismo tiempo, los informes responden a una amplia gama de preguntas: análisis de la estructura de gastos e ingresos, comparación de gastos de determinadas partidas en diferentes divisiones, análisis de la dinámica y tendencias de los gastos de determinadas partidas, análisis de costes y ganancias.

OLAP le permitirá analizar las entradas y salidas de efectivo en el contexto de las operaciones comerciales, las contrapartes, las monedas y el tiempo para optimizar sus flujos.

  • Informes financieros y de gestión (con análisis que la gestión necesita)
  • Marketing
  • Cuadro de Mando Integral
  • Análisis de Rentabilidad

Si tiene los datos adecuados, puede encontrar diversas aplicaciones de la tecnología OLAP.

productos OLAP

Esta sección discutirá OLAP como una solución de software.

Requisitos generales para productos OLAP.

Hay muchas formas de implementar aplicaciones OLAP, por lo que no debería haberse requerido, ni siquiera recomendado, ninguna tecnología en particular. En diferentes condiciones y circunstancias, un enfoque puede ser preferible a otro. Las técnicas de implementación incluyen muchas ideas propietarias diferentes de las que los proveedores están tan orgullosos: variaciones de la arquitectura cliente-servidor, análisis de series de tiempo, orientación a objetos, optimización del almacenamiento de datos, procesos paralelos, etc. Pero estas tecnologías no pueden ser parte de la definición de OLAP.

Hay características que se deben observar en todos los productos OLAP (si es un producto OLAP), que es el ideal de la tecnología. Estas son 5 definiciones clave que caracterizan a OLAP (la llamada prueba FASMI): Análisis rápido de información multidimensional compartida.

  • Rápido(FAST) significa que el sistema debería poder proporcionar la mayoría de las respuestas a los usuarios en aproximadamente cinco segundos. Incluso si el sistema advierte que el proceso llevará mucho más tiempo, los usuarios pueden distraerse y perder la cabeza, y la calidad del análisis se verá afectada. Esta velocidad no es fácil de lograr con grandes cantidades de datos, especialmente si se requieren cálculos especiales sobre la marcha. Los proveedores recurren a una amplia variedad de métodos para lograr este objetivo, incluidas formas especializadas de almacenamiento de datos, precomputación extensa o requisitos de hardware cada vez más estrictos. Sin embargo, actualmente no existen soluciones totalmente optimizadas. A primera vista, puede parecer sorprendente que al recibir un informe en un minuto, lo que no hace mucho tardaba días, el usuario se aburre rápidamente mientras espera y el proyecto resulta mucho menos exitoso que en el caso de un instante. respuesta, incluso a costa de un análisis menos detallado.
  • Compartido significa que el sistema permite cumplir con todos los requisitos de protección de datos e implementar el acceso distribuido y simultáneo a los datos para diferentes niveles de usuarios. El sistema debe poder manejar múltiples cambios de datos de manera oportuna y segura. Ésta es una debilidad importante de muchos productos OLAP, que tienden a asumir que todas las aplicaciones OLAP son de sólo lectura y proporcionan controles de seguridad simplificados.
  • Multidimensional es un requisito clave. Si tuvieras que definir OLAP en una palabra, la elegirías. El sistema debe proporcionar una vista conceptual multidimensional de los datos, incluido el soporte total para jerarquías y jerarquías múltiples, ya que esto determina la forma más lógica de analizar el negocio. No hay un número mínimo de dimensiones que deban procesarse, ya que esto también depende de la aplicación, y la mayoría de los productos OLAP tienen un número de dimensiones suficiente para los mercados a los que se dirigen. Nuevamente, no especificamos qué tecnología de base de datos subyacente debe usarse para que el usuario obtenga una visión conceptual verdaderamente multidimensional de la información. Esta característica es el corazón de OLAP.
  • Información. La información necesaria debe obtenerse donde se necesita, independientemente de su volumen y ubicación de almacenamiento. Sin embargo, mucho depende de la aplicación. La potencia de varios productos se mide en términos de la cantidad de datos de entrada que pueden procesar, pero no de cuántos gigabytes pueden almacenar. La potencia de los productos varía ampliamente: los productos OLAP más grandes pueden manejar al menos mil veces más datos que los más pequeños. Hay muchos factores a considerar a este respecto, incluida la duplicación de datos, los requisitos de RAM, el uso de espacio en disco, las métricas de rendimiento, la integración con almacenes de información, etc.
  • Análisis significa que el sistema puede manejar cualquier análisis lógico y estadístico específico de una aplicación determinada y garantiza que se almacene en una forma accesible para el usuario final. El usuario debería poder definir nuevos cálculos personalizados como parte del análisis sin necesidad de programación. Es decir, toda la funcionalidad de análisis requerida debe proporcionarse de forma intuitiva para los usuarios finales. Las herramientas de análisis podrían incluir ciertos procedimientos, como análisis de series temporales, asignación de costos, transferencias de divisas, búsqueda de objetivos, etc. Estas capacidades varían ampliamente entre productos, dependiendo de la orientación del objetivo.

En otras palabras, estas cinco definiciones clave son los objetivos para los que están diseñados los productos OLAP.

Aspectos tecnológicos de OLAP.

Un sistema OLAP incluye ciertos componentes. Existen varios esquemas para su funcionamiento que tal o cual producto puede implementar.

Componentes de los sistemas OLAP (¿en qué consiste un sistema OLAP?)

Normalmente, un sistema OLAP incluye los siguientes componentes:

  • Fuente de datos
    La fuente de donde se toman los datos para el análisis (almacén de datos, base de datos de sistemas contables operativos, conjunto de tablas, combinaciones de los anteriores).
  • servidor OLAP
    Los datos de la fuente se transfieren o copian al servidor OLAP, donde se sistematizan y preparan para una generación más rápida de respuestas a consultas.
  • cliente OLAP
    Interfaz de usuario para el servidor OLAP en el que opera el usuario.

Cabe señalar que no se requieren todos los componentes. Existen sistemas OLAP de escritorio que permiten analizar los datos almacenados directamente en la computadora del usuario y no requieren un servidor OLAP.

Sin embargo, el elemento que se requiere es la fuente de datos: la presencia de datos es pregunta importante. Si existen, en cualquier forma, como una tabla de Excel, en la base de datos del sistema contable o en forma de informes estructurados de las sucursales, el especialista en TI podrá integrarlos con el sistema OLAP directamente o con una conversión intermedia. Los sistemas OLAP tienen herramientas especiales para esto. Si estos datos no están disponibles o no están completos ni son de calidad suficiente, OLAP no ayudará. Es decir, OLAP es sólo una superestructura sobre los datos, y si no la hay, se vuelve algo inútil.

La mayoría de los datos de las aplicaciones OLAP se originan en otros sistemas. Sin embargo, en algunas aplicaciones (por ejemplo, planificación o elaboración de presupuestos), los datos se pueden crear directamente en aplicaciones OLAP. Cuando los datos provienen de otras aplicaciones, generalmente es necesario almacenarlos en un formulario separado y duplicado para la aplicación OLAP. Por tanto, es recomendable crear almacenes de datos.

Cabe señalar que el término "OLAP" está indisolublemente ligado al término "almacén de datos" (Data Warehouse). Un almacén de datos es una colección de datos inmutables, específicos de un dominio y basados ​​en el tiempo para respaldar la toma de decisiones de gestión. Los datos del almacén provienen de sistemas operativos (sistemas OLTP), que están diseñados para automatizar los procesos comerciales; el almacén se puede reponer a partir de fuentes externas, por ejemplo, informes estadísticos.

A pesar de que contienen información obviamente redundante que ya se encuentra en bases de datos o archivos del sistema operativo, los almacenes de datos son necesarios porque:

  • fragmentación de datos, almacenándolos en varios formatos DBMS;
  • El rendimiento de recuperación de datos mejora.
  • Si en una empresa todos los datos se almacenan en un servidor de base de datos central (lo cual es extremadamente raro), el analista probablemente no comprenderá sus estructuras complejas y a veces confusas.
  • Las consultas analíticas complejas de información operativa ralentizan el trabajo actual de la empresa, bloqueando tablas durante mucho tiempo y apoderándose de los recursos del servidor.
  • capacidad de limpiar y armonizar datos
  • es imposible o muy difícil analizar directamente los datos de los sistemas operativos;

El propósito del repositorio es proporcionar la “materia prima” para el análisis en un solo lugar y en una estructura simple y comprensible. Es decir, el concepto de almacenamiento de datos no es un concepto de análisis de datos, sino más bien un concepto de preparación de datos para el análisis. Implica la implementación de una única fuente de datos integrada.

Productos OLAP: arquitecturas

Al utilizar productos OLAP, dos preguntas son importantes: cómo y dónde mantener Y proceso datos. Dependiendo de cómo se implementen estos dos procesos, se distinguen las arquitecturas OLAP. Hay 3 formas de almacenar datos para OLAP y 3 formas de procesar estos datos. Muchos fabricantes ofrecen varias opciones, algunos intentan demostrar que su enfoque es el más prudente. Esto es, por supuesto, absurdo. Sin embargo, muy pocos productos pueden funcionar eficientemente en más de un modo.

Opciones de almacenamiento de datos OLAP

El almacenamiento en este contexto significa mantener los datos en un estado constantemente actualizado.

  • Bases de datos relacionales: esta es una opción típica si una empresa almacena datos contables en una RDB. En la mayoría de los casos, los datos deben almacenarse en una estructura desnormalizada (el más adecuado es un esquema en estrella). Una base de datos normalizada no es aceptable debido al muy bajo rendimiento de las consultas al generar agregados para OLAP (a menudo los datos resultantes se almacenan en tablas agregadas).
  • Archivos de base de datos en computadora cliente(quioscos o data marts): Estos datos pueden distribuirse previamente o crearse previa solicitud en las computadoras cliente.

Bases de datos multidimensionales: asume que los datos se almacenan en una base de datos multidimensional en un servidor. Puede incluir datos extraídos y resumidos de otros sistemas y bases de datos relacionales, archivos de usuario final, etc. En la mayoría de los casos, las bases de datos multidimensionales se almacenan en disco, pero algunos productos le permiten usar RAM, calculando los datos utilizados con más frecuencia sobre la marcha. " Muy pocos productos basados ​​en bases de datos multidimensionales permiten la edición múltiple de datos; muchos productos permiten una edición única pero múltiples lecturas de datos, mientras que otros se limitan a solo lectura.

Estas tres ubicaciones de almacenamiento tienen diferentes capacidades de almacenamiento y están dispuestas en orden descendente de capacidad. También tienen diferentes características de rendimiento de consultas: las bases de datos relacionales son mucho más lentas que las dos últimas opciones.

Opciones para procesar datos OLAP

Existen 3 de las mismas opciones de procesamiento de datos:

  • Uso de SQL: esta opción, por supuesto, se utiliza al almacenar datos en una RDB. Sin embargo, SQL no permite cálculos multidimensionales en una sola consulta, por lo que requiere escribir consultas SQL complejas para lograr algo más que una funcionalidad multidimensional básica. Sin embargo, esto no impide que los desarrolladores lo intenten. En la mayoría de los casos, realizan un número limitado de cálculos relevantes en SQL, con resultados que pueden obtenerse del procesamiento de datos multidimensionales o de la máquina cliente. También es posible utilizar memoria de acceso aleatorio, que puede almacenar datos utilizando más de una consulta: esto ha mejorado drásticamente la respuesta.
  • Procesamiento multidimensional en el cliente: el producto OLAP del cliente realiza los cálculos por sí mismo, pero dicho procesamiento sólo está disponible si los usuarios tienen PC relativamente potentes.

Procesamiento multidimensional del lado del servidor: este es un lugar popular para realizar cálculos multidimensionales en aplicaciones OLAP cliente-servidor y se utiliza en muchos productos. El rendimiento suele ser alto porque la mayoría de los cálculos ya se han realizado. Sin embargo, esto requiere mucho espacio en disco.

Matriz de arquitecturas OLAP

En consecuencia, combinando opciones de almacenamiento/procesamiento, es posible obtener una matriz de arquitecturas de sistemas OLAP. En consecuencia, teóricamente puede haber 9 combinaciones de estos métodos. Sin embargo, dado que 3 de ellos carecen de sentido común, en realidad sólo hay 6 opciones para almacenar y procesar datos OLAP.

Opciones de almacenamiento multidimensional
datos

Opciones
multidimensional
procesamiento de datos

Base de datos relacional

Base de datos multidimensional del lado del servidor

Computadora cliente

Magnitud de la cartesis

Procesamiento de servidor multidimensional

Crystal Holos (modo ROLAP)

Servidor IBM DB2 OLAP

CA EUREKA:Estrategia

MetaCube de Informix

Medios Speedware/MR

Servicios de análisis de Microsoft

Oracle Express (modo ROLAP)

Servidor de análisis piloto

Aplicación iTM1

hologramas de cristal

Decisión de compartir

Hyperion Essbase

Oráculo expreso

Medios Speedware/M

Servicios de análisis de Microsoft

Servidor empresarial PowerPlay

Servidor de análisis piloto

Aplicación iTM1

Procesamiento multidimensional en la computadora cliente.

Descubridor de oráculos

MetaCube de Informix

Perspectiva dimensional

Empresa Hyperion

Cognos PowerPlay

Expreso personal

Perspectivas de iTM1

Dado que es el almacenamiento el que determina el procesamiento, se acostumbra agrupar por opciones de almacenamiento, es decir:

  • Productos ROLAP en los sectores 1, 2, 3
  • OLAP de escritorio - en el sector 6

Productos MOLAP – en los sectores 4 y 5

Productos HOLAP (que permiten opciones de almacenamiento de datos tanto multidimensionales como relacionales): en 2 y 4 (en cursiva)

Categorías de productos OLAP

Hay más de 40 proveedores de OLAP, aunque no todos pueden considerarse competidores porque sus capacidades son muy diferentes y, de hecho, operan en diferentes segmentos del mercado. Se pueden agrupar en 4 categorías fundamentales, cuyas diferencias se basan en los siguientes conceptos: funcionalidad compleja - funcionalidad simple, rendimiento - espacio en disco. Es útil representar categorías en forma de cuadrado porque muestra claramente las relaciones entre ellas. El rasgo distintivo de cada categoría está representado en su lado, y las similitudes con otras están representadas en los lados adyacentes, por lo tanto, las categorías en lados opuestos son fundamentalmente diferentes.

Peculiaridades

Ventajas

Defectos

Representantes

OLAP aplicado

Aplicaciones completas con rica funcionalidad. Casi todos requieren de una base de datos multidimensional, aunque algunos trabajan con una relacional. Muchas de esta categoría de aplicaciones son especializadas, como ventas, fabricación, banca, elaboración de presupuestos, consolidación financiera y análisis de ventas.

Posibilidad de integración con varias aplicaciones.

Alto nivel de funcionalidad

Alto nivel de flexibilidad y escalabilidad

Complejidad de la aplicación (se requiere capacitación del usuario)

Precio alto

Soluciones Hyperion

Decisiones de cristal

Constructores de información

El producto se basa en una estructura de datos no relacional que proporciona almacenamiento, procesamiento y presentación multidimensional de datos. Durante el proceso de análisis, los datos se seleccionan exclusivamente de una estructura multidimensional. A pesar de nivel alto Apertura, los proveedores persuaden a los compradores para que compren sus propias herramientas.

Alto rendimiento (cálculos rápidos de indicadores resumidos y diversas transformaciones multidimensionales para cualquiera de las dimensiones). El tiempo medio de respuesta a una consulta analítica ad hoc cuando se utiliza una base de datos multidimensional suele ser entre 1 y 2 órdenes de magnitud menor que en el caso de una RDB.

Alto nivel de apertura: una gran cantidad de productos con los que es posible la integración

Hacen frente fácilmente a las tareas de incluir varias funciones integradas en el modelo de información, realizar análisis especializados por parte del usuario, etc.

La necesidad de un gran espacio en disco para almacenar datos (debido a la redundancia de los datos almacenados). Esto es extremadamente no uso eficiente memoria: debido a la desnormalización y la agregación preejecutada, el volumen de datos en la base de datos multidimensional corresponde a 2,5-100 veces menos que el volumen de los datos detallados originales. En cualquier caso, MOLAP no permite trabajar con grandes bases de datos. El límite real es una base de datos de 10 a 25 gigabytes.

El potencial de una “explosión” de la base de datos es un aumento inesperado, brusco y desproporcionado de su volumen.

Falta de flexibilidad a la hora de modificar estructuras de datos. Cualquier cambio en la estructura de las dimensiones casi siempre requiere una reestructuración completa del hipercubo.

Para bases de datos multidimensionales, actualmente no existen estándares uniformes para la interfaz, lenguajes para describir y manipular datos.

Hiperión (Essbase)

DOLAP (OLAP de escritorio)

Productos OLAP para clientes que son bastante fáciles de implementar y tienen un bajo costo por puesto

Estamos hablando de un procesamiento analítico en el que los hipercubos son pequeños, su tamaño es pequeño, las necesidades son modestas y para dicho procesamiento analítico es suficiente una máquina personal en un escritorio.

El objetivo de los productores de este mercado es automatizar cientos y miles de trabajos, pero los usuarios deben realizar un análisis bastante sencillo. A menudo se anima a los compradores a comprar más puestos de trabajo de los necesarios.

Buena integración con bases de datos: multidimensional, relacional.

Posibilidad de realizar compras complejas, lo que reduce el coste de ejecución de proyectos.

Facilidad de uso de las aplicaciones.

Funcionalidad muy limitada (no comparable a este respecto con productos especializados)

Potencia muy limitada (pequeños volúmenes de datos, pequeño número de mediciones)

Cognos (PowerPlay)

Objetos de negocio

Decisiones de cristal

Este es el sector más pequeño del mercado.

Los datos detallados permanecen donde estaban originalmente: en la base de datos relacional; algunos agregados se almacenan en la misma base de datos en tablas de servicios creadas especialmente

Capaz de manejar grandes cantidades de datos (almacenamiento rentable)

Proporcionar un modo de operación multiusuario, incluido el modo de edición, y no solo lectura

Mayor nivel de protección de datos y buenas opciones para diferenciar los derechos de acceso

Es posible realizar cambios frecuentes en la estructura de medición (no requieren reorganización física de la base de datos)

Bajo rendimiento, significativamente inferior en términos de velocidad de respuesta a las multidimensionales (la respuesta a consultas complejas se mide en minutos o incluso horas en lugar de segundos). Estos son mejores creadores de informes que las herramientas de análisis interactivas

Complejidad de productos. Requiere importantes costos de mantenimiento por parte de especialistas en tecnología de la información. Para proporcionar un rendimiento comparable al de MOLAP, los sistemas relacionales requieren un diseño cuidadoso del esquema de la base de datos y ajuste de los índices, es decir, mucho esfuerzo por parte de los administradores de la base de datos.

Caro de implementar

Las limitaciones de SQL siguen siendo una realidad, lo que impide la implementación en RDBMS de muchas funciones integradas que se proporcionan fácilmente en sistemas basados ​​​​en una representación multidimensional de datos.

Ventaja de la información

Informix (MetaCube)

Cabe señalar que los consumidores de productos híbridos que permiten elegir el modo ROLAP y MOLAP, como Microsoft Analysis Services, Oracle Express, Crystal Holos, IBM DB2 OLAPServer, casi siempre seleccionan el modo MOLAP.

Cada una de las categorías presentadas tiene sus propias fortalezas y debilidades; no existe una única opción óptima. La elección afecta a 3 aspectos importantes: 1) rendimiento; 2) espacio en disco para almacenamiento de datos; 3) capacidades, funcionalidad y especialmente la escalabilidad de la solución OLAP. En este caso, es necesario tener en cuenta el volumen de datos que se procesan, la potencia del equipo, las necesidades del usuario y buscar un compromiso entre velocidad y redundancia del espacio en disco ocupado por la base de datos, simplicidad y multifuncionalidad.

Clasificación de los Data Warehouses según el volumen de la base de datos de destino

Desventajas de OLAP

Como cualquier tecnología OLAP, también tiene sus inconvenientes: altos requisitos de hardware, capacitación y conocimiento del personal administrativo y usuarios finales, altos costos para la implementación del proyecto de implementación (tanto monetarios como de tiempo, intelectuales).

Seleccionar un producto OLAP

Elegir el producto OLAP adecuado es difícil, pero muy importante si quieres que el proyecto no falle.

Como puede ver, las diferencias entre productos se encuentran en muchas áreas: funcional, arquitectónica y técnica. Algunos productos tienen una configuración muy limitada. Algunos se crean para áreas temáticas especializadas: marketing, ventas, finanzas. Hay productos de uso general, que no tienen un uso específico de aplicación, por lo que deben ser bastante flexibles. Como regla general, estos productos son más baratos que los especializados, pero los costos de implementación son mayores. La gama de productos OLAP es muy amplia: desde las herramientas más simples para crear tablas dinámicas y gráficos que forman parte de productos de oficina, hasta herramientas para analizar datos y buscar patrones, que cuestan decenas de miles de dólares.

Como en cualquier otro campo, en el campo OLAP no puede haber pautas claras para la elección de herramientas. Solo puede centrarse en una serie de puntos clave y comparar las capacidades del software propuestas con las necesidades de la organización. Una cosa es importante: si no piensas adecuadamente en cómo vas a utilizar las herramientas OLAP, corres el riesgo de crearte un gran dolor de cabeza.

Durante el proceso de selección, hay 2 preguntas a considerar:

  • evaluar las necesidades y capacidades de la empresa
  • evaluar la oferta existente en el mercado, las tendencias de desarrollo también son importantes

Luego compare todo esto y, de hecho, tome una decisión.

Necesita valoración

No se puede hacer una elección racional de un producto sin comprender para qué se utilizará. Muchas empresas quieren el “mejor producto posible” sin tener una idea clara de cómo se debe utilizar.

Para que el proyecto se implemente con éxito, el director financiero debe, como mínimo, formular de manera competente sus deseos y requisitos al gerente y a los especialistas del servicio de automatización. Muchos problemas surgen debido a una preparación y conocimiento insuficientes para la elección de los especialistas de TI y los usuarios finales experimentan dificultades de comunicación simplemente porque manipulan diferentes conceptos y términos durante la conversación y presentan preferencias contradictorias. Es necesario que haya coherencia en los objetivos dentro de la empresa.

Algunos factores ya se han vuelto obvios después de leer la descripción general de las categorías de productos OLAP, a saber:

Aspectos técnicos

  • Fuentes de datos: almacén de datos corporativo, sistema OLTP, archivos de tablas, bases de datos relacionales. Posibilidad de vincular herramientas OLAP con todos los DBMS utilizados en la organización. Como muestra la práctica, la integración de productos heterogéneos en un sistema operativo estable es una de las cuestiones más importantes y su solución en algunos casos puede conllevar grandes problemas. Es necesario comprender con qué facilidad y confiabilidad es posible integrar las herramientas OLAP con los DBMS existentes en la organización. También es importante evaluar las posibilidades de integración no solo con fuentes de datos, sino también con otras aplicaciones a las que pueda necesitar exportar datos: correo electrónico, aplicaciones ofimáticas.
  • Variabilidad de los datos tenidos en cuenta.
  • Plataforma de servidor: NT, Unix, AS/400, Linux, pero no insista en que los productos con especificación OLAP se ejecuten en plataformas cuestionables o moribundas que todavía esté utilizando.
  • Estándares del lado del cliente y del navegador
  • Arquitectura implementable: la red local y conexión de módem de PC, cliente/servidor de alta velocidad, intranet, extranet, Internet
  • Funciones internacionales: soporte multidivisa, operaciones multilingües, intercambio de datos, localización, licencias, actualización de Windows

Cantidades de información de entrada que están disponibles y que aparecerán en el futuro

Usuarios

  • Área de aplicación: análisis de ventas/marketing, elaboración de presupuestos/planificación, análisis de desempeño, análisis de informes contables, análisis cualitativo, situación financiera, generación de materiales analíticos (informes)
  • Número de usuarios y su ubicación, requisitos para la división de derechos de acceso a datos y funciones, secreto (confidencialidad) de la información
  • Tipo de usuario: alta dirección, finanzas, marketing, RRHH, ventas, producción, etc.
  • Experiencia de usuario. Nivel de habilidad del usuario. Considere brindar capacitación. Es muy importante que la aplicación cliente OLAP esté diseñada para que los usuarios se sientan seguros y puedan utilizarla de forma eficaz.

Características clave: Necesidades de escritura de datos, Computación distribuida, Conversiones de moneda complejas, Necesidades de impresión de informes, Interfaz de hoja de cálculo, Complejidad de la lógica de la aplicación, Dimensiones requeridas, Tipos de análisis: Estadístico, Búsqueda de objetivos, Análisis hipotético

Implementación

  • Quién participará en la implementación y operación: consultores externos, función interna de TI o usuarios finales
  • Presupuesto: software, hardware, servicios, transferencia de datos. Recuerde que pagar las licencias de productos OLAP es sólo una pequeña parte del coste total del proyecto. Los costos de implementación y hardware pueden ser mayores que la tarifa de la licencia, y es casi seguro que los costos de soporte, operación y administración a largo plazo sean significativamente mayores. Y si toma la decisión equivocada de comprar el producto equivocado simplemente porque es más barato, puede terminar con un costo general del proyecto más alto debido a mayores costos de mantenimiento, administración y/o hardware, por lo que probablemente obtendrá un menor nivel de beneficios comerciales. . Al estimar los costos totales, asegúrese de hacer las siguientes preguntas: ¿Qué tan amplias son las fuentes de implementación, capacitación y soporte disponibles? ¿Es probable que el fondo general potencial (empleados, contratistas, consultores) crezca o se reduzca? ¿Hasta qué punto puede utilizar su experiencia profesional industrial?

A pesar de que el costo de los sistemas analíticos sigue siendo bastante alto incluso hoy en día, y las metodologías y tecnologías para implementar dichos sistemas aún están en su infancia, hoy el efecto económico que proporcionan supera significativamente el efecto de los sistemas operativos tradicionales.

El efecto de una adecuada organización, planificación estratégica y operativa del desarrollo empresarial es difícil de cuantificar de antemano, pero es obvio que puede superar los costes de implementación de dichos sistemas en decenas e incluso cientos de veces. Sin embargo, no hay que equivocarse. El efecto no lo garantiza el sistema en sí, sino las personas que trabajan con él. Por tanto, afirmaciones como: “un sistema de Data Warehousing y tecnologías OLAP ayudarán al directivo a tomar las decisiones correctas” no son del todo correctas. Los sistemas analíticos modernos no son sistemas de inteligencia artificial y no pueden ayudar ni obstaculizar la toma de decisiones. Su objetivo es proporcionar rápidamente al gerente toda la información necesaria para tomar una decisión de forma conveniente. Y qué información se solicitará y qué decisión se tomará en base a ella depende únicamente de la persona específica que la utilice.

Todo lo que queda por decir es que estos sistemas pueden ayudar a resolver muchos problemas empresariales y pueden tener efectos positivos de gran alcance. Queda por ver quién será el primero en darse cuenta de los beneficios de este enfoque y adelantarse a los demás.

La principal diferencia entre hechos e información es que recibimos y tomamos en cuenta datos, y podemos utilizar la información para beneficiarnos. A grandes rasgos, la información son datos analizados y sistematizados. Gracias a la información recibida oportunamente, muchas empresas logran sobrevivir tanto a la crisis financiera como a la competencia más feroz. No basta con recopilar hechos y disponer de todos los datos necesarios. También es necesario poder analizarlos. Para facilitar el trabajo de las personas llamadas a tomar decisiones comerciales importantes, varios sistemas apoyo. Es para ello que se han desarrollado diversos sistemas complejos que permiten analizar grandes cantidades de datos heterogéneos y convertirlos en información útil para el usuario empresarial. El nuevo campo de la analítica empresarial tiene como objetivo mejorar el control de procesos de los sistemas empresariales mediante el uso de tecnología y almacenamiento de datos.

El mercado de sistemas de información empresarial ofrece hoy en día una selección diversa de soluciones que ayudan a una empresa a organizar la contabilidad de gestión, garantizar la gestión operativa de la producción y las ventas y llevar a cabo una interacción eficaz con clientes y proveedores.

Un nicho separado en el mercado de sistemas empresariales lo ocupan los productos de software analítico diseñados para respaldar la toma de decisiones en el nivel estratégico de la gestión empresarial. La principal diferencia entre estas herramientas y los sistemas de gestión operativa es que estos últimos proporcionan gestión empresarial en el "modo de funcionamiento", es decir, la implementación de un programa de producción bien definido, mientras que los sistemas analíticos de nivel estratégico ayudan a la gestión empresarial a desarrollar decisiones en el “modo de desarrollo”.

La escala de los cambios llevados a cabo puede variar desde una reestructuración profunda hasta una actualización parcial de las tecnologías en los sitios de producción individuales, pero, en cualquier caso, los tomadores de decisiones consideran alternativas de desarrollo de las que depende el destino de la empresa a largo plazo.

No importa cuán poderoso y desarrollado sea el sistema de información empresarial, no puede ayudar a resolver estos problemas, en primer lugar, porque está configurado para procesos comerciales estacionarios y establecidos y, en segundo lugar, no contiene ni puede contener información para tomar decisiones sobre nuevas áreas de negocios, nuevas tecnologías, nuevas decisiones organizacionales.

Gracias a la tecnología de análisis y procesamiento de datos OLAP (On-Line Analytical Processing), cualquier organización puede obtener casi instantáneamente (en cinco segundos) los datos necesarios para trabajar. OLAP se puede definir brevemente mediante cinco palabras clave.

FAST (Rápido): esto significa que el tiempo para buscar y proporcionar la información necesaria no toma más de cinco segundos. lo mas consultas simples se procesan en un segundo y pocas consultas complejas tienen un tiempo de procesamiento de más de veinte segundos. Para lograr este resultado, se utilizan varios métodos, desde formas especiales de almacenamiento de datos hasta extensos cálculos previos. De esta manera, puede obtener un informe en un minuto que antes tardaba días en prepararse.

ANÁLISIS (Analítico) dice que el sistema puede realizar cualquier análisis, tanto estadístico como lógico, y luego lo almacena en un formato accesible.

COMPARTIDO significa que el sistema proporciona la privacidad requerida hasta el nivel de la celda

MULTIDIMENSIONAL (Multidimensional) es la principal característica de OLAP. El sistema debe admitir completamente jerarquías y jerarquías múltiples, ya que esta es la forma más lógica de analizar las actividades comerciales y organizativas.

INFORMACIÓN. La información correcta debe entregarse donde se necesita.

Cuando opera una organización, siempre se acumulan datos relacionados con su campo de actividad, que a veces se almacenan en lugares completamente diferentes, y reunirlos es difícil y requiere mucho tiempo. Con el fin de acelerar la adquisición de datos para probar las hipótesis comerciales emergentes, se desarrolló la tecnología de procesamiento de datos analíticos interactivos, u OLAP. El objetivo principal de estos sistemas OLAP es responder rápidamente a las solicitudes arbitrarias de los usuarios. Esta necesidad surge muchas veces a la hora de desarrollar algún proyecto empresarial importante, cuando el desarrollador necesita una hipótesis de trabajo que ha surgido. En la mayoría de los casos, la información que el usuario necesita debe presentarse en forma de algún tipo de dependencia; por ejemplo, cómo depende el volumen de ventas de la categoría de producto, de la región de ventas, de la época del año, etc. Gracias a OLAP, puede obtener inmediatamente los datos necesarios en el diseño deseado para el período seleccionado.

La tecnología OLAP interactiva le permite transformar enormes cantidades de informes y montañas de datos en información útil y precisa que ayudará a un empleado a tomar una decisión comercial o financiera informada en el momento adecuado.

Además, gracias a OLAP, la eficiencia del procesamiento aumenta y el usuario puede recibir grandes volúmenes de información ordenada (agregada) casi al instante. Gracias a OLAP, el usuario puede ver claramente con qué eficiencia opera su organización, tiene la capacidad de responder de manera rápida y flexible a los cambios externos y tiene la capacidad de minimizar las pérdidas financieras de su organización. OLAP proporciona información precisa que mejora la calidad de las decisiones tomadas.

El único inconveniente de los sistemas de análisis empresarial es su elevado coste. Crear un almacenamiento de información personal requiere tiempo y mucho dinero.

El uso de la tecnología OLAP en los negocios le permite obtener rápidamente la información necesaria que, a petición del usuario, se puede presentar en la forma habitual: informes, gráficos o tablas.

Los procedimientos de integración de sistemas para estructuras empresariales se basan en el uso decisiones conjuntas ERP, CRM y SCM. En muchos casos, los sistemas son suministrados por diferentes fabricantes y los datos importados deben someterse a una armonización y presentarse como datos heterogéneos. En un entorno empresarial, existe un requisito inequívoco: un análisis completo de los datos, lo que implica ver informes consolidados desde diferentes puntos de vista.

Los diferentes fabricantes tienen diferentes mecanismos de presentación de datos. El procedimiento de representación heterogénea implica extraer, transformar y cargar (ETL). Por ejemplo, en Microsoft SQL Server 2005 Analysis Services, el problema de la consolidación de datos se implementa mediante vistas de fuentes de datos, tipos de fuentes de datos que describen modelos de presentación analítica.

Aplicaciones empresariales basadas en tecnologías OLAP, ejemplos de productos. Las aplicaciones más comunes de las tecnologías OLAP son:

Análisis de los datos.

La tarea para la que originalmente se utilizaron y siguen siendo las herramientas OLAP más populares. Un modelo de datos multidimensional, la capacidad de analizar cantidades significativas de datos y una respuesta rápida a las solicitudes hacen que estos sistemas sean indispensables para analizar ventas, actividades de marketing, distribución y otras tareas con un gran volumen de datos originales.

Ejemplos de productos: Microsoft Excel Tablas dinámicas, Microsoft Analysis Services, SAP BW, Oracle Essbase, Oracle OLAP, Cognos PowerPlay, MicroStrategy, Business Objects.

Planificación financiera-presupuestación.

Un modelo multidimensional le permite ingresar datos simultáneamente y analizarlos fácilmente (por ejemplo, planificar el análisis de hechos). Por lo tanto, varios productos CPM (Corporate Performance Management) modernos utilizan modelos OLAP%. Una tarea importante es el cálculo inverso multidimensional (resolución inversa, reescritura, reescritura), que le permite calcular los cambios requeridos en celdas detalladas cuando cambia el valor agregado. Es una herramienta para el análisis de qué pasaría si, es decir. para jugar varias opciones para eventos durante la planificación.

Ejemplos de productos: Microsoft PerformancePint, Oracle EPB, Oracle OFA, Oracle Hyperion Planning, SAP SEM, Cognos Enterprise Planning, Geac.

Consolidación financiera.

La consolidación de datos según las normas contables internacionales, teniendo en cuenta las participaciones, las diferentes monedas y el volumen de negocios interno, es una tarea urgente en relación con los requisitos cada vez más estrictos de los organismos de control (SOX, Basilea II) y de las empresas que cotizan en bolsa. Las tecnologías OLAP le permiten acelerar el cálculo de informes consolidados y aumentar la transparencia de todo el proceso.

Ejemplos de productos: Oracle FCH, Oracle Hyperion FM, Cognos Controller.

Tecnologías de almacenamiento de datos y procesamiento analítico en línea (OLAP)
son elementos importantes de apoyo a las decisiones empresariales, que se están convirtiendo cada vez más en una parte integral de cualquier industria. El uso de tecnologías OLAP como herramienta de análisis de negocios brinda más control y acceso oportuno a información estratégica.
información que facilite la toma de decisiones efectiva.
Esto brinda la oportunidad de simular pronósticos de la vida real y utilizar los recursos de manera más eficiente. OLAP permite a una organización responder más rápidamente a las demandas del mercado.

Bibliografía:

1. Erik Thomsen. Soluciones OLAP: Construcción de sistemas de información multidimensionales Segunda edición. Wiley Computer Publishing John Wiley & Sons, Inc., 2002.

2. Libro blanco del consejo de OLAP, http://www.olapcouncil.org/research/whtpaply.htm

3. Gerd Stumme y Bernhard Ganter. Análisis de conceptos formales _ Fundamentos matemáticos.

El propósito del trabajo del curso es estudiar la tecnología OLAP, el concepto de su implementación y estructura.

En el mundo moderno, las redes informáticas y los sistemas informáticos permiten analizar y procesar grandes cantidades de datos.

Una gran cantidad de información complica enormemente la búsqueda de soluciones, pero permite obtener cálculos y análisis mucho más precisos. Para solucionar este problema, existe toda una clase de sistemas de información que realizan análisis. Estos sistemas se denominan sistemas de apoyo a la decisión (DSS) (Sistema de apoyo a la decisión).

Para realizar el análisis, el DSS debe acumular información, disponiendo de medios para su ingreso y almacenamiento. En total, podemos distinguir tres tareas principales resueltas en el DSS:

· Entrada de datos;

· almacenamiento de datos;

· análisis de los datos.

La entrada de datos en el DSS se realiza automáticamente mediante sensores que caracterizan el estado del medio ambiente o del proceso, o por un operador humano.

Si la entrada de datos se realiza automáticamente desde los sensores, los datos se acumulan mediante una señal de disponibilidad que se produce cuando aparece información o mediante un sondeo cíclico. Si la entrada la realiza una persona, entonces esta debe proporcionar a los usuarios medios convenientes para ingresar datos, verificar la exactitud de la entrada y realizar los cálculos necesarios.

Al introducir datos simultáneamente por varios operadores, es necesario solucionar los problemas de modificación y acceso paralelo a los mismos datos.

DSS proporciona al analista datos en forma de informes, tablas y gráficos para su estudio y análisis, razón por la cual dichos sistemas brindan funciones de apoyo a la toma de decisiones.

Los subsistemas de entrada de datos, denominados OLTP (procesamiento de transacciones en línea), implementan el procesamiento de datos operativos. Para implementarlos utilice sistemas convencionales gestión de bases de datos (DBMS).

El subsistema de análisis se puede construir sobre la base de:

· subsistemas de análisis de recuperación de información basados ​​en DBMS relacionales y consultas estáticas utilizando el lenguaje SQL;

· subsistemas de análisis operativo. Para implementar dichos subsistemas se utiliza la tecnología de procesamiento de datos analíticos operativos OLAP, utilizando el concepto de representación de datos multidimensionales;

· subsistemas de análisis intelectual. Este subsistema implementa métodos y algoritmos de DataMining.

Desde el punto de vista del usuario, los sistemas OLAP proporcionan herramientas para la visualización flexible de información en varias secciones, la obtención automática de datos agregados, la realización de operaciones analíticas de convolución, la profundización y la comparación en el tiempo. Gracias a todo esto, los sistemas OLAP son una solución con grandes ventajas en el campo de la preparación de datos para todo tipo de informes comerciales, que implican la presentación de datos en varias secciones y diferentes niveles de jerarquía, como informes de ventas, diversos formularios de presupuestos y otros. Los sistemas OLAP tienen grandes ventajas de esta representación en otras formas de análisis de datos, incluida la previsión.

1.2 Definición OLAP-sistemas

La tecnología para el análisis de datos multidimensionales complejos se llama OLAP. OLAP es un componente clave de una organización de almacén de datos.

La funcionalidad OLAP se puede implementar de varias formas, tanto simples, como el análisis de datos en aplicaciones de oficina, como más complejas: sistemas analíticos distribuidos basados ​​​​en productos de servidor.

OLAP (On-LineAnalyticalProcessing) es una tecnología para el procesamiento de datos analíticos operativos que utiliza herramientas y métodos para recopilar, almacenar y analizar datos multidimensionales para respaldar los procesos de toma de decisiones.

El objetivo principal de los sistemas OLAP es respaldar las actividades analíticas y las consultas arbitrarias de los analistas de usuarios. El propósito del análisis OLAP es probar hipótesis emergentes.

OLAP(del inglés OnLine Analytical Processing - procesamiento de datos analíticos operativos, también: procesamiento de datos analíticos en tiempo real, procesamiento de datos analíticos interactivo) - un enfoque para el procesamiento de datos analíticos basado en su representación jerárquica multidimensional, que forma parte del campo más amplio de la información tecnología - analistas de negocios ().

Para obtener un catálogo de soluciones y proyectos OLAP, consulte la sección OLAP en TAdviser.

Desde el punto de vista del usuario, OLAP-Los sistemas proporcionan herramientas para la visualización flexible de información en varias secciones, la recepción automática de datos agregados, la realización de operaciones analíticas de convolución, detalle y comparación en el tiempo. Todo esto hace que los sistemas OLAP sean una solución con ventajas obvias en el campo de la preparación de datos para todo tipo de informes comerciales, que implican la presentación de datos en varias secciones y diferentes niveles de jerarquía, por ejemplo, informes de ventas, diversas formas de presupuestos, etc. en. Las ventajas de tal representación en otras formas de análisis de datos, incluida la previsión, son obvias.

Requisitos para sistemas OLAP. FASMI

El requisito clave para los sistemas OLAP es la velocidad, que permite su uso en el proceso de trabajo interactivo del analista con la información. En este sentido, los sistemas OLAP se diferencian, en primer lugar, de los RDBMS tradicionales, cuyos modelos con consultas típicas para analistas que utilizan agrupación y agregación de datos suelen ser costosos en términos de tiempo de espera y carga del RDBMS, por lo que el trabajo interactivo con ellos para cualquier volúmenes importantes de datos son complejos. En segundo lugar, los sistemas OLAP también se oponen a la presentación habitual de datos en archivos planos, por ejemplo, en forma de hojas de cálculo tradicionales de uso frecuente, cuya presentación de datos multidimensionales es compleja y poco intuitiva, y a las operaciones para cambiar el corte: puntos. de visión de los datos - también requieren tiempo y complican el trabajo interactivo con los datos.

Al mismo tiempo, por un lado, los requisitos de datos específicos de los sistemas OLAP normalmente implican almacenar datos en estructuras especiales optimizadas para tareas típicas de OLAP; por otro lado, la extracción directa de datos de los sistemas existentes durante el proceso de análisis conduciría a una caída significativa; en su desempeño.

Por lo tanto, un requisito importante es proporcionar el vínculo de importación y exportación más flexible entre los sistemas existentes que actúan como fuente de datos y un sistema OLAP, así como un sistema OLAP y aplicaciones externas de informes y análisis de datos.

Además, dicha combinación debe satisfacer los requisitos obvios de respaldar la importación y exportación de varias fuentes de datos, implementar procedimientos para limpiar y transformar datos y unificar los clasificadores y libros de referencia utilizados. A estos requisitos se suma la necesidad de tener en cuenta diversos ciclos de actualización de datos en los sistemas existentes. sistemas de información y unificación del nivel requerido de detalle de datos. La complejidad y versatilidad de este problema llevaron al surgimiento del concepto de almacenes de datos y, en un sentido estricto, a la identificación de una clase separada de utilidades de conversión y transformación de datos: ETL (Extract Transform Load).

Modelos de almacenamiento de datos activos

Indicamos anteriormente que OLAP asume una representación jerárquica multidimensional de datos y, en cierto sentido, se opone a los sistemas basados ​​​​en RDBMS.

Sin embargo, esto no significa que todos los sistemas OLAP utilicen un modelo multidimensional para almacenar datos del sistema activos y "en funcionamiento". Dado que el modelo de almacenamiento de datos activo influye en todos los requisitos dictados por la prueba FASMI, su importancia se enfatiza por el hecho de que es sobre esta base que tradicionalmente se distinguen los subtipos de OLAP: multidimensional (MOLAP), relacional (ROLAP) e híbrido (HOLAP).

Sin embargo, algunos expertos, encabezados por el citado Nigel Pends, indican que la clasificación basada en un criterio no es lo suficientemente completa. Además, la gran mayoría de los sistemas OLAP existentes serán de tipo híbrido. Por ello, nos detendremos con más detalle en los modelos activos de almacenamiento de datos, mencionando cuáles de ellos corresponden a cuál de los subtipos tradicionales de OLAP.

Almacenamiento de datos activos en una base de datos multidimensional

En este caso, los datos OLAP se almacenan en DBMS multidimensionales que utilizan diseños optimizados para este tipo de datos. Normalmente, los DBMS multidimensionales admiten todas las operaciones OLAP típicas, incluida la agregación a lo largo de los niveles jerárquicos requeridos, etc.

Este tipo de almacenamiento de datos, en cierto sentido, se puede llamar clásico para OLAP. Sin embargo, todos los pasos para la preparación preliminar de datos son completamente necesarios. Normalmente, los datos DBMS multidimensionales se almacenan en el disco; sin embargo, en algunos casos, para acelerar el procesamiento de datos, dichos sistemas permiten que los datos se almacenen en la RAM. Para los mismos fines, a veces se utiliza el almacenamiento de valores agregados precalculados y otros valores calculados en la base de datos.

Los DBMS multidimensionales que admiten totalmente el acceso multiusuario con transacciones de lectura y escritura competitivas son bastante raros; el modo habitual para dichos DBMS es el de un solo usuario con acceso de escritura con acceso de lectura multiusuario o el de sólo lectura multiusuario.

Entre las deficiencias características de algunas implementaciones de DBMS multidimensionales y sistemas OLAP basados ​​​​en ellos, se puede observar su susceptibilidad a un crecimiento impredecible en la cantidad de espacio ocupado por la base de datos desde el punto de vista del usuario. Este efecto es causado por el deseo de minimizar el tiempo de reacción del sistema, lo que exige almacenar valores precalculados de indicadores agregados y otras cantidades en la base de datos, lo que provoca un aumento no lineal en el volumen de información almacenada en la base de datos con la adición de nuevos valores de datos o mediciones.

El grado en que se manifiesta este problema, así como los problemas relacionados con el almacenamiento eficaz de cubos de datos dispersos, está determinado por la calidad de los enfoques y algoritmos utilizados para implementaciones específicas de sistemas OLAP.

Almacenamiento de datos activos en una base de datos relacional

Los datos OLAP también se pueden almacenar en un RDBMS tradicional. En la mayoría de los casos, este enfoque se utiliza cuando se intenta integrar "sin problemas" OLAP con sistemas de contabilidad existentes o almacenes de datos basados ​​en RDBMS. Al mismo tiempo, este enfoque requiere algunas capacidades adicionales del RDBMS para garantizar el cumplimiento efectivo de los requisitos de la prueba FASMI (en particular, garantizar un tiempo mínimo de respuesta del sistema). Normalmente, los datos OLAP se almacenan en forma desnormalizada y algunos de los agregados y valores calculados previamente se almacenan en tablas especiales. Cuando se almacena en forma normalizada, la eficacia de RDBMS como método para almacenar datos activos disminuye.

El problema de elegir enfoques y algoritmos efectivos para almacenar datos precalculados también es relevante para los sistemas OLAP basados ​​​​en RDBMS, por lo que los fabricantes de dichos sistemas generalmente se centran en las ventajas de los enfoques utilizados.

En general, se cree que los sistemas OLAP basados ​​​​en RDBMS son más lentos que los sistemas basados ​​​​en DBMS multidimensionales, incluso debido a estructuras de almacenamiento de datos que son menos eficientes para las tareas OLAP, pero en la práctica esto depende de las características de un sistema en particular.

Entre las ventajas de almacenar datos en un RDBMS se encuentra la mayor escalabilidad de dichos sistemas.

Almacenamiento de datos activos en archivos planos

Este enfoque implica almacenar fragmentos de datos en archivos normales. Por lo general, se utiliza como complemento a uno de los dos enfoques principales para acelerar el trabajo al almacenar en caché los datos actuales en el disco o en la RAM de la PC cliente.

Enfoque híbrido para el almacenamiento de datos

La mayoría de los fabricantes de sistemas OLAP que promueven sus soluciones integrales, que a menudo incluyen, además del propio sistema OLAP, DBMS, ETL (Extract Transform Load) y herramientas de informes, actualmente utilizan un enfoque híbrido para organizar el almacenamiento de datos activos del sistema, distribuyéndolos. de una forma u otra entre RDBMS y almacenamiento especializado, así como entre estructuras de disco y almacenamiento en caché en memoria.

Dado que la eficacia de dicha solución depende de los enfoques y algoritmos específicos utilizados por el fabricante para determinar si qué datos y dónde almacenarlos, luego sacar conclusiones apresuradamente sobre la eficiencia inicialmente mayor de tales soluciones como clase sin evaluar las características específicas del sistema en consideración.

OLAP(ing. procesamiento analítico en línea): un conjunto de métodos para el procesamiento dinámico de consultas multidimensionales en bases de datos analíticas. Estas fuentes de datos suelen tener un volumen bastante grande y uno de los requisitos más importantes de las herramientas utilizadas para procesarlas es la alta velocidad. En las bases de datos relacionales, la información se almacena en tablas separadas que están bien normalizadas. Pero las consultas complejas de varias tablas se ejecutan con bastante lentitud. Se logra un rendimiento significativamente mejor en términos de velocidad de procesamiento en los sistemas OLAP debido a las peculiaridades de la estructura de almacenamiento de datos. Toda la información está claramente organizada y se utilizan dos tipos de almacenamiento de datos: mediciones(contiene directorios divididos en categorías, por ejemplo, puntos de venta, clientes, empleados, servicios, etc.) y datos(caracterizar la interacción de elementos varias medidas, por ejemplo, el 3 de marzo de 2010, el vendedor A prestó un servicio al cliente B en la tienda C por la cantidad de D unidades monetarias). Las medidas se utilizan para calcular los resultados en el cubo de análisis. Las medidas son conjuntos de hechos agregados por las correspondientes dimensiones seleccionadas y sus elementos. Gracias a estas características, las consultas complejas con datos multidimensionales toman mucho menos tiempo que con fuentes relacionales.

Uno de los principales proveedores de sistemas OLAP es Microsoft Corporation. Veamos la implementación de los principios OLAP utilizando ejemplos prácticos de creación de un cubo analítico en las aplicaciones Microsoft SQL Server Business Intelligence Development Studio (BIDS) y Microsoft Office PerformancePoint Server Planning Business Modeler (PPS) y familiaricémonos con las posibilidades de representación visual multidimensional. datos en forma de gráficos, cuadros y tablas.

Por ejemplo, en BIDS es necesario crear un cubo OLAP utilizando datos sobre una compañía de seguros, sus empleados, socios (clientes) y puntos de venta. Supongamos que la empresa proporciona un tipo de servicio, por lo que no será necesaria la medición de los servicios.

Primero definamos las medidas. Las siguientes entidades (categorías de datos) están asociadas a las actividades de la empresa:

  • Puntos de venta
    - Empleados
    - Socios
También crea las dimensiones de Tiempo y Escenario, que son necesarias para cualquier cubo.
A continuación, necesita una tabla para almacenar hechos (tabla de hechos).
La información se puede ingresar en las tablas manualmente, pero la forma más común es cargar datos usando el Asistente de importación desde varias fuentes.
La siguiente figura muestra el flujo de creación y llenado manual de tablas de hechos y dimensiones:

Figura 1. Tablas de dimensiones y hechos en la base de datos analítica. Secuencia de creación
Después de crear una fuente de datos multidimensional en BIDS, puede ver su presentación (Vista de fuente de datos). En nuestro ejemplo, obtendremos el circuito que se muestra en la siguiente figura.


Figura 2. Vista de origen de datos en Business Intelligence Development Studio (BIDS)

Como puede ver, la tabla de hechos está conectada a las tablas de dimensiones a través de una correspondencia uno a uno de campos de identificador (PartnerID, EmployeeID, etc.).

Veamos el resultado. En la pestaña del explorador de cubos, arrastrando medidas y dimensiones a los campos de totales, filas, columnas y filtros, podemos obtener una vista de los datos de interés (por ejemplo, transacciones concluidas sobre contratos de seguro celebrados por un determinado empleado en 2005).

4. Clasificación de productos OLAP.

5. Principios de funcionamiento de los clientes OLAP.

7. Áreas de aplicación de las tecnologías OLAP.

8. Un ejemplo del uso de tecnologías OLAP para análisis en ventas.

1. El lugar de OLAP en la estructura de información de la empresa.

El término "OLAP" está indisolublemente ligado al término "almacén de datos" (Data Warehouse).

Los datos del almacén provienen de sistemas operativos (sistemas OLTP), que están diseñados para automatizar los procesos comerciales. Además, el repositorio se puede reponer a partir de fuentes externas, como informes estadísticos.

El propósito del repositorio es proporcionar la “materia prima” para el análisis en un solo lugar y en una estructura simple y comprensible.

Hay una razón más que justifica la aparición de una instalación de almacenamiento separada: las consultas analíticas complejas de información operativa ralentizan el trabajo actual de la empresa, bloquean las tablas durante mucho tiempo y ocupan los recursos del servidor.

Un repositorio no significa necesariamente una acumulación gigantesca de datos; lo principal es que sea conveniente para el análisis.

Centralización y estructuración conveniente no es todo lo que necesita un analista. Todavía necesita una herramienta para ver y visualizar información. Los informes tradicionales, incluso aquellos creados en un único repositorio, carecen de una cosa: flexibilidad. No se pueden "torcer", "expandir" ni "contraer" para obtener la vista deseada de los datos. ¡Si tan solo tuviera una herramienta que le permitiera expandir y contraer datos de manera simple y conveniente! OLAP actúa como tal herramienta.

Aunque OLAP no es un atributo necesario de un almacén de datos, se utiliza cada vez más para analizar la información acumulada en el almacén.

El lugar de OLAP en la estructura de información de una empresa (Fig. 1).

Foto 1. LugarOLAP en la estructura de información de la empresa.

Los datos operativos se recopilan de diversas fuentes, se limpian, se integran y se almacenan en un almacén relacional. Además, ya están disponibles para su análisis utilizando varias herramientas de generación de informes. Luego, los datos (total o parcialmente) se preparan para el análisis OLAP. Pueden cargarse en una base de datos OLAP especial o almacenarse en un almacenamiento relacional. Su elemento más importante son los metadatos, es decir, información sobre la estructura, ubicación y transformación de los datos. Gracias a ellos, se garantiza una interacción eficaz de los distintos componentes del almacenamiento.

En resumen, podemos definir OLAP como un conjunto de herramientas para el análisis multidimensional de datos acumulados en un almacén.

2. Procesamiento de datos analíticos operativos.

El concepto OLAP se basa en el principio de representación de datos multidimensionales. En 1993, E. F. Codd abordó las deficiencias del modelo relacional, señalando principalmente la incapacidad de "fusionar, ver y analizar datos en términos de múltiples dimensiones, es decir, de la manera más comprensible para los analistas empresariales", y definió los requisitos generales. para sistemas OLAP que amplían la funcionalidad de los DBMS relacionales e incluyen el análisis multidimensional como una de sus características.

Según Codd, una visión conceptual multidimensional es una perspectiva múltiple que consta de varias dimensiones independientes a lo largo de las cuales se pueden analizar conjuntos específicos de datos.

El análisis simultáneo en múltiples dimensiones se define como análisis multivariado. Cada dimensión incluye áreas de consolidación de datos, que consisten en una serie de niveles sucesivos de generalización, donde cada nivel superior corresponde a un mayor grado de agregación de datos para la dimensión correspondiente.

Por tanto, la dimensión del Ejecutor puede determinarse por la dirección de consolidación, que consta de los niveles de generalización "empresa - división - departamento - empleado". La dimensión Tiempo puede incluso incluir dos direcciones de consolidación: "año - trimestre - mes - día" y "semana - día", ya que contar el tiempo por mes y por semana es incompatible. En este caso, es posible seleccionar arbitrariamente el nivel deseado de detalle de información para cada una de las dimensiones.

La operación de descenso (drilling down) corresponde al paso de etapas superiores de consolidación a etapas inferiores; por el contrario, la operación de elevación (enrollado) significa movimiento desde niveles inferiores a niveles superiores (Fig. 2).


Figura 2.Dimensiones y direcciones de la consolidación de datos.

3. Requisitos para herramientas de procesamiento analítico en línea.

El enfoque multidimensional surgió casi simultáneamente y en paralelo al relacional. Sin embargo, sólo a partir de mediados de los años noventa, o más bien a partir de
1993, interés en MDBMS comenzó a generalizarse. Fue este año cuando apareció un nuevo artículo programático de uno de los fundadores del enfoque relacional. E. Codda, en el que formuló 12 requisitos básicos para los medios de implementación OLAP(Tabla 1).

Tabla 1.

Representación de datos multidimensionales

Las herramientas deben soportar una visión conceptualmente multidimensional de los datos.

Transparencia

El usuario no necesita saber qué herramientas específicas se utilizan para almacenar y procesar datos, cómo se organizan los datos y de dónde provienen.

Disponibilidad

Las propias herramientas deben seleccionar y contactar con la mejor fuente de datos para generar una respuesta a una solicitud determinada. Las herramientas deben poder asignar automáticamente su propia lógica a varias fuentes de datos heterogéneas.

Rendimiento consistente

El rendimiento debe ser prácticamente independiente del número de dimensiones de la consulta.

Soporte de arquitectura cliente-servidor

Las herramientas deben funcionar en una arquitectura cliente-servidor.

Igualdad de todas las dimensiones

Ninguna de las dimensiones debe ser básica; todas deben ser iguales (simétricas).

Procesamiento dinámico de matrices dispersas.

Los valores indefinidos deben almacenarse y manejarse de la forma más eficiente posible.

Soporte para modo multiusuario de trabajar con datos.

Las herramientas deben brindar la capacidad de trabajar para más de un usuario.

Admite operaciones basadas en varias dimensiones

Todas las operaciones multidimensionales (como la agregación) deben aplicarse de manera uniforme y consistente a cualquier número de dimensiones.

Facilidad de manipulación de datos

Las herramientas deben tener la interfaz de usuario más cómoda, natural y cómoda.

Herramientas avanzadas de presentación de datos

Los fondos deben apoyar varias maneras visualización (presentación) de datos.

Número ilimitado de dimensiones y niveles de agregación de datos.

No debería haber limitación en la cantidad de dimensiones admitidas.

Reglas para evaluar productos de software de clase OLAP.

El conjunto de estos requisitos, que sirvieron como definición real de OLAP, debe considerarse como una guía, y los productos específicos deben evaluarse según el grado en que se acerquen a cumplir perfectamente todos los requisitos.

La definición de Codd fue posteriormente revisada en la llamada prueba FASMI, que requiere que la aplicación OLAP proporcione la capacidad de analizar rápidamente información multidimensional compartida.

Recordar las 12 reglas de Codd es demasiado oneroso para la mayoría de las personas. Resulta que podemos resumir la definición de OLAP con sólo cinco palabras clave: Análisis rápido de información multidimensional compartida o, para abreviar, FASMI (traducido del inglés:F ast A análisis de S liebre METRO ultradimensional I información).

Esta definición se formuló por primera vez a principios de 1995 y no ha sido necesario revisarla desde entonces.

RÁPIDO ( Rápido ) - significa que el sistema debería poder proporcionar la mayoría de las respuestas a los usuarios en aproximadamente cinco segundos. Al mismo tiempo, las solicitudes más simples se procesan en un segundo y muy pocas, en más de 20 segundos. Las investigaciones han demostrado que los usuarios finales perciben que un proceso no ha tenido éxito si no se obtienen resultados después de 30 segundos.

A primera vista, puede parecer sorprendente que al recibir un informe en un minuto, lo que no hace mucho tardaba días, el usuario se aburre rápidamente mientras espera y el proyecto resulta mucho menos exitoso que en el caso de un instante. respuesta, incluso a costa de un análisis menos detallado.

ANÁLISISsignifica que el sistema puede hacer frente a cualquier análisis lógico y estadístico característico de esta aplicación, y garantiza su conservación en un formato accesible para el usuario final.

No es tan importante si el análisis se realiza en las propias herramientas del proveedor o en un producto de software externo relacionado, como una hoja de cálculo, sólo que toda la funcionalidad de análisis requerida debe proporcionarse de forma intuitiva para los usuarios finales. Las herramientas de análisis podrían incluir ciertos procedimientos, como análisis de series de tiempo, asignación de costos, transferencias de divisas, búsquedas de objetivos, modificación de estructuras multidimensionales, modelado no procesal, detección de excepciones, extracción de datos y otras operaciones dependientes de la aplicación. Estas capacidades varían ampliamente entre productos, dependiendo de la orientación del objetivo.

COMPARTIDO significa que el sistema implementa todos los requisitos de protección de la privacidad (posiblemente hasta el nivel de celda) y, si es necesario un acceso de escritura múltiple, garantiza que las modificaciones se bloqueen en el nivel apropiado. No todas las aplicaciones requieren reescritura de datos. Sin embargo, el número de aplicaciones de este tipo está creciendo y el sistema debe poder manejar múltiples modificaciones de manera oportuna y segura.

MULTIDIMENSIONAL (Multidimensional) - este es un requisito clave. Si tuvieras que definir OLAP en una palabra, la elegirías. El sistema debe proporcionar una visión conceptual multidimensional de los datos, incluido el soporte total para jerarquías y jerarquías múltiples, ya que esta es claramente la forma más lógica de analizar negocios y organizaciones. No hay un número mínimo de dimensiones que deban procesarse, ya que esto también depende de la aplicación, y la mayoría de los productos OLAP tienen un número suficiente de dimensiones para los mercados a los que se dirigen.

INFORMACIÓN - esto es todo. La información necesaria debe obtenerse donde sea necesaria. Sin embargo, mucho depende de la aplicación. La potencia de varios productos se mide en términos de la cantidad de datos de entrada que pueden procesar, pero no de cuántos gigabytes pueden almacenar. La potencia de los productos varía ampliamente: los productos OLAP más grandes pueden manejar al menos mil veces más datos que los más pequeños. Hay muchos factores a considerar en este sentido, incluida la duplicación de datos, los requisitos de RAM, el uso de espacio en disco, las métricas de rendimiento, la integración con repositorios de información, etc.

La prueba FASMI es una definición razonable y comprensible de los objetivos que OLAP pretende alcanzar.

4. ClasificaciónOLAP-productos.

Entonces, la esencia de OLAP. radica en el hecho de que la información inicial para el análisis se presenta en forma de un cubo multidimensional, y es posible manipularlo arbitrariamente y obtener las secciones de información necesarias: informes. En este caso, el usuario final ve el cubo como una tabla dinámica multidimensional que resume automáticamente los datos (hechos) en varias secciones (dimensiones) y permite la gestión interactiva de los cálculos y el formulario de informe. La ejecución de estas operaciones está garantizada. OLAP -coche (o coche Cálculos OLAP).

Hoy en día, se han desarrollado muchos productos en el mundo que venden OLAP -tecnologías. Para facilitar la navegación entre ellos se utilizan clasificaciones OLAP -productos: por método de almacenamiento de datos para análisis y por ubicación OLAP -carros. Echemos un vistazo más de cerca a cada categoría. Productos OLAP.

Clasificación por método de almacenamiento de datos.

Los cubos multidimensionales se construyen basándose en datos de origen y agregados. Tanto los datos de origen como los agregados para los cubos se pueden almacenar en bases de datos tanto relacionales como multidimensionales. Por tanto, actualmente se utilizan tres métodos de almacenamiento de datos: MOLAP (OLAP multidimensional), ROLAP (OLAP relacional) y HOLAP (OLAP híbrido) ). Respectivamente, OLAP -Los productos según el método de almacenamiento de datos se dividen en tres categorías similares:

1. En caso de MOLAP , los datos de origen y agregados se almacenan en una base de datos multidimensional o en un cubo local multidimensional.

2. En ROLAP -Los datos de origen de los productos se almacenan en bases de datos relacionales o en tablas locales planas en un servidor de archivos. Los datos agregados se pueden colocar en tablas de servicios en la misma base de datos. La conversión de datos de una base de datos relacional a cubos multidimensionales se realiza previa solicitud. Herramientas OLAP.

3. En caso de uso HOLA arquitectura, los datos originales permanecen en la base de datos relacional y los agregados se colocan en la multidimensional. Construcción OLAP -cube ejecutado bajo pedido OLAP - herramientas basadas en datos relacionales y multidimensionales.

Clasificación por ubicación OLAP-carros.

Sobre esta base OLAP -los productos se dividen en Servidores OLAP y clientes OLAP:

· En servidor OLAP - los medios de cálculo y almacenamiento de datos agregados se realizan mediante un proceso separado: el servidor. La aplicación cliente recibe solo los resultados de las consultas realizadas a cubos multidimensionales almacenados en el servidor. Alguno OLAP -Los servidores admiten el almacenamiento de datos solo en bases de datos relacionales, algunos solo en bases multidimensionales. Muchos modernos OLAP -Los servidores admiten los tres métodos de almacenamiento de datos:MOLAP, ROLAP y HOLAP.

MOLAP.

MOLAP es Procesamiento analítico multidimensional en línea, es decir, OLAP multidimensional.Esto significa que el servidor utiliza una base de datos multidimensional (MDB) para almacenar datos. El objetivo de utilizar MBD es obvio. Puede almacenar de manera eficiente datos de naturaleza multidimensional, proporcionando un medio para atender rápidamente consultas de bases de datos. Los datos se transfieren desde una fuente de datos a una base de datos multidimensional y luego se agrega la base de datos. El cálculo previo es lo que acelera las consultas OLAP porque los datos resumidos ya se han calculado. El tiempo de consulta pasa a ser una función únicamente del tiempo necesario para acceder a un único dato y realizar el cálculo. Este método respalda el concepto de que el trabajo se realiza una vez y los resultados se utilizan una y otra vez. Las bases de datos multidimensionales son una tecnología relativamente nueva. El uso de MBD tiene las mismas desventajas que la mayoría de las nuevas tecnologías. Es decir, no son tan estables como las bases de datos relacionales (RDB) y no están optimizadas en la misma medida. Otra debilidad del BMD es la incapacidad de utilizar la mayoría de las bases de datos multidimensionales en el proceso de agregación de datos, por lo que se necesita tiempo para que nueva información esté disponible para su análisis.

ROLAP.

ROLAP es Procesamiento analítico relacional en línea, es decir, OLAP relacional.El término ROLAP significa que el servidor OLAP se basa en una base de datos relacional. Los datos de origen se ingresan en una base de datos relacional, generalmente en un esquema de estrella o copo de nieve, lo que ayuda a reducir el tiempo de recuperación. El servidor proporciona un modelo de datos multidimensional mediante consultas SQL optimizadas.

Hay varias razones para elegir una base de datos relacional en lugar de multidimensional. RDB es una tecnología bien establecida con muchas oportunidades de optimización. El uso en el mundo real dio como resultado un producto más refinado. Además, los BDR admiten volúmenes de datos mayores que los BMD. Están diseñados precisamente para tales volúmenes. El principal argumento en contra de los RDB es la complejidad de las consultas necesarias para recuperar información de una gran base de datos utilizando SQL. Un programador SQL sin experiencia podría fácilmente sobrecargar valiosos recursos del sistema al intentar ejecutar alguna consulta similar, que es mucho más fácil de ejecutar en el MDB.

Datos agregados/preagregados.

La implementación rápida de consultas es un imperativo para OLAP. Este es uno de los principios básicos de OLAP: la capacidad de manipular datos intuitivamente requiere una rápida recuperación de información. En general, cuantos más cálculos haya que hacer para obtener un dato, más lenta será la respuesta. Por lo tanto, para acortar el tiempo de implementación de la consulta, las piezas de información a las que normalmente se accede con mayor frecuencia, pero que también requieren cálculo, están sujetas a agregación preliminar. Es decir, se cuentan y luego se almacenan en la base de datos como datos nuevos. Un ejemplo del tipo de datos que se pueden calcular de antemano son los datos resumidos, por ejemplo, cifras de ventas de meses, trimestres o años, para los cuales los datos reales ingresados ​​son cifras diarias.

Los diferentes proveedores tienen diferentes métodos para seleccionar parámetros, lo que requiere una agregación previa y el número de valores calculados previamente. El enfoque de agregación afecta tanto a la base de datos como al tiempo de ejecución de la consulta. Si se están calculando más valores, aumenta la probabilidad de que el usuario solicite un valor que ya ha sido calculado, y por tanto el tiempo de respuesta se reducirá al no tener que solicitar el valor original a calcular. Sin embargo, si calcula todos los valores posibles (esta no es la mejor solución), en este caso el tamaño de la base de datos aumenta significativamente, lo que la hará inmanejable y el tiempo de agregación será demasiado largo. Además, cuando se agregan valores numéricos a la base de datos, o si cambian, esta información debe reflejarse en valores precalculados que dependen de los nuevos datos. Por lo tanto, la actualización de la base de datos también puede llevar mucho tiempo en el caso de una gran cantidad de valores precalculados. Dado que la base de datos normalmente se ejecuta sin conexión durante la agregación, es deseable que el tiempo de agregación no sea demasiado largo.

OLAP - el cliente está estructurado de manera diferente. Construcción de un cubo multidimensional y OLAP -Los cálculos se realizan en la memoria del ordenador cliente.OLAP -Los clientes también se dividen en ROLAP y MOLAP.Y algunos pueden admitir ambas opciones de acceso a datos.

Cada uno de estos enfoques tiene sus pros y sus contras. Contrariamente a la creencia popular sobre las ventajas de las herramientas de servidor sobre las herramientas de cliente, en varios casos el uso de OLAP - el cliente puede ser más eficiente y rentable para los usuarios utilizarlo Servidores OLAP.

El desarrollo de aplicaciones analíticas utilizando herramientas OLAP del cliente es un proceso rápido y no requiere formación especial. Un usuario que conoce la implementación física de la base de datos puede desarrollar una aplicación analítica de forma independiente, sin la participación de un especialista en TI.

Cuando se utiliza un servidor OLAP, es necesario aprender 2 sistemas diferentes, a veces de diferentes proveedores, para crear cubos en el servidor y desarrollar una aplicación cliente.

El cliente OLAP proporciona una interfaz visual única para describir cubos y configurar interfaces de usuario para ellos.

Entonces, ¿en qué casos puede resultar más eficaz y rentable para los usuarios utilizar un cliente OLAP que utilizar un servidor OLAP?

· Viabilidad económica de la aplicación. OLAP -servidor ocurre cuando los volúmenes de datos son muy grandes y abrumadores para OLAP -cliente, en caso contrario está más justificado el uso de este último. En este caso OLAP -El cliente combina características de alto rendimiento y bajo costo.

· Potentes PC para analistas: otro argumento a favor OLAP -clientela. Cuando usas OLAP -Los servidores no utilizan esta capacidad.

Entre las ventajas de los clientes OLAP se encuentran las siguientes:

· Costos de implementación y mantenimiento. OLAP - el cliente es significativamente menor que los costos de Servidor OLAP.

· Usando OLAP - para un cliente con una máquina incorporada, la transmisión de datos a través de la red se realiza una vez. Haciendo OLAP -No se generan operaciones de nuevos flujos de datos.

5. Principios operativos OLAP-clientela.

Veamos el proceso de creación de una aplicación OLAP utilizando una herramienta cliente (Figura 1).

Foto 1.Crear una aplicación OLAP utilizando la herramienta cliente ROLAP

El principio de funcionamiento de los clientes ROLAP es una descripción preliminar de la capa semántica detrás de la cual se oculta la estructura física de los datos originales. En este caso, las fuentes de datos pueden ser: tablas locales, RDBMS. La lista de fuentes de datos admitidas está determinada por el producto de software específico. Después de esto, el usuario puede manipular de forma independiente objetos que comprende en términos del área temática para crear cubos e interfaces analíticas.

El principio de funcionamiento del cliente del servidor OLAP es diferente. En un servidor OLAP, al crear cubos, el usuario manipula las descripciones físicas de la base de datos. Al mismo tiempo, se crean descripciones personalizadas en el propio cubo. El cliente del servidor OLAP está configurado solo para el cubo.

Al crear una capa semántica, las fuentes de datos (las tablas Ventas y Ofertas) se describen en términos que el usuario final puede comprender y convertir en "Productos" y "Ofertas". El campo "ID" de la tabla "Productos" pasa a llamarse "Código" y "Nombre" a "Producto", etc.

Luego se crea el objeto de negocio Ventas. Un objeto de negocio es una mesa plana a partir de la cual se forma un cubo multidimensional. Al crear un objeto de negocio, las tablas “Productos” y “Transacciones” se fusionan con el campo “Código” del producto. Dado que no es necesario mostrar todos los campos de la tabla en el informe, el objeto comercial utiliza solo los campos "Artículo", "Fecha" y "Cantidad".

En nuestro ejemplo, a partir del objeto de negocio “Ventas”, se creó un informe de ventas de productos por mes.

Al trabajar con un informe interactivo, el usuario puede configurar condiciones de filtrado y agrupación con los mismos simples movimientos del mouse. En este punto, el cliente ROLAP accede a los datos del caché. El cliente del servidor OLAP genera una nueva consulta a la base de datos multidimensional. Por ejemplo, aplicando un filtro por producto en un informe de ventas, podemos obtener un informe de ventas de los productos que nos interesan.

Todas las configuraciones de la aplicación OLAP se pueden almacenar en un repositorio de metadatos dedicado, en la aplicación o en un repositorio del sistema de base de datos multidimensional.La implementación depende del producto de software específico.

Todo lo que se incluye en estas aplicaciones es un aspecto estándar de la interfaz, funciones y estructura predefinidas y soluciones rápidas para situaciones más o menos estándar. Por ejemplo, los paquetes financieros son populares. Las aplicaciones financieras prediseñadas permiten a los profesionales utilizar herramientas financieras familiares sin tener que diseñar una estructura de base de datos o formularios e informes convencionales.

Internet es nueva forma cliente. Además, lleva el sello de las nuevas tecnologías; un montón de soluciones de internet difieren significativamente en sus capacidades en general y como solución OLAP en particular. Generar informes OLAP a través de Internet tiene muchas ventajas. El más significativo parece ser la ausencia de necesidad de personal especializado. software para acceder a la información. Esto le ahorra a la empresa mucho tiempo y dinero.

6. Seleccionar una arquitectura de aplicación OLAP.

A la hora de implementar un sistema de información y análisis, es importante no equivocarse al elegir la arquitectura de una aplicación OLAP. La traducción literal del término proceso analítico en línea - "procesamiento analítico en línea" - a menudo se toma literalmente en el sentido de que los datos que ingresan al sistema se analizan rápidamente. Esta es una idea errónea: la eficiencia del análisis no tiene ninguna relación con el tiempo real de actualización de los datos en el sistema. Esta característica se refiere al tiempo de respuesta del sistema OLAP a las solicitudes de los usuarios. Al mismo tiempo, los datos analizados suelen representar una instantánea de la información "de ayer" si, por ejemplo, los datos de los almacenes se actualizan una vez al día.

En este contexto, la traducción de OLAP como “procesamiento analítico interactivo” es más precisa. Es la capacidad de analizar datos en modo interactivo lo que distingue a los sistemas OLAP de los sistemas para preparar informes regulados.

Otra característica del procesamiento interactivo, según la formulación del fundador de OLAP, E. Codd, es la capacidad de "combinar, ver y analizar datos desde el punto de vista de múltiples dimensiones, es decir, de la manera más comprensible para los analistas corporativos". El propio Codd utiliza el término OLAP para referirse exclusivamente a una forma específica de presentar datos a nivel conceptual: multidimensional. A nivel físico, los datos se pueden almacenar en bases de datos relacionales, pero en realidad, las herramientas OLAP suelen trabajar con bases de datos multidimensionales en las que los datos se organizan en un hipercubo (Figura 1).

Foto 1. OLAP– cubo (hipercubo, metacubo)

Además, la relevancia de estos datos está determinada por el momento en que el hipercubo se llena con nuevos datos.

Obviamente, el tiempo que lleva crear una base de datos multidimensional depende significativamente del volumen de datos cargados en ella, por lo que es razonable limitar este volumen. Pero ¿cómo evitar reducir las posibilidades de análisis y privar al usuario del acceso a toda la información de interés? Hay dos caminos alternativos: Analizar y luego consultar y Consultar y luego analizar.

Los seguidores del primer camino proponen cargar información generalizada en una base de datos multidimensional, por ejemplo, resultados mensuales, trimestrales y anuales de los departamentos. Y si es necesario refinar los datos, se le pide al usuario que genere un informe utilizando una base de datos relacional que contenga la selección requerida, por ejemplo, por día para un departamento determinado o por mes y empleados de un departamento seleccionado.

Los defensores del segundo camino, por el contrario, sugieren que el usuario, en primer lugar, decida qué datos va a analizar y los cargue en un microcubo, una pequeña base de datos multidimensional. Ambos enfoques difieren a nivel conceptual y tienen sus propias ventajas y desventajas.

Las ventajas del segundo enfoque incluyen la "frescura" de la información que el usuario recibe en forma de un informe multidimensional: un "microcubo". El microcubo se forma en función de la información que se acaba de solicitar de la base de datos relacional actual. El trabajo con un microcubo se realiza de forma interactiva: la obtención de fragmentos de información y su detalle dentro del microcubo se realiza instantáneamente. Otro punto positivo es que el diseño de la estructura y llenado del microcubo lo realiza el usuario sobre la marcha, sin la participación del administrador de la base de datos. Sin embargo, el enfoque también adolece de graves deficiencias. El usuario no ve el panorama general y debe decidir de antemano la dirección de su investigación. De lo contrario, el microcubo solicitado puede ser demasiado pequeño y no contener todos los datos de interés, y el usuario tendrá que solicitar un nuevo microcubo, luego uno nuevo, luego otro y otro. El enfoque Query luego analiza implementa la herramienta BusinessObjects de la empresa del mismo nombre y las herramientas de la plataforma Contour de la empresa.Intersoft Laboratorio.

Con el enfoque Analizar y luego consultar, el volumen de datos cargados en una base de datos multidimensional puede ser bastante grande; el llenado debe realizarse de acuerdo con las regulaciones y puede llevar bastante tiempo. Sin embargo, todas estas desventajas se amortizan más adelante, cuando el usuario tiene acceso a casi todos los datos necesarios en cualquier combinación. El acceso a los datos originales en una base de datos relacional se realiza solo como último recurso, cuando se necesita información detallada, por ejemplo, sobre una factura específica.

El funcionamiento de una única base de datos multidimensional prácticamente no se ve afectado por el número de usuarios que acceden a ella. Solo leen los datos disponibles allí, a diferencia del método Consulta y luego analiza, en el que el número de microcubos en el caso extremo puede crecer al mismo ritmo que el número de usuarios.

Este enfoque aumenta la carga sobre los servicios de TI, que, además de los relacionales, también se ven obligados a mantener bases de datos multidimensionales.Estos servicios son responsables de la oportuna Actualización automática datos en bases de datos multidimensionales.

Los representantes más destacados del enfoque "Analizar y luego consultar" son las herramientas PowerPlay e Impromptu de Cognos.

La elección tanto del enfoque como de la herramienta que lo implementa depende principalmente del objetivo que se persiga: siempre hay que equilibrar el ahorro presupuestario y la mejora de la calidad del servicio a los usuarios finales. Hay que tener en cuenta que, en un plan estratégico, la creación de sistemas de información y análisis persigue el objetivo de lograr una ventaja competitiva, y no evitar los costes de la automatización. Por ejemplo, un sistema analítico e de información corporativa puede proporcionar información necesaria, oportuna y confiable sobre una empresa, cuya publicación para los inversores potenciales garantizará la transparencia y previsibilidad de la empresa, lo que inevitablemente se convertirá en una condición para su atractivo inversor.

7. Áreas de aplicación de las tecnologías OLAP.

OLAP es aplicable siempre que exista la tarea de analizar datos multivariados. En general, dada una tabla de datos que tiene al menos una columna descriptiva (dimensión) y una columna numérica (medidas o hechos), una herramienta OLAP suele ser una herramienta eficaz de análisis y generación de informes.

Veamos algunas áreas de aplicación de las tecnologías OLAP tomadas de la vida real.

1. Ventas.

A partir del análisis de la estructura de ventas se resuelven las cuestiones necesarias para la toma de decisiones de gestión: modificación de gama de productos, precios, cierre y apertura de tiendas, sucursales, rescisión y firma de contratos con concesionarios, realización o rescisión de campañas publicitarias, etc.

2. Adquisiciones.

La tarea es lo opuesto al análisis de ventas. Muchas empresas compran componentes y materiales a proveedores. Las empresas comerciales compran bienes para revenderlos. Hay muchas tareas posibles al analizar las adquisiciones, desde planificar fondos basándose en experiencias pasadas hasta control sobre los gerentes, elección de proveedores.

3. Precios.

El análisis de los precios de mercado está estrechamente relacionado con el análisis de las compras. El objetivo de este análisis es optimizar costes y seleccionar las ofertas más rentables.

4. Comercialización.

Por análisis de marketing nos referimos únicamente al área de análisis de compradores o clientes-consumidores de servicios. El objetivo de este análisis es el posicionamiento correcto del producto, la identificación de grupos de compradores para publicidad dirigida y la optimización del surtido. La tarea de OLAP en este caso es brindar al usuario una herramienta para obtener rápidamente, a la velocidad del pensamiento, respuestas a las preguntas que surgen intuitivamente durante el análisis de datos.

5. Almacén.

El análisis de la estructura de los saldos de almacén por tipo de mercancía, almacenes, análisis de la vida útil de la mercancía, análisis de envíos por destinatario y muchos otros tipos de análisis que son importantes para una empresa son posibles si la organización cuenta con contabilidad de almacén.

6. Flujo de caja.

Ésta es toda un área de análisis que tiene muchas escuelas y métodos. La tecnología OLAP puede servir como herramienta para implementar o mejorar estas técnicas, pero no como sustituto de ellas. La rotación de efectivo de los fondos no monetarios y en efectivo se analiza en términos de operaciones comerciales, contrapartes, monedas y tiempo para optimizar los flujos, garantizar la liquidez, etc. La composición de las mediciones depende en gran medida de las características del negocio, la industria y la metodología.

7. Presupuesto.

Una de las áreas de aplicación más fértiles de las tecnologías OLAP. No en vano ningún sistema presupuestario moderno se considera completo sin la presencia de herramientas OLAP para el análisis presupuestario. La mayoría de los informes presupuestarios se crean fácilmente sobre la base de sistemas OLAP. Al mismo tiempo, los informes responden a una amplia gama de preguntas: análisis de la estructura de gastos e ingresos, comparación de gastos de determinadas partidas en diferentes divisiones, análisis de la dinámica y tendencias de los gastos de determinadas partidas, análisis de costes y ganancias.

8. Cuentas.

Un balance clásico que consta de un número de cuenta y que contiene saldos entrantes, volumen de negocios y saldos salientes se puede analizar perfectamente en un sistema OLAP. Además, el sistema OLAP puede calcular de forma automática y muy rápida saldos consolidados de una organización de múltiples sucursales, saldos por mes, trimestre y año, saldos agregados por jerarquía de cuentas y saldos analíticos basados ​​en características analíticas.

9. Informes financieros.

Un sistema de informes construido tecnológicamente no es más que un conjunto de indicadores nombrados con valores de fecha que deben agruparse y resumirse en varias secciones para obtener informes específicos. Cuando este es el caso, la visualización e impresión de informes se implementa de forma más sencilla y económica en los sistemas OLAP. En cualquier caso, el sistema de informes internos de la empresa no es tan conservador y puede reestructurarse para ahorrar dinero en trabajos de ingeniería para crear informes y obtener capacidades de análisis operativo multidimensional.

10. Tráfico del sitio.

El archivo de registro del servidor de Internet es de naturaleza multidimensional, lo que significa que es adecuado para el análisis OLAP. Los hechos son: el número de visitas, el número de visitas, el tiempo pasado en la página y otra información disponible en el registro.

11. Volúmenes de producción.

Este es otro ejemplo de análisis estadístico. De este modo, es posible analizar los volúmenes de patatas cultivadas, de acero fundido y de bienes producidos.

12. Consumo de consumibles.

Imaginemos una fábrica formada por decenas de talleres en los que se consumen refrigerantes, líquidos de lavado, aceites, trapos, papel de lija (cientos de tipos de consumibles). Para una planificación precisa y una optimización de costes, se requiere un análisis exhaustivo del consumo real de consumibles.

13. Uso de locales.

Otro tipo de análisis estadístico. Ejemplos: análisis de la carga de trabajo de las aulas, edificios y locales alquilados, uso de las salas de conferencias, etc.

14. Rotación de personal en la empresa.

Análisis de la rotación de personal en la empresa por sucursales, departamentos, profesiones, nivel de formación, sexo, edad, tiempo.

15. Transporte de pasajeros.

Análisis del número de billetes vendidos e importes por temporada, sentido, tipo de vagón (clase), tipo de tren (avión).

Esta lista no se limita a áreas de aplicación. OLAP - tecnologías. Consideremos, por ejemplo, la tecnología OLAP - análisis en el ámbito de las ventas.

8. Ejemplo de uso OLAP -tecnologías de análisis en el ámbito de las ventas.

Diseño de una representación de datos multidimensional para OLAP -El análisis comienza con la formación de un mapa de medición. Por ejemplo, al analizar las ventas, puede ser aconsejable identificar partes individuales del mercado (consumidores en desarrollo, estables, grandes y pequeños, la probabilidad de nuevos consumidores, etc.) y estimar los volúmenes de ventas por producto, territorio, cliente, segmento de mercado. , canal de ventas y tamaños de pedidos. Estas direcciones forman la cuadrícula de coordenadas de una representación multidimensional de las ventas: la estructura de sus dimensiones.

Dado que las actividades de cualquier empresa se desarrollan en el tiempo, la primera pregunta que surge durante el análisis es la dinámica del desarrollo empresarial. La correcta organización del eje temporal nos permitirá responder cualitativamente a esta pregunta. Normalmente, el eje temporal se divide en años, trimestres y meses. Es posible una fragmentación aún mayor en semanas y días. La estructura de la dimensión temporal se forma teniendo en cuenta la frecuencia de recepción de datos; También puede estar determinada por la frecuencia de la demanda de información.

La dimensión Grupo de productos está diseñada para reflejar lo más fielmente posible la estructura de los productos vendidos. Al mismo tiempo, es importante mantener un cierto equilibrio para, por un lado, evitar detalles excesivos (el número de grupos debe ser visible) y, por otro, no perder un segmento importante del mercado.

La dimensión “Clientes” refleja la estructura de ventas por base territorial y geográfica. Cada dimensión puede tener sus propias jerarquías, por ejemplo, en esta dimensión puede ser la estructura: Países – Regiones – Ciudades – Clientes.

Para analizar el desempeño de los departamentos, debes crear tu propia medición. Por ejemplo, podemos distinguir dos niveles de jerarquía: los departamentos y las divisiones dentro de ellos, lo que debería reflejarse en la dimensión “Divisiones”.

De hecho, las dimensiones “Tiempo”, “Productos”, “Clientes” definen completamente el espacio del área temática.

Además, resulta útil dividir este espacio en áreas condicionales, en función de características calculadas, por ejemplo, rangos de volumen de transacciones en términos de valor. Luego, todo el negocio se puede dividir en una serie de rangos de costos en los que se lleva a cabo. En este ejemplo, podemos limitarnos a los siguientes indicadores: la cantidad de ventas de bienes, la cantidad de bienes vendidos, la cantidad de ingresos, la cantidad de transacciones, la cantidad de clientes, el volumen de compras a los fabricantes.

OLAP: el cubo para análisis se verá así (Fig.2):


Figura 2.OLAP– cubo para analizar el volumen de ventas

Es precisamente esta matriz tridimensional la que se denomina cubo en términos OLAP. De hecho, desde el punto de vista de las matemáticas estrictas, dicha matriz no siempre será un cubo: un cubo real debe tener el mismo número de elementos en todas las dimensiones, pero los cubos OLAP no tienen tal limitación. Un cubo OLAP no tiene por qué ser tridimensional. Puede ser tanto bidimensional como multidimensional, según el problema que se resuelva. Los productos OLAP serios están diseñados para aproximadamente 20 dimensiones. Las aplicaciones de escritorio más simples admiten aproximadamente 6 dimensiones.

No es necesario completar todos los elementos del cubo: si no hay información sobre las ventas del Producto 2 al Cliente 3 en el tercer trimestre, el valor en la celda correspondiente simplemente no se determinará.

Sin embargo, el cubo en sí no es adecuado para el análisis. Si todavía es posible imaginar o representar adecuadamente un cubo tridimensional, entonces con un cubo de seis o diecinueve dimensiones la situación es mucho peor. Por lo tanto, antes de su uso, se extraen tablas bidimensionales ordinarias del cubo multidimensional. Esta operación se llama "cortar" el cubo. El analista, por así decirlo, toma y “corta” las dimensiones del cubo según las marcas que le interesan. De esta manera, el analista recibe una porción bidimensional del cubo (informe) y trabaja con ella. La estructura del informe se presenta en la Figura 3.

Figura 3.Estructura del informe analítico

Cortemos nuestro cubo OLAP y obtengamos un informe de ventas para el tercer trimestre, se verá así (Fig. 4).

Figura 4.Informe de ventas del tercer trimestre

Puede cortar el cubo a lo largo del otro eje y obtener un informe sobre las ventas del grupo de productos 2 durante el año (Fig. 5).

Figura 5.Informe trimestral de ventas del producto 2

De manera similar, puede analizar la relación con el cliente 4, cortando el cubo según la marca Clientes(Figura 6)

Figura 6.Informe de entregas de mercancías al cliente 4.

Puedes detallar el informe por mes o hablar sobre el suministro de bienes a una sucursal específica del cliente.