jump to navigation

OLAP – Habilitando la toma de decisiones a la velocidad del negocio

Fuente: http://businessintelligence.ittoolbox.com/research/decision-making-the-speed-of-business-21710

Los sistemas transaccionales son noticias de ayer en cuanto a reportes y analítica.

Empresas de todos los tamaños y colores se sustentan en lo mismo para tomar decisiones de negocio: datos.

Las compañías no tienen problemas para recolectar datos, de hecho, más datos están siendo recolectados en más formatos y sistemas que nunca antes. ¿Pero qué significan todos esos datos?

Las empresas a menudo confían en sistemas transaccionales tradicionales para seleccionar entre montañas de datos para encontrar información analítica contextual para tomar decisiones de negocio críticas. Esto es un error por dos razones: Primero, los sistemas transaccionales no fueron diseñados para realizar análisis y reportes y simplemente no pueden ejecutar consultas ad hoc tan rápida y certeramente como la velocidad de los negocios hoy en día requieren. Segundo, la analítica y los reportes ponen presión a las infraestructuras transaccionales convencionales, agregando complejidad administrativa, el mayor costo en requerimientos de almacenaje e incremento en la carga de trabajo del personal.

Un gerente de servicios corporativo en una compañía  de manufactura de 11 billones de dólares que está repensando su acercamiento a la analítica es un caso: “No creo que nuestros tradicionales sistemas OLTP puedan manejar el data warehousing y data mining que necesitamos para queries complejos. Es sencillamente demasiado complicado obtener los datos desde múltiples bases de datos entre los sectores” dice este gerente.

Hay una forma mejor. Los servidores especializados en analítica hacen posible escarbar en grandes volúmenes de datos para entregar información que ayude a las empresas a entender eventos del pasado a través de reportes  y detectar tendencias, oportunidades y problemas potenciales mediante aplicaciones analíticas mas avanzadas.

El número de usuarios de negocios que confían en servidores especializados en analítica o accesorios está creciendo. De acuerdo a nuevos datos de una encuesta de un grupo de servicios de investigación realizada a 112 gerentes de IT en diciembre de 2009, el 45% de los usuarios que fueron encuestados están tomando este acercamiento y cerca del 70% planea implementar servidores especializados en analítica en dos años. Es fácil ver el por qué. Los usuarios de negocios necesitan rápido acceso a información que soporte la toma de decisiones de misión crítica y reporte en tiempo real. Los enfoques innovadores, como utilizar sistemas de gestión de bases de datos basados en columnas  lo llevan aún más allá, entregando la información  necesaria más rápido, con mayor precisión y menor costo que usando los sistemas tradicionales basados en filas.

Click para ampliar

Servidores especializados en analítica

Las nuevas tecnologías han emergido a las organizaciones con la oportunidad de aprovechar la información como un activo clave de negocio. Fusiones, globalización, nuevas tecnologías y nuevos competidores son fuerzas que pueden debilitar la posición competitiva de una compañía si no posee un acceso prácticamente instantáneo a la información de misión crítica para responder a las condiciones dinámicas del mercado.

La mayoría de los encuestados, el 73%, dijo que la necesidad de soportar la toma de decisiones de misión crítica fue el principal conductor de la compra de soluciones de analítica y reporte; el 58% dijo que necesitan proveer a más usuarios el acceso a los datos; y el 56% mencionó que la mejora en la calidad de los datos está impulsando la compra.

Dos tercios de los que respondieron la encuesta generan reportes utilizando sistemas transaccionales para realizar análisis, pero el problema con este enfoque es simple: Los sistemas transaccionales no fueron diseñados para realizar analítica y reportes.

“Es como meter un camión de UPS en las quinientas millas de Indianápolis” dice Dan Lahl, director de analítica en Sybase.

Los sistemas tradicionales son estupendos para procesar transacciones, pero ya no pueden competir con un servidor especializado en analítica en ejecutar velozmente queries ad hoc complejos, de lo que un camión de reparto puede competir con autos altamente preparados en Indianápolis. Otros retos con los sistemas tradicionales reportados por los gerentes de IT, de acuerdo a IDG Research, incluyen pérdidas en recursos de personal, complejidad administrativa e imposibilidad de soportar datos no estructurados y altos requerimientos de almacenaje.

Los servidores especializados en analítica están diseñados específicamente para procesar reportes y realizar analítica además de responder a consultas ad hoc a través de grandes cantidades de datos. Los sistemas especializados en analítica no reemplazan a los sistemas tradicionales. Estos descargan datos de los sistemas tradicionales para que estos puedan hacer aquello para lo que fueron diseñados, procesar transacciones de negocio.

Con los servidores especializados en analítica, los usuarios pueden sumergirse rápidamente en sus datos y ejecutar consultas que ayuden a identificar tendencias y oportunidades. También pueden ejecutar análisis de riesgos y escenarios what-if (qué si?) para obtener un mas completo entendimiento de su situación y sus opciones. En resumen, los servidores especializados en analítica ayudan a las compañías a cambiar de realizar decisiones tácticas a decisiones estratégicas.

Es la diferencia entre realizar reportes de lo que ya ha pasado (cuantos sweaters púrpura vendió la tienda de Austin el último cuarto) y entender por qué el púrpura fue tan vendido y predecir cuan listos estamos para seguir las tendencias del próximo cuarto.

Los servidores construidos para reporte y analítica pueden entregar respuestas hasta cien veces más rápido que los sistemas de data warehouse convencionales, sin importar el número de usuarios realizando consultas o la complejidad de las mismas.

Y más usuarios que nunca están ejecutando consultas. En el pasado, solo los gerentes senior tenían acceso a información analítica e indicadores clave de performance, usualmente mediante algún tipo de tablero. Ahora los usuarios  a través de toda la organización en todas las líneas de negocio requieren acceso. Es por esto que el 84% de los que respondieron la encuesta calificaron “acceso a usuarios” como la característica mas crítica para evaluar a las soluciones de analítica y reportes.

Con los servidores especializados en analítica, los usuarios pueden ejecutar sus consultas tan a menudo como quieran, cuando anteriormente debían esperar que los administradores de IT ejecutaran los reportes por ellos. Esto significa que los usuarios a través de toda la empresa pueden obtener percepciones y rápidamente tomar decisiones que afectan al negocio.

“Nosotros utilizamos servidores especializados en analítica para marketing” dice Ken Turner, director de IT en una de las más grandes empresas de tecnología. “Estamos teniendo una mejor foto de nuestros clientes, eso va a nuestra publicidad. Nos ayuda a identificar el tipo correcto de compañía y hacer el salto en nuestra competencia para ese tipo de cuentas.”

De acuerdo a IDG Research, las compañías que usan servidores dedicados o especializados en analítica informan niveles más altos de satisfacción del cliente que aquellas que utilizan sistemas de propósito general.

Específicamente:

 

Arquitectura basada en columnas

Las compañías en busca de una ventaja competitiva hoy en día necesitan más que reportes estándar. Las capacidades de los sistemas de gestión de bases de datos tradicionales basados en filas, que deben leer una fila completa de datos (en vez de solo aquello que es necesario dentro de la fila), se ven rápidamente excedidas cuando se accede a los atributos requeridos de una consulta compleja. Esto pone una pesada carga en los recursos de entrada y salida y ha forzado a los administradores de bases de datos a afinar los motores de las mismas para queries complejos, mayormente construyendo índices adicionales. La contraparte de este enfoque bastante obvia.

Una arquitectura basada en columnas es diferente. Maneja los datos de manera vertical en columnas, y cada columna se almacena de manera independiente. El sistema puede determinar qué columnas están siendo accedidas y devolver solo los valores o atributos solicitados de las columnas. En vez de necesitar índices separados, como en los sistemas basados en filas, los atributos de datos en si mismos forman el índice dentro de cada columna. Esto reduce la entrada/ salida (I/ O) y permite un rápido acceso a los datos sin la necesidad de expandir la marca de la base de datos. “Este enfoque es mucho mas rápido” dice Turner. “Podes determinar exactamente qué parámetros estás buscando. Las bases de datos basadas en filas simplemente no están para eso todavía. Además, en términos de escalabilidad, para las basadas en columnas, es infinita.

Mitos y realidades de los servidores especializados en analítica

De acuerdo a una encuesta realizada por IDG Research a un grupo de 112 gerentes consultados en diciembre de 2009, el 62% de ellos realizan reportes utilizando sistemas transaccionales tradicionales para analítica y reporte. Entre las razones citadas por estos gerentes para no considerar los servidores especializados en analítica fueron preocupaciones de costos, restricciones de recursos y la noción de que es muy arriesgado realizar un cambio.

Estos aspectos negativos percibidos son solo eso, percepciones. Los gerentes de IT que implementaron servidores especializados en analítica reportaron recortes de costos, requerimientos de almacenamiento disminuidos y menos horas de trabajo utilizadas en la creación de reportes y analítica. Veamos estas preocupaciones una a una.

Costo

Los servidores especializados en analítica, tales como Sybase IQ ahorran dinero en comparación con los sistemas tradicionales. Primero, el enfoque orientado a columnas de Sybase IQ utiliza técnicas de compresión de datos avanzadas que reducen los requerimientos de disco y en definitiva menores costos generales de almacenamiento. Este enfoque comprime los datos en hasta un 70% de su valor original de entrada y los requerimientos de almacenaje se ven reducidos en, por lo menos, un 30%.

Más aún, es el enfoque tradicional a la analítica y reporte el que agrega costos. Los sistemas OLTP consumen grandes cantidades de recursos de sistema para ejecutar queries, porque leen cada byte de cada fila en una base de datos grande. Para mantener una performance aceptable para consultas, los gerentes de IT agregan más hardware o afinan el sistema para agilizar las consultas o ambas.

Restricciones de recursos

Los servidores especializados en analítica liberan a los departamentos de IT de la carga de ejecutar reportes y consultas para sus usuarios y los habilitan a enfocarse en proyectos que mejoren los procesos de negocio o realicen recortes de costo de otras formas. Con servidores especializados en analítica los usuarios ejecutan sus propias consultas. Eso es importante ya que más usuarios que nunca están ejecutando consultas. Sybase IQ maneja simultáneamente consultas ad hoc y tiene la escalabilidad suficiente para soportar futuro crecimiento.

Además, dado que Sybase IQ soporta completamente el acceso estándar a base de datos mediante SQL, es necesario poco entrenamiento para los usuarios, lo que significa tiempos de implementación más cortos y mayor conservación de los recursos de personal de IT.

Riesgos

Puede decirse que, utilizar sistemas tradicionales para realizar reportes y analítica incorpora riesgos debido a la innecesaria carga que coloca en los sistemas actuales. Cuando los sistemas transaccionales se sobrecargan, la performance se ve degradada, y cuando esto ocurre los niveles de servicio predeterminados no se alcanzan y los acuerdos de niveles de servicio no se cumplen. De hecho, en entrevistas con gerentes de IT que utilizan servidores especializados en analítica, muchos de ellos citaron el incrementar la performance de los acuerdos de niveles de servicio (SLA) como un determinante para utilizarlos. Un gerente de servicios empresariales comenta que “si no mejoramos nuestra performance, los clientes van a irse a otro lado”.

En términos de implementación, las operaciones existentes no se ven interrumpidas mientras que los datos son descargados de los sistemas tradicionales.

Más aún, sistemas como Sybase IQ están basados en estándares, lo que significa que los administradores no tienen que aprender lenguajes propietarios de consulta. Los sistemas basados en estándares siguen un camino llano para actualizaciones ya que las compañías líderes de hadware que soportan estos sistemas hacen mejoras en redundancia, energía y performance.

Impulsores y beneficios

Los beneficios reales de negocio están asociados a los servidores especializados en analítica, y eso es lo que está impulsando interés en el segmento. De hecho, la investigación muestra que la mayoría de los gerentes de IT, aproximadamente dos terceras partes, dicen estar explorando los servidores especializados en analítica debido a la necesidad de soportar las decisiones de negocio de misión crítica.

Cuando las compañias pueden “minar” la información para tomar mejores decisiones, pueden identificar y servir a los clientes de manera más eficiente, pueden competir más efectivamente y están generalmente en mejores condiciones para observar todos los ángulos de un tema. Las compañías que tienen una visión de lo que pasó, lo que está pasando y lo que va a pasar, raramente son tomadas por sorpresa.

Así como el gerente de servicios empresariales ha notado, está buscando en los servidores especializados en analítica para mejorar la retención de clientes. “¿Qué quieren nuestros clientes?, ¿Por qué cosas están preguntando?, ¿Cómo analizamos estos datos para asegurarnos que mantenemos nuestra base de clientes centrales?”.

Hay otros beneficios. De acuerdo a la encuesta, tres de los siete beneficios que los gerentes de IT esperan ganar de invertir en sistemas basados en columnas tienen que ver con el ahorro en costos y la reducción de alcance del data center. Específicamente:

Los sistemas especializados en analítica basados en columnas, como Sybase IQ, proveen una capacidad de compresión de datos significativa, que reduce el área de cobertura general del data center y disminuye los requerimientos de almacenaje un 30% como mínimo. Una prueba independiente informa que, para almacenar un Petabyte de datos en bruto, un sistema basado en columnas requiere de 260 Terabytes de espacio físico de almacenaje. En contraste, una base de datos basada en filas, que requiere varios índices más, requiere más de 1500 Terabytes de espacio físico.

Un director de IT en una empresa de seguros de 9 billones de dólares que utiliza sistemas tradicionales para realizar reportes y analítica confiere, “Los requerimientos de almacenaje son un inconveniente para nosotros. Nuestro data warehouse es muy grande y costoso”.

En cambio, con un servidor analítico basado en columnas, el personal de IT pasa mucho menos tiempo realizando analítica y reportes, en favor de las unidades de negocio, o ajustando indefinidamente la base de datos basada en filas en un intento de conseguir la performance necesaria. Esto los libera para enfocarse en otras tareas que soportan al negocio.

Analizar cantidades crecientes de datos complejos es simplemente no práctico con sistemas OLTP tradicionales, pero con sistemas basados en columnas, las organizaciones pueden rápidamente explorar montañas de datos en bruto y entregar resultados – información accionable – a los usuarios en toda la empresa.

Click para ampliar

En consecuencia…..

No es poco común para grandes compañías tener 100 Terabytes de datos o más. Poniendo esto en perspectiva, un terabyte puede contener aproximadamente 220 millones de páginas de texto plano. Los sistemas tradicionales, que ya se encuentran ocupados procesando transacciones, simplemente carecen de la capacidad de sumergirse rápidamente en toda la información para encontrar información granular, contextual y analítica. No es para lo que fueron diseñados.

Los usuarios en toda la empresa necesitan información que informe decisiones de negocio críticas, que es el corazón de la inteligencia de negocios. Los servidores especializados en analítica, como Sybase IQ están diseñados para el procesamiento veloz de consultas, analítica ad hoc y entregar mejor performance a un menor costo. El sistema analiza inmensas cantidades de datos sin necesidad de realizar ajustes o espacio de almacenaje adicional.

En definitiva, utilizar servidores especializados en analítica es una manera práctica de bajo riesgo para convertir datos en crudo en conocimiento accionable.


Conclusión

Leonardo Adrián Tocci – 3801-1732
Javier Hernán Lafont – 4001-2676
Silvio Segurotti – 1328-0148

El documento plantea las bondades del producto Sybase IQ para realizar reportes y analítica (entendiendo analítica como el método del análisis lógico).

Siendo cada vez más necesario el poder contar con información precisa, en tiempo y forma y accionable, la utilización de este tipo de tecnologías es una ventaja competitiva ya que el costo de conseguir esa información mediante sitemas transaccionales tradicionales o incluso mediante data warehouses es mucho mayor a la que implica la utilización de servidores especializados en analítica.

A %d blogueros les gusta esto: