Cuando las empresas se plantean realizar una transformación digital implementando nuevas tecnologías Big Data y modelos Data Centric, se enfrentan a distintos retos que requieren planificación, definición de objetivos, toma de decisiones y evaluación de resultados.
En este post os vamos a contar cómo se desarrolla este proceso a partir de un caso de éxito: el de una de las empresas aseguradoras multinacionales más importantes del país, Caser.
Caser es una compañía de seguros y servicios que opera en España desde 1942. Entre su oferta encontramos seguros de salud, centros de atención y cuidados médicos, clínicas dentales, servicios de mantenimiento y asistencia, y una red de agentes financieros. Actualmente el grupo cuenta con un staff de más de 6.700 personas.
Retos
En Caser ya tenían un modelo orientado al Data Centric, con un núcleo principal basado en un Data Warehouse pero necesitaban mejorar algunos aspectos y aportar nuevas capacidades.
Su objetivo era mejorar aspectos como la escalabilidad y la seguridad en procesos masivos. Asimismo, les interesaba aportar nuevas capacidades en el gobierno del dato, el linaje, la catalogación, los controles de acceso y de auditoría.
La finalidad era construir una plataforma self-service, de BI analítica, en la que el usuario pudiera obtener la información más variada lo antes posible, de la mejor manera y de la forma más rápida. La necesidad era ganar en agilidad.
De todo ello nos habla Hugo González, Head of the Information structures and advanced Analytics área en Caser, en esta entrevista que nos ofreció recientemente:
“El reto para nosotros es empezar a tener una plataforma, no solamente que tenga los datos y los pueda proveer, sino que lo hagamos de una manera mucho más rápida, más ágil y que el dato sea lo más accesible posible en toda la compañía. El dato es un activo clave, afirma Hugo González, y más en una compañía financiera como la nuestra. Facilitar el acceso al dato, facilitar la incorporación de nueva información, que se pueda explotar en cualquier contexto de la manera más sencilla posible es un reto, pero es lo que vamos buscando.”
Si te interesa el tema, te recomendamos la entrevista completa:
Soluciones
Primera decisión: por qué plataforma apostar
En Caser analizaron diferentes tecnologías y valoraron multitud de opciones y plataformas disponibles en el mercado. Decidieron apostar por tecnología Big Data y, concretamente, por un cluster de Big Data con Cloudera.
La apuesta por el Big Data, en el proceso de transformación digital en la empresa aseguradora, ha potenciado el modelo Data Centric, desde una única plataforma abierta, Cloudera, donde obtener todo lo necesario de manera gestionada y administrada.
Primeros pasos de la implementación de Big Data con Cloudera
Una estrategia Data Centric como la que ha llevado a cabo Caser requiere de un roadmap a varios años vista.
En su caso, el primer paso ha sido diseñar e implementar un Data Lake para empezar a guardar la información. Sustituyeron el Staging Area Data Warehouse por un Data Lake en Cloudera. A efectos prácticos significa que sustituyeron la base de datos relacional e implementaron un Data Lake en Cloudera.
En este contexto utilizaron tecnologías como Apache Impala, Apache Kudu y Apache Spark. Impala por el rendimiento, Kudu por la necesidad de modificar datos y Spark para recodificar el SQL en escala.
También apostaron por mantener tecnologías que habían utilizado durante años para aprovechar los conocimientos acumulados y la experiencia, como es la herramienta ETL. Con esta decisión pudieron minimizar riesgos y cumplir con sus objetivos en el tiempo planificado.
Resultados de éxito
Uno de los objetivos de Caser en este proceso de transformación era que este cambio a una tecnología totalmente diferente a la que tenían, fuese transparente para el negocio, para los usuarios y los procesos. En este sentido el éxito ha sido total.
Otro de los objetivos que se ha conseguido con el Data Lake es centralizar el dato en un único sitio y que pueda utilizarse para reporting, analítica e incluso integrarlo con las aplicaciones de producción vía api rest y poder conseguir datos en tiempo real para la detección del fraude.
Colaboración PUE y Caser
Con PUE hemos formado un equipo en el que cada parte ha aportado lo mejor. Nosotros el conocimiento de los datos de Caser. Ellos, su conocimiento y experiencia en tecnología.
Afirma Hugo González de Caser refiriéndose a la colaboración con PUE.
PUE ha colaborado con Caser desde la fase inicial del proceso transformación digital, en la sustitución del Staging Area Data Warehouse por un Data Lake con Cloudera. Ha participado en todo el proyecto aportando soluciones tecnológicas: desde cómo conseguir que la herramienta de ETL se conecte de manera rápida y eficiente al data lake, hasta el diseño y cambio de todos los procesos. Se ha diseñando e implementado una arquitectura de datos capaz de mejorar el rendimiento de carga del Data Lake, para permitir un análisis de datos más eficiente en menos tiempo:
- Procesos de conversión de lenguajes de programación tradicionales, como PL/SQL, a procesos Spark con Scala, reduciendo el tiempo de los procesos de análisis de datos de horas a minutos, permitiendo ser más ágiles y tener un diagnóstico de negocio casi en tiempo real.
- Configuración de clústeres y políticas de seguridad.
- Integración de procesos de PowerCenter a Cloudera Platform.
Actualmente se ha iniciado una segunda fase en la colaboración, con uno de los procesos más masivos de la compañía.
Destaco la experiencia de PUE en Big Data, pero también el compromiso y la colaboración.
Hugo González.
Si tu empresa se plantea y necesita iniciar un proceso de modernización y transformación, estaremos encantados de analizar tu caso en particular para asesorarte sobre las soluciones y tecnologías más adecuadas a tu proyecto.
Datos de contacto
sales@pue.es