SlideShare uma empresa Scribd logo
1 de 18
Big Data en el Entorno
Bancario
Martín Cabrera
Technology Director
Everis, an NTT DATA Company
@dmcabrera
martin.cabrera.aguilar@everis.com
Enteprise Data
Warehouse
Cubos
Sistemas
Transaccionales
(OLTP)
Integración y
Consolidación
Operaciones y
Analítica
Arquitectura de Datos Tradicional
CRM
ERP
Web
Channel
Call
Center
ETL
Datamart
Datamart
ETL
Reportes Operativos y
Analíticos
CRM
ERP
Modelamiento y
minería de datos
ETL
Auditoría
Gaps de la Arquitectura de Datos Tradicional
• Soporte de volúmenes de datos limitado a
nivel de los sistemas OLTP
• Integración y consolidación compleja a
través de procesos ETL
• Excesiva normalización y rigidez a nivel de
los esquemas de datos
• No es compatible con la carga de fuentes de
datos no estructuradas
• No soporta naturalmente la implementación
de real-time analytics
• Capacidad de escalamiento y elasticidad
limitados y de alto costo
• Pensada principalmente para el mundo on-
premise, lo que dificulta su extensión hacia
el Cloud
30%
50%
20%
Workloads
ETL
Operaciones
Analíticos
No esta preparada para la
Transformación Digital
Arquitectura de Datos Moderna
Hadoop Distributed File System (HDFS)
Otro
EDW
DM
DM
Data Access APIs
OLTP OLTP OLTP
Workload Interactivo Workload Real-time Workload Batch Workload Analítico
Fuentes de Datos No Estructuradas
Documentos y
Correos
Web Logs &
Click Streams
Social
Networks
Cloud-based
Services
Sensors Data
Geo-location
Data
¿Cómo resuelve los gaps la Arquitectura de Datos Moderna?
• Eliminando la separación conceptual y física de
los datos OLTP y los datos Analíticos a partir de
una Arquitectura de Datos unificada
• Eliminando las clásicas limitaciones de manejo
de volúmenes de información restringidos
• Soportando bajo una misma plataforma todos
los workloads requeridos actualmente,
Interactivo, Real-time, Batch y Analítico
• Integrándose con los activos de datos existentes
como el EDW, los DataMarts y las bases de
datos OLTP más las fuentes de datos no
estructuradas.
• Generando la figura de un Enterprise Data Lake
disponible para toda la corporación.
• Siendo compatible con arquitecturas de tipo
Cloud-Híbrida
20%
40%
40%
Workloads
ETL
Operaciones
Analíticos
Siendo un habilitador
fundamental para la
implementación de
productos y servicios
digitales
Resumen Comparativo
• Volúmenes de datos limitados y
capacidad de escalamiento vertical.
• Separación conceptual y física de datos
OLTP y datos analíticos
rellenorellenorellen.o
• Excesiva normalización y rigidez a nivel de
los esquemas de datos.
• Limitaciones importantes para resolver
workloads de Real-time analytics
rellenorellenorelleno
• No preparada para soportar el desarrollo
de productos y servicios digitales
• Pensada principalmente para el mundo
on-premise.
Arquitectura de Datos Tradicional
• Volúmenes de datos ilimitados con
capacidad de escalamiento horizontal.
• Arquitectura de datos Unificada que
integra fuentes de datos estructuradas y
no estructuradas.
• Esquemas flexibles diseñados para
cambiar frecuentemente.
• Diseñada para soportar cualquier tipo de
workload, Interactivo, Real-time, Batch y
Analítico.
• Fundamental para la implementación de
productos y servicios digitales
• Compatible con cualquier arquitectura
Cloud (privada, pública, híbrida).
Arquitectura de Datos Moderna
Web/Móvil
Sucursales
Callcente
r
ETL
Enteprise Data
Warehouse
Inteligencia
de Clientes
Modelos
Predictivos
Campañas Push
Modelos Riesgo
Reportes
Pérdida de Información
al momento de
transformar los datos
Existen datos que no
estamos procesando (ej:
logs)
No soporta la
implementación de
servicios de Real-Time
Analytics
Capacidad Analítica
limitada a los datos
disponibles
Baja capacidad de
impulsar la práctica
de Data Discovery
Escenario actual en la Banca
Riesgo
Canales
Operacione
s
Carga incremental (en near-real-
time) de todas las fuentes de
información relevantes.
Carga de fuentes no estructuradas
como logs, correos e información de
redes sociales.
Escenario futuro (Big Data)
Real-time
Analytics API
Campañas
Real-time
Data Insight
Discovery
Logs
Logs
Logs
Big Data
Enterprise Platform
(Data Lake)
EL
ETL
Web/Móvil
Sucursales
Callcente
r
ETL
Enteprise Data
Warehouse
Modelos
Predictivos
Campañas Push
Modelos Riesgo
Reportes
Data
Scientists
Capacidad analítica potenciada por
nuevas fuentes de información
Soporta la implementación de
servicios real-time y la práctica de
Discovery de datos
Machine Learning
based models
Inteligenci
a de
Clientes
Riesgo
Canales
Operacione
s
¿Cuáles serían los casos de uso
más comunes de Big Data en la
Banca y la arquitectura sugerida?
Enterprise Data Warehouse offloading
Enterprise Data
Warehouse
OLTP
ETL
1
2
Movemos información de
menor valor y/o histórica
desde el EDW a Hadoop
ocupando Sqoop
También podemos
replicar la información en
Hadoop para derivar
carga de explotación
Equipos
Explotació
n
3
4
Los equipos explotan la
información con las
mismas herramientas
que ocupan
actualmente.
Enterprise Data Lake
Enterprise Data
Warehouse
(EDW)
ETL
1
Equipos
Explotació
n
3
4
OLTP
OLTP
Las bases de datos
OLTP más
importantes se
cargan as-is en
Hadoop en
modalidad Batch
ETL
2
El EDW puede ser
cargado desde el
Data Lake en
Hadoop a través de
procesos ETL
Enterprise Data Lake + Nuevas Fuentes
Enterprise Data
Warehouse
(EDW)
ETL
1
Equipos
Explotación
4
5
OLTP
El Data Lake
incorpora fuentes
de datos No
Estructuradas en
modalidad Batch
ETL
3
Logs
OLTP
Logs
2
Data
Scientists
Data Insight
Discovery
(Aster Data)
Advanced
Analytics
(Mahout, R)
Cognitive
Analytics
(IBM Watson)
Near-Real-Time Data Ingestion
Enterprise Data
Warehouse (EDW)
Equipos
Explotació
n
4
5
OLTP
Los agentes de Flume
hacen streaming de la
información generada
ETL
3
Logs
OLTP
Logs
Flume
Agent
Flume
Agent
Flume
Agent
Los Interceptors de Flume
permiten enriquecer la
ingesta de datos para
finalmente guardarla en
HDFS (Hadoop)
1
2
Data
Scientists
Data Insight
Discovery
(Aster Data)
Advanced
Analytics
(Mahout, R)
Cognitive
Analytics
(IBM Watson)
Real-Time Analytics con HBase
OLTP
Logs
OLTP
Logs
Flume
Agent
Flume
Agent
Flume
Agent
En el proceso de ingesta de
datos, se guarda
información en HBase que
posteriormente servirá
como input para los
servicios Real-Time (ej: el
consumo acumulado diario
por rubro de un cliente con
tarjeta de crédito).
1
Real-Time
Analytics
Services API
2
3 El servicio real-time (expuesto como
API) es consumido por ejemplo por
la aplicación móvil cada vez que el
cliente realiza un pago con tarjeta.
Con la estructura clave-valor en
HBase, el servicio puede advertir al
cliente de un consumo excesivo en
su tarjeta e inclusive compararlo con
meses y años anteriores.
Real-Time Analytics con HBase+Spark
OLTP
Logs
OLTP
Logs
Flume
Agent
Flume
Agent
Flume
Agent
1
Real-Time
Analytics
Services API
3
Spark permite crear un
Resilient Distributed Dataset
(RDD) a partir de datos en
HDFS, HBase, etc.
Su capacidad de representar
los datos en memoria y de
procesar los mismos de
manera distribuida, permite
crear servicios de real-time
analytics avanzados que
requieran procesar grandes
volúmenes de datos.
2
Ejemplo Digital Journey soportado por BigData
Web
Red Social
El usuario se
conecta a
www.banco.cl
La aplicación le
indica que se
registre con sus
credenciales de
Twitter /
Facebook o
Linkedin
El usuario selecciona
Linkedin y la
aplicación solicita
permisos para
acceder a su perfil y
su lista de contactos
La aplicación le
muestra sus datos, le
solicita que ingrese su
número de móvil, una
clave segura y le envía
por SMS un código de
enrolamiento para su
dispositivo.
Móvil
El usuario recibe el
código de
enrolamiento para
confirmar su regsitro
El usuario confirma su registro y ya es
“Cliente Registrado”. La aplicación le da
la Bienvenida y la indica que 36 de sus
contactos en Linkedin ya son clientes
del Banco y que 22 de ellos tienen Cta
Cte y Tarjeta de Crédito, mientras que
18 tienen productos de inversión,
invitándolo a contratar dichos
productos
Email
El cliente recibe un correo de
bienvenida, con la misma
información de sus contactos que
está viendo en la aplicación web y
con la invitación a seguir
explorando los productos del
Banco
Resumiendo
• Los Bancos (y todos los negocios digitales) necesitan una
Arquitectura de Datos Moderna que soporte el
procesamiento de grandes volúmenes de información
(Big Data).
• El foco inicial debe estar puesto en la implementación de
una Plataforma de Big Data Corporativa, tanto para fines
analíticos como operativos.
• Los casos de uso más implementados son:
• Database offloading
• Enterprise Data Lake
• Near-Real-Time Data Ingestion
• Real-Time Analytics
Big Data en el Entorno
Bancario
Martín Cabrera
Technology Director
Everis, an NTT DATA Company
@dmcabrera
martin.cabrera.aguilar@everis.com

Mais conteúdo relacionado

Mais procurados

Enterprise Data Management
Enterprise Data ManagementEnterprise Data Management
Enterprise Data ManagementBhavendra Chavan
 
¿Qué es el gobierno de los datos?
¿Qué es el gobierno de los datos? ¿Qué es el gobierno de los datos?
¿Qué es el gobierno de los datos? www.cathedratic.com
 
Best Practices in Metadata Management
Best Practices in Metadata ManagementBest Practices in Metadata Management
Best Practices in Metadata ManagementDATAVERSITY
 
Data Virtualization: An Introduction
Data Virtualization: An IntroductionData Virtualization: An Introduction
Data Virtualization: An IntroductionDenodo
 
Introduccion a Arquitectura Empresarial
Introduccion a Arquitectura EmpresarialIntroduccion a Arquitectura Empresarial
Introduccion a Arquitectura EmpresarialEduardo Castro
 
Big Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negociosBig Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negociosCelestino Güemes Seoane
 
Cuadro comparativo entre la metodología estructurada y metodología orientada ...
Cuadro comparativo entre la metodología estructurada y metodología orientada ...Cuadro comparativo entre la metodología estructurada y metodología orientada ...
Cuadro comparativo entre la metodología estructurada y metodología orientada ...MariaCapuzzo
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouseEduardo Castro
 
Big data para principiantes
Big data para principiantesBig data para principiantes
Big data para principiantesCarlos Toxtli
 
Diagramas de Flujos de Datos
Diagramas de Flujos de DatosDiagramas de Flujos de Datos
Diagramas de Flujos de DatosRenny Batista
 
Using Business Architecture to Facilitate a North American Business Model at ...
Using Business Architecture to Facilitate a North American Business Model at ...Using Business Architecture to Facilitate a North American Business Model at ...
Using Business Architecture to Facilitate a North American Business Model at ...Daniel Lambert, M. Sc.
 
SISTEMA DE GESTION DE BASE DE DATOS SGBD
SISTEMA DE GESTION DE BASE DE DATOS SGBDSISTEMA DE GESTION DE BASE DE DATOS SGBD
SISTEMA DE GESTION DE BASE DE DATOS SGBDIsabel C de Talamas
 
The Path to Data and Analytics Modernization
The Path to Data and Analytics ModernizationThe Path to Data and Analytics Modernization
The Path to Data and Analytics ModernizationAnalytics8
 
Master Data Management - Gartner Presentation
Master Data Management - Gartner PresentationMaster Data Management - Gartner Presentation
Master Data Management - Gartner Presentation303Computing
 
Problemas en el desarrollo de software
Problemas en el desarrollo de software Problemas en el desarrollo de software
Problemas en el desarrollo de software Arielkad
 
Designing An Enterprise Data Fabric
Designing An Enterprise Data FabricDesigning An Enterprise Data Fabric
Designing An Enterprise Data FabricAlan McSweeney
 

Mais procurados (20)

Enterprise Data Management
Enterprise Data ManagementEnterprise Data Management
Enterprise Data Management
 
¿Qué es el gobierno de los datos?
¿Qué es el gobierno de los datos? ¿Qué es el gobierno de los datos?
¿Qué es el gobierno de los datos?
 
Best Practices in Metadata Management
Best Practices in Metadata ManagementBest Practices in Metadata Management
Best Practices in Metadata Management
 
Data Virtualization: An Introduction
Data Virtualization: An IntroductionData Virtualization: An Introduction
Data Virtualization: An Introduction
 
Introduccion a Arquitectura Empresarial
Introduccion a Arquitectura EmpresarialIntroduccion a Arquitectura Empresarial
Introduccion a Arquitectura Empresarial
 
Big Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negociosBig Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negocios
 
Cuadro comparativo entre la metodología estructurada y metodología orientada ...
Cuadro comparativo entre la metodología estructurada y metodología orientada ...Cuadro comparativo entre la metodología estructurada y metodología orientada ...
Cuadro comparativo entre la metodología estructurada y metodología orientada ...
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Big data para principiantes
Big data para principiantesBig data para principiantes
Big data para principiantes
 
Data mart
Data martData mart
Data mart
 
Diagramas de Flujos de Datos
Diagramas de Flujos de DatosDiagramas de Flujos de Datos
Diagramas de Flujos de Datos
 
Using Business Architecture to Facilitate a North American Business Model at ...
Using Business Architecture to Facilitate a North American Business Model at ...Using Business Architecture to Facilitate a North American Business Model at ...
Using Business Architecture to Facilitate a North American Business Model at ...
 
SISTEMA DE GESTION DE BASE DE DATOS SGBD
SISTEMA DE GESTION DE BASE DE DATOS SGBDSISTEMA DE GESTION DE BASE DE DATOS SGBD
SISTEMA DE GESTION DE BASE DE DATOS SGBD
 
The Path to Data and Analytics Modernization
The Path to Data and Analytics ModernizationThe Path to Data and Analytics Modernization
The Path to Data and Analytics Modernization
 
Master Data Management - Gartner Presentation
Master Data Management - Gartner PresentationMaster Data Management - Gartner Presentation
Master Data Management - Gartner Presentation
 
Modern Data Architecture
Modern Data ArchitectureModern Data Architecture
Modern Data Architecture
 
Analisis y diseño de sistemas
Analisis y diseño de sistemasAnalisis y diseño de sistemas
Analisis y diseño de sistemas
 
Problemas en el desarrollo de software
Problemas en el desarrollo de software Problemas en el desarrollo de software
Problemas en el desarrollo de software
 
Ciclo de vida de la inteligencia de negocios
Ciclo de vida de la inteligencia de negociosCiclo de vida de la inteligencia de negocios
Ciclo de vida de la inteligencia de negocios
 
Designing An Enterprise Data Fabric
Designing An Enterprise Data FabricDesigning An Enterprise Data Fabric
Designing An Enterprise Data Fabric
 

Semelhante a Big Data en el entorno Bancario

Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasJoseph Lopez
 
3 formas disponibilizar y acceder rápidamente a tus datos
3 formas disponibilizar y acceder rápidamente a tus datos3 formas disponibilizar y acceder rápidamente a tus datos
3 formas disponibilizar y acceder rápidamente a tus datosIT-NOVA
 
Integración de Datos sin límites con Pentaho
Integración de Datos sin límites con PentahoIntegración de Datos sin límites con Pentaho
Integración de Datos sin límites con PentahoDatalytics
 
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Denodo
 
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptx
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptxJASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptx
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptxIT-NOVA
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouseguest10616d
 
Oracle, Informix
Oracle, InformixOracle, Informix
Oracle, Informixallison tl
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informeCarlosTenelema1
 
Oracle data integrator (odi)
Oracle data integrator (odi)Oracle data integrator (odi)
Oracle data integrator (odi)Leonel Ibarra
 
Autoservicio BI
Autoservicio BI Autoservicio BI
Autoservicio BI NexTReT
 
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric Lógico
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric LógicoMejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric Lógico
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric LógicoDenodo
 

Semelhante a Big Data en el entorno Bancario (20)

Querona
QueronaQuerona
Querona
 
BI - Componentes de BI.pptx
BI - Componentes de BI.pptxBI - Componentes de BI.pptx
BI - Componentes de BI.pptx
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivas
 
3 formas disponibilizar y acceder rápidamente a tus datos
3 formas disponibilizar y acceder rápidamente a tus datos3 formas disponibilizar y acceder rápidamente a tus datos
3 formas disponibilizar y acceder rápidamente a tus datos
 
Integración de Datos sin límites con Pentaho
Integración de Datos sin límites con PentahoIntegración de Datos sin límites con Pentaho
Integración de Datos sin límites con Pentaho
 
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
 
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptx
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptxJASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptx
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptx
 
Capitulo 2 introducción al business intelligence
Capitulo 2   introducción al business intelligenceCapitulo 2   introducción al business intelligence
Capitulo 2 introducción al business intelligence
 
Data mart
Data martData mart
Data mart
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 
Oracle
OracleOracle
Oracle
 
PPTS establecida para los manuales del DAT New.ppt
PPTS establecida para los manuales del DAT New.pptPPTS establecida para los manuales del DAT New.ppt
PPTS establecida para los manuales del DAT New.ppt
 
ALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptxALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptx
 
Business Analytics 101
Business Analytics 101Business Analytics 101
Business Analytics 101
 
Oracle, Informix
Oracle, InformixOracle, Informix
Oracle, Informix
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informe
 
CASO PRACTICO 2.pptx
CASO PRACTICO 2.pptxCASO PRACTICO 2.pptx
CASO PRACTICO 2.pptx
 
Oracle data integrator (odi)
Oracle data integrator (odi)Oracle data integrator (odi)
Oracle data integrator (odi)
 
Autoservicio BI
Autoservicio BI Autoservicio BI
Autoservicio BI
 
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric Lógico
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric LógicoMejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric Lógico
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric Lógico
 

Último

GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx241523733
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfjeondanny1997
 
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptchaverriemily794
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son241514984
 
Los Microcontroladores PIC, Aplicaciones
Los Microcontroladores PIC, AplicacionesLos Microcontroladores PIC, Aplicaciones
Los Microcontroladores PIC, AplicacionesEdomar AR
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxaylincamaho
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxAlexander López
 
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptTEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptJavierHerrera662252
 
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxModelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxtjcesar1
 
Presentación sobre la Inteligencia Artificial
Presentación sobre la Inteligencia ArtificialPresentación sobre la Inteligencia Artificial
Presentación sobre la Inteligencia Artificialcynserafini89
 
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúRed Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúCEFERINO DELGADO FLORES
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxazmysanros90
 
Trabajo de tecnología excel avanzado.pdf
Trabajo de tecnología excel avanzado.pdfTrabajo de tecnología excel avanzado.pdf
Trabajo de tecnología excel avanzado.pdfedepmariaperez
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.241514949
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxNombre Apellidos
 
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxAlexander López
 
tarea de exposicion de senati zzzzzzzzzz
tarea de exposicion de senati zzzzzzzzzztarea de exposicion de senati zzzzzzzzzz
tarea de exposicion de senati zzzzzzzzzzAlexandergo5
 
Tecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxTecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxGESTECPERUSAC
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA241531640
 

Último (20)

GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
 
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son
 
Los Microcontroladores PIC, Aplicaciones
Los Microcontroladores PIC, AplicacionesLos Microcontroladores PIC, Aplicaciones
Los Microcontroladores PIC, Aplicaciones
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidad
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
 
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptTEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
 
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxModelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
 
Presentación sobre la Inteligencia Artificial
Presentación sobre la Inteligencia ArtificialPresentación sobre la Inteligencia Artificial
Presentación sobre la Inteligencia Artificial
 
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúRed Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptx
 
Trabajo de tecnología excel avanzado.pdf
Trabajo de tecnología excel avanzado.pdfTrabajo de tecnología excel avanzado.pdf
Trabajo de tecnología excel avanzado.pdf
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
 
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
 
tarea de exposicion de senati zzzzzzzzzz
tarea de exposicion de senati zzzzzzzzzztarea de exposicion de senati zzzzzzzzzz
tarea de exposicion de senati zzzzzzzzzz
 
Tecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxTecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptx
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
 

Big Data en el entorno Bancario

  • 1. Big Data en el Entorno Bancario Martín Cabrera Technology Director Everis, an NTT DATA Company @dmcabrera martin.cabrera.aguilar@everis.com
  • 2. Enteprise Data Warehouse Cubos Sistemas Transaccionales (OLTP) Integración y Consolidación Operaciones y Analítica Arquitectura de Datos Tradicional CRM ERP Web Channel Call Center ETL Datamart Datamart ETL Reportes Operativos y Analíticos CRM ERP Modelamiento y minería de datos ETL Auditoría
  • 3. Gaps de la Arquitectura de Datos Tradicional • Soporte de volúmenes de datos limitado a nivel de los sistemas OLTP • Integración y consolidación compleja a través de procesos ETL • Excesiva normalización y rigidez a nivel de los esquemas de datos • No es compatible con la carga de fuentes de datos no estructuradas • No soporta naturalmente la implementación de real-time analytics • Capacidad de escalamiento y elasticidad limitados y de alto costo • Pensada principalmente para el mundo on- premise, lo que dificulta su extensión hacia el Cloud 30% 50% 20% Workloads ETL Operaciones Analíticos No esta preparada para la Transformación Digital
  • 4. Arquitectura de Datos Moderna Hadoop Distributed File System (HDFS) Otro EDW DM DM Data Access APIs OLTP OLTP OLTP Workload Interactivo Workload Real-time Workload Batch Workload Analítico Fuentes de Datos No Estructuradas Documentos y Correos Web Logs & Click Streams Social Networks Cloud-based Services Sensors Data Geo-location Data
  • 5. ¿Cómo resuelve los gaps la Arquitectura de Datos Moderna? • Eliminando la separación conceptual y física de los datos OLTP y los datos Analíticos a partir de una Arquitectura de Datos unificada • Eliminando las clásicas limitaciones de manejo de volúmenes de información restringidos • Soportando bajo una misma plataforma todos los workloads requeridos actualmente, Interactivo, Real-time, Batch y Analítico • Integrándose con los activos de datos existentes como el EDW, los DataMarts y las bases de datos OLTP más las fuentes de datos no estructuradas. • Generando la figura de un Enterprise Data Lake disponible para toda la corporación. • Siendo compatible con arquitecturas de tipo Cloud-Híbrida 20% 40% 40% Workloads ETL Operaciones Analíticos Siendo un habilitador fundamental para la implementación de productos y servicios digitales
  • 6. Resumen Comparativo • Volúmenes de datos limitados y capacidad de escalamiento vertical. • Separación conceptual y física de datos OLTP y datos analíticos rellenorellenorellen.o • Excesiva normalización y rigidez a nivel de los esquemas de datos. • Limitaciones importantes para resolver workloads de Real-time analytics rellenorellenorelleno • No preparada para soportar el desarrollo de productos y servicios digitales • Pensada principalmente para el mundo on-premise. Arquitectura de Datos Tradicional • Volúmenes de datos ilimitados con capacidad de escalamiento horizontal. • Arquitectura de datos Unificada que integra fuentes de datos estructuradas y no estructuradas. • Esquemas flexibles diseñados para cambiar frecuentemente. • Diseñada para soportar cualquier tipo de workload, Interactivo, Real-time, Batch y Analítico. • Fundamental para la implementación de productos y servicios digitales • Compatible con cualquier arquitectura Cloud (privada, pública, híbrida). Arquitectura de Datos Moderna
  • 7. Web/Móvil Sucursales Callcente r ETL Enteprise Data Warehouse Inteligencia de Clientes Modelos Predictivos Campañas Push Modelos Riesgo Reportes Pérdida de Información al momento de transformar los datos Existen datos que no estamos procesando (ej: logs) No soporta la implementación de servicios de Real-Time Analytics Capacidad Analítica limitada a los datos disponibles Baja capacidad de impulsar la práctica de Data Discovery Escenario actual en la Banca Riesgo Canales Operacione s
  • 8. Carga incremental (en near-real- time) de todas las fuentes de información relevantes. Carga de fuentes no estructuradas como logs, correos e información de redes sociales. Escenario futuro (Big Data) Real-time Analytics API Campañas Real-time Data Insight Discovery Logs Logs Logs Big Data Enterprise Platform (Data Lake) EL ETL Web/Móvil Sucursales Callcente r ETL Enteprise Data Warehouse Modelos Predictivos Campañas Push Modelos Riesgo Reportes Data Scientists Capacidad analítica potenciada por nuevas fuentes de información Soporta la implementación de servicios real-time y la práctica de Discovery de datos Machine Learning based models Inteligenci a de Clientes Riesgo Canales Operacione s
  • 9. ¿Cuáles serían los casos de uso más comunes de Big Data en la Banca y la arquitectura sugerida?
  • 10. Enterprise Data Warehouse offloading Enterprise Data Warehouse OLTP ETL 1 2 Movemos información de menor valor y/o histórica desde el EDW a Hadoop ocupando Sqoop También podemos replicar la información en Hadoop para derivar carga de explotación Equipos Explotació n 3 4 Los equipos explotan la información con las mismas herramientas que ocupan actualmente.
  • 11. Enterprise Data Lake Enterprise Data Warehouse (EDW) ETL 1 Equipos Explotació n 3 4 OLTP OLTP Las bases de datos OLTP más importantes se cargan as-is en Hadoop en modalidad Batch ETL 2 El EDW puede ser cargado desde el Data Lake en Hadoop a través de procesos ETL
  • 12. Enterprise Data Lake + Nuevas Fuentes Enterprise Data Warehouse (EDW) ETL 1 Equipos Explotación 4 5 OLTP El Data Lake incorpora fuentes de datos No Estructuradas en modalidad Batch ETL 3 Logs OLTP Logs 2 Data Scientists Data Insight Discovery (Aster Data) Advanced Analytics (Mahout, R) Cognitive Analytics (IBM Watson)
  • 13. Near-Real-Time Data Ingestion Enterprise Data Warehouse (EDW) Equipos Explotació n 4 5 OLTP Los agentes de Flume hacen streaming de la información generada ETL 3 Logs OLTP Logs Flume Agent Flume Agent Flume Agent Los Interceptors de Flume permiten enriquecer la ingesta de datos para finalmente guardarla en HDFS (Hadoop) 1 2 Data Scientists Data Insight Discovery (Aster Data) Advanced Analytics (Mahout, R) Cognitive Analytics (IBM Watson)
  • 14. Real-Time Analytics con HBase OLTP Logs OLTP Logs Flume Agent Flume Agent Flume Agent En el proceso de ingesta de datos, se guarda información en HBase que posteriormente servirá como input para los servicios Real-Time (ej: el consumo acumulado diario por rubro de un cliente con tarjeta de crédito). 1 Real-Time Analytics Services API 2 3 El servicio real-time (expuesto como API) es consumido por ejemplo por la aplicación móvil cada vez que el cliente realiza un pago con tarjeta. Con la estructura clave-valor en HBase, el servicio puede advertir al cliente de un consumo excesivo en su tarjeta e inclusive compararlo con meses y años anteriores.
  • 15. Real-Time Analytics con HBase+Spark OLTP Logs OLTP Logs Flume Agent Flume Agent Flume Agent 1 Real-Time Analytics Services API 3 Spark permite crear un Resilient Distributed Dataset (RDD) a partir de datos en HDFS, HBase, etc. Su capacidad de representar los datos en memoria y de procesar los mismos de manera distribuida, permite crear servicios de real-time analytics avanzados que requieran procesar grandes volúmenes de datos. 2
  • 16. Ejemplo Digital Journey soportado por BigData Web Red Social El usuario se conecta a www.banco.cl La aplicación le indica que se registre con sus credenciales de Twitter / Facebook o Linkedin El usuario selecciona Linkedin y la aplicación solicita permisos para acceder a su perfil y su lista de contactos La aplicación le muestra sus datos, le solicita que ingrese su número de móvil, una clave segura y le envía por SMS un código de enrolamiento para su dispositivo. Móvil El usuario recibe el código de enrolamiento para confirmar su regsitro El usuario confirma su registro y ya es “Cliente Registrado”. La aplicación le da la Bienvenida y la indica que 36 de sus contactos en Linkedin ya son clientes del Banco y que 22 de ellos tienen Cta Cte y Tarjeta de Crédito, mientras que 18 tienen productos de inversión, invitándolo a contratar dichos productos Email El cliente recibe un correo de bienvenida, con la misma información de sus contactos que está viendo en la aplicación web y con la invitación a seguir explorando los productos del Banco
  • 17. Resumiendo • Los Bancos (y todos los negocios digitales) necesitan una Arquitectura de Datos Moderna que soporte el procesamiento de grandes volúmenes de información (Big Data). • El foco inicial debe estar puesto en la implementación de una Plataforma de Big Data Corporativa, tanto para fines analíticos como operativos. • Los casos de uso más implementados son: • Database offloading • Enterprise Data Lake • Near-Real-Time Data Ingestion • Real-Time Analytics
  • 18. Big Data en el Entorno Bancario Martín Cabrera Technology Director Everis, an NTT DATA Company @dmcabrera martin.cabrera.aguilar@everis.com