SlideShare uma empresa Scribd logo
1 de 26
Baixar para ler offline
빅데이터 기술전문가 5기 1조
ThinkBig - Smart Financial Marketing Analysis
(증권사 Big Data를 활용한 고객 분석)
조원 : • 김영민
• 안병현
• 양승영
• 김석수
• 양윤기
조장 : • 박종욱
Contents
1.개요
1.1 프로젝트 배경
1.2 활용 기술
1.3 분석 Framework
2.프로젝트 상세
2.1 Sampling
2.2 Exploration
2.3 Modification
2.4 Modeling
2.5 Assessment
3.분석 결과
3.1 고객 군집 분석
3.2 금융상품 추천 분석
Appendix. 기타 분석 결과
1.1 프로젝트 배경
1.1 프로젝트 배경
Scouter들의
경험과 직관
신장 체력 자세 출신
기존의 선수 영입 방법
Sabermetrics에 기반한
통계적 수치
타점 타율 출루 삼진
Oakland Athletics의 선수 영입 방법
메이저리그 최다승 팀
아메리칸리그 최다 연승 기록
1.1 프로젝트 배경
마케터들의
경험과 직관
접촉 재력 설문 배경
기존 금융회사의 상품 Sales 방법
빅데이터 분석에 기반한
고객 군집 분석 및 상품 추천
접촉
이력
상품
이력
거래
유형
고객
정보
이번 프로젝트를 통해 구현하는
상품 Offering 방법
고객별 최적화된 상품 추천  가입율 증대
고객 군집별 마케팅 전략 수립  이탈 고객 최소화
1.2 활용 기술
H 금융사 DB
MapReduce
ETL Data
Storage
Layer
Data
Processing
Layer
WAS
Data
Analysis
Layer
Visualization
Layer
Node 수
• Data Node : 3대
• Name Node : 1대
• WAS & R : Local PC
Specification
• CPU : 3.5GHz
• Core : 4
• Memory : 8GB
• HDD : 500GB
1.3 분석 Framework
SAS의 SEMMA 분석 절차 방법론에 따라 프로젝트 수행
SEMMA
Sampling
Exploration
Modification
Modeling
Assessment
단계 상세
Sampling
• 분석 데이터 생성
- 통계적 추출
- 조건 추출
• 모델 평가를 위한 데이터 준비
Exploration
• 분석 데이터 탐색
- 기초 통계, 그래픽적 탐색
- 변수 유의성 및 상관분석
• 데이터 오류 검색
• 데이터 현황을 통한 비즈니스 이해
• 이상현상/변화 탐색
Modification
• 분석 데이터 수정 및 변환
- 수량화
- 표준화
- 변환
- 그룹화
• 데이터 특성을 극대화 할 수 있는 방안 모색
• 최적의 모델링을 위한 다양한 형태의 파생변수 생성/선
택
Modeling
• 모델 구축
• 데이터 패턴 발견
• 비즈니스 문제 해결을 위한 모델 및 알고리즘 적용
Assessment
• 모델 평가 및 검증
• 모델간 비교
• 추가 분석 수행 여부 결정
Contents
1.개요
1.1 프로젝트 배경
1.2 활용 기술
1.3 분석 Framework
2.프로젝트 상세
2.1 Sampling
2.2 Exploration
2.3 Modification
2.4 Modeling
2.5 Assessment
3.분석 결과
3.1 고객 군집 분석
3.2 금융상품 추천 분석
Appendix. 기타 분석 결과
2.1 Sampling
H 증권회사의 Data로부터 추출한 2011년~2013년까지 정보를 활용
고객 Master Data
개
요
• 고객 프로파일 정보 및
고객가치, 거래특성정보
변
수
• 고객 구분 : 개인, 법인 등
• 고객 기본 정보 : 연령, 성별
• 고객 가입일
• 고객 가치
- 증권사 등급
- 그룹 등급
- 주요 고객 여부
• 거래 특성 정보
- 투자 성향
- 최종 거래일
- 최종 접촉일
- 최고 자산 평가일
• 고객 이탈정보
수
량
• 약 400만건
 유효 고객 약 60만건
비
고
• 개인정보와 관련된 내용
삭제
고객 Portfolio 정보
개
요
• 2011년 1월 ~ 2013년 13월
• 고객별 보유한 금융상품
포트폴리오 정보
변
수
• 상품별 월 평균 잔고 (23종)
- 주식형
- 혼합주식형
- 혼합채권형
- 채권형
- R P
- MMF
- 예수금
- AI
- 채권
- CP
- CD
- CMA-R P
수
량
• 월별 약 400만건 X 36개월
 전체기간 약 1억4천 row
 약 32억 개 Data Field
비
고
• 월 기간 중 상품별 평균잔액
및 기여 수익 정보 포함
- 신탁
- 위탁
- 저축
- 선물옵션
- 해외선물
- CMA-MMF
- ELS
- CMA-MMW
- 예금
- 콜론
- 해외주식
기타 정보
개
요
• Marketing Campaign관련
데이터
• 외부 데이터
변
수
• 고객별 채널 접촉 정보
- 2011~2013년, 월별
고객의 채널(ARS, HTS,
MTS, 인터넷 뱅킹,
내점 등) 접촉
이력정보
• Campaign 수행 이력 정보
- 2011~2013년까지
고객을 대상으로
실행한 Marketing
Campaign 실행 정보
• 종합 주가 지수 정보
- 2011~2013년
수
량
• 채널 접촉 정보 : 약 400만건
• Campaign 수행 이력 정보 :
12건
비
고
• 종합 주가 지수의 경우,
월말을 기준으로 산정
2.2 Exploration
ANOVA 분석 및 기본적인 데이터 시각화를 통해 데이터의 속성 파악
2.3 Modification
분석할 데이터를 선택하고, 분석에 용이하도록 파생변수를 생성함
총 거래일 =
최종거래일 가입일-
마케팅 휴면일 =
최종거래일 최종 접촉일-
• 만약 –값인 경우 마케팅을 안 하거나 한지 오래된 것으로
간주
• 0의 경우, 마케팅을 한적이 없는 것으로 간주
• +값이면 최근 마케팅에 효과가 있는 것으로 간주
이탈 소요 기간 =
최종거래일 이탈일-
• 최종거래부터 이탈 시점까지 소요되는 기간
최고자산 소요기간 =
최고자산평가일 가입일-
• 가입 후, 고객이 최고자산을 가지는데 까지 소요되는 기간
Portfolio 비율 =
상품 군 평균 잔고 전체 평균 잔고-
• 해당 상품에 고객이 예치하는 비율
최고자산 이탈 소요일 =
최고자산평가일 이탈일-
• 최고자산을 가진 이후, 이탈까지 걸리는 기간
• 0인경우, 정상고객 또는 거래 없음
2.4 Modeling
기초 분석된 결과와 데이터들을 토대로 다양한 분석 모델을 적용함
Clustering : K-Mean Algorithm Recommendation : Collaborative Filtering
K Determination
대상
• 약 4백만 고객 중, 최종 거래일이 2012.1월
이후인 개인 고객
변수
• 고객의 거래특성, 인구통계정보와 2013
1월~12월까지의 월별 보유상품 포트폴리오의
평잔/분산/표준편차 정보를 변수로 투입
모델 생성 • Cluster별 고객 추천
변수
• 고객 Portfolio 정보
- 고객이 1번이라도 가입한 이력이
있는 상품에 대하여 잔고 비율을
산출하여 산출
전체 고객 데이터
Recommendation (Collaborative Filtering)
Clustering (K-Mean)
군집 1 군집 2 군집 3 군집 4 …
고객 선택
or 신규 고객
상품 추천
2.5 Assessment
도출된 Cluster간의 유의미하다고 판단되는 변수에 대하여 해당 Cluster와 대립되는 Cluster간의
귀무가설을 토대로 T-검정 시행
Cluster 1 Cluster 2 Cluster 3 Cluster 4 …vs.
유의미하다 판단되는 변수 유의미하다 판단되는 동일 변수
Two Sample T-Test
P-Value < 0.05
귀무가설
채택
귀무가설
기각
Yes No
Contents
1.개요
1.1 프로젝트 배경
1.2 활용 기술
1.3 분석 Framework
2.프로젝트 상세
2.1 Sampling
2.2 Exploration
2.3 Modification
2.4 Modeling
2.5 Assessment
3.분석 결과
3.1 고객 군집 분석
3.2 금융상품 추천 분석
Appendix. 기타 분석 결과
3.1 고객 군집 분석 (1/6) – 공통 사항
고객수 비중 연령 성별 투자성향 대투등급 그룹등급 주요고객 고객상태 거래기간 최종거래경과 평잔비중 수익비중
1 52423 7.91 57.43 2.59 10.65 11.10 14.30 23.05 13.02 17.41 0.72 0.14 0.02
2 97 0.01 59.54 2.26 32.68 35.26 38.76 13.40 27.84 11.41 0.09 49.12 86.25
3 1578 0.24 55.59 2.25 26.44 34.25 35.40 14.77 29.71 11.25 0.10 43.65 11.45
4 171154 25.83 42.46 2.44 16.40 13.47 18.96 22.75 30.34 5.85 0.08 0.73 0.16
5 146175 22.06 55.66 2.55 11.28 11.31 14.97 23.76 16.57 19.93 0.67 0.29 0.05
6 259919 39.22 41.31 2.46 11.03 10.12 13.75 28.24 10.97 4.43 0.77 0.05 0.01
7 31299 4.72 55.26 2.47 27.39 30.63 33.25 12.79 31.85 14.56 0.07 6.03 2.06
군집
고 객 속 성
1 2
1
평균연령 분포가
전반적으로 중년 이상
유효 고객의 노화
심각
젊은 고객층을
유치할 수 있는
대비책 마련이
시급함
2
2: 남성 고객
3: 여성 고객
높은 남성 고객 비중
여성 고객층이
선호하는
상품을 토대로
공격적인
마케팅 전략
마련
Cluster 1
7.91%
Cluster 2
0.01%
Cluster 3
0.24%
Cluster 4
25.83%
Cluster 5
22.06%
Cluster 6
39.22%
Cluster 7
4.72%
기타
0.25%
Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7
고객 분포
3.1 고객 군집 분석 (2/6) – 분류 1
Cluster별 직접 접촉 경과일 평균 Cluster별 최종 거래 경과일 평균
0 2 4 6 8 10
Cluster 1
Cluster 2
Cluster 3
Cluster 4
Cluster 5
Cluster 6
Cluster 7
0 0.2 0.4 0.6 0.8
Cluster 1
Cluster 2
Cluster 3
Cluster 4
Cluster 5
Cluster 6
Cluster 7
단위 : Month
3.1 고객 군집 분석 (3/6) – 분류 2
고객군별 잔고 비중을 살펴볼 때, 2,3번 군집이 전체의 93%를 차지하고, 수익 비중 또한
전체의 97%를 차지하므로 2,3번 군집을 ‘핵심 고객 군’ 으로 분류
Cluster 1
0.14%
Cluster 2
49.12%
Cluster 3
43.65%
Cluster 4
0.73%
Cluster 5
0.29%
Cluster 6
0.05%
Cluster 7
[백분율]
기타
1.21%
Cluster 1 Cluster 2 Cluster 3 Cluster 4
Cluster 5 Cluster 6 cluster 7
Cluster 1
0.02%
Cluster 2
86.25%
Cluster 3
11.45%
Cluster 4
0.16%
Cluster 5
0.05%
Cluster 6
0.01%
Cluster 7
2.06% 기타
0.24%
Cluster 1 Cluster 2 Cluster 3 Cluster 4
Cluster 5 Cluster 6 Cluster 7
Cluster별 고객 잔고 비중 Cluster별 고객 수익 비중
3.1 고객 군집 분석 (4/6) – 핵심 고객군
0.00
10.00
20.00
30.00
40.00
50.00
60.00
70.00
80.00
90.00
100.00
평잔합계비중
주식형
혼합주식형
혼합채권형
채권형
RP
MMF
예수금
AI
채권
CP
CMA_RP
신탁
증권위탁
증권저축
선물옵션
해외선물
CMA_MMF
ELS
CMA_MMW
예금
콜론
해외주식
Cluster 2
Cluster 3
Cluster 7
• 2번 군집의 경우, 상품 유형에 대하여 전반적으로 고르게 분산 투자를 하고 있으며 비중이 매우 높음
 전문투자자문 서비스를 받고 있거나 특별 관리를 받는 고객일 가능성이 높음
• 3번 군집의 경우, 증권 위탁에 대한 투자비율이 상대적으로 매우 높고, 안전 자산에 대한 선호도가 높음
 분산 투자를 유도
• 계속해서 핵심 고객의 지위를 유지할 수 있도록 VIP 관리 서비스를 발굴 및 제공해야 함
단위 : %
Cluster 2,3
3.1 고객 군집 분석 (5/6) – 관리 사각지대
0
200
400
600
800
1,000
1,200
1,400
1,600
주식형
혼합주식형
혼합채권형
채권형
RP
MMF
예수금
AI
채권
CP
CMA_RP
신탁
증권위탁
증권저축
선물옵션
해외선물
CMA_MMF
ELS
CMA_MMW
예금
콜론
해외주식
• 평균 잔고 비중이 0.14%, 수익 비중 0.02%로 미비
• 평균 거래기간이 17년 이상 된 고객이면서, 최종 거래가 7개월 정도로 아직 유효한 고객군
• 주식형 및 증권위탁에 대한 비중이 높아, 다소 공격적인 투자 성향을 가진 것으로 판단
 주식수익률대회 등의 이벤트 마케팅으로 당사 HTS나 MTS등의 채널로 유도할 수 있는 마케팅 시급
Cluster 1
단위 : 천원
3.1 고객 군집 분석 (6/6) – 장려 고객군
0
10,000
20,000
30,000
40,000
50,000
60,000
70,000
80,000
90,000
단위 : 천원
• 고객 수 비중 약 5%대로, 각종 고객 등급은 중간 이상의 일반 고객이나, 대부분이 관리대상으로
등록되어있는 우수 고객군
• 평균 거래 기간이 15년으로 길고, 최종 거래 경과일수가 1달 이내로 대체로 거래가 활발한 고객 군
• 전체 잔고 비중 6% 정도로, 핵심 고객군 이외에 가장 견실한 고객 군
• 안정 또는 위험 중립형의 고객
 종합자산관리 마케팅 등을 통해 포트폴리오 다양화를 유도할 수 있는 마케팅 전략 필요
Cluster 7
3.2 금융 상품 추천 분석
추천 분석 시스템
Demo 시연
Appendix. 기타 분석
종합 주가지수와 수익금 추이
0
500
1000
1500
2000
2500
0
5,000
10,000
15,000
20,000
25,000
30,000
수익금 종합 주가지수단위 : 백만원
Appendix. 기타 분석
Marketing Campaign 효과 측정
0
10,000
20,000
30,000
40,000
50,000
60,000
70,000
80,000
90,000
100,000
12,000
12,500
13,000
13,500
14,000
14,500
고객 위탁금 총액 접촉 횟수 Campaign 시행
단위 : 10억원
Appendix. 기타 분석
고객 Portfolio 변화
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
exsec
call
yekm
cma_mmw
els
cma_mmf
exfutr
futrops
save
yuitak
sintak
cma-rp
cd
cp
bond
ai
yesu
mmf
예수금
선물옵션
예탁금

Mais conteúdo relacionado

Semelhante a 기술5기 1조

(금융회사들을 위한) 핀테크 시대의 자산관리 서비스 전략
(금융회사들을 위한) 핀테크 시대의 자산관리 서비스 전략(금융회사들을 위한) 핀테크 시대의 자산관리 서비스 전략
(금융회사들을 위한) 핀테크 시대의 자산관리 서비스 전략Bradley Byoungyong Moon (문병용)
 
Introducing doomoolmori 150806_ppt
Introducing doomoolmori 150806_pptIntroducing doomoolmori 150806_ppt
Introducing doomoolmori 150806_pptJulius Chun
 
한양대 사업계획서 슬라이드_최종
한양대 사업계획서 슬라이드_최종한양대 사업계획서 슬라이드_최종
한양대 사업계획서 슬라이드_최종동익 박
 
구매 기록 데이터 기반 솔루션 제공
구매 기록 데이터 기반 솔루션 제공구매 기록 데이터 기반 솔루션 제공
구매 기록 데이터 기반 솔루션 제공정재 전
 
스타트업의 전략적 사고
스타트업의 전략적 사고스타트업의 전략적 사고
스타트업의 전략적 사고Hyunjong Wi
 
컨설팅 Toolkit Part I
컨설팅 Toolkit Part I컨설팅 Toolkit Part I
컨설팅 Toolkit Part IChanghyun Lim
 
Emforce datalab insight report_google analytics interests
Emforce datalab insight report_google analytics interestsEmforce datalab insight report_google analytics interests
Emforce datalab insight report_google analytics interestseMFORCE
 
Idea to-business-process-8
Idea to-business-process-8Idea to-business-process-8
Idea to-business-process-8Dojun Rhee
 
Sales cloud oracle for Korean Small and Mid company
Sales cloud oracle for Korean Small and Mid companySales cloud oracle for Korean Small and Mid company
Sales cloud oracle for Korean Small and Mid companyJaekyung Byun
 
Ice 발표자료(2013 11 15_수정)
Ice 발표자료(2013 11 15_수정)Ice 발표자료(2013 11 15_수정)
Ice 발표자료(2013 11 15_수정)Hee Seong Kim
 
PYCON 2017 발표자료 한성준
PYCON 2017 발표자료 한성준PYCON 2017 발표자료 한성준
PYCON 2017 발표자료 한성준sungjun han
 
책 "제품의 탄생" 소개
책 "제품의 탄생" 소개책 "제품의 탄생" 소개
책 "제품의 탄생" 소개SANGHEE SHIN
 
대신리포트_모닝미팅_151216
대신리포트_모닝미팅_151216대신리포트_모닝미팅_151216
대신리포트_모닝미팅_151216DaishinSecurities
 
금융회사의 경영패러다임 변화와 과제
금융회사의 경영패러다임 변화와 과제금융회사의 경영패러다임 변화와 과제
금융회사의 경영패러다임 변화와 과제Smith Kim
 
Dr. dojun rhee idea to business process chapter 8 part 4
Dr. dojun rhee  idea to business process chapter 8 part 4Dr. dojun rhee  idea to business process chapter 8 part 4
Dr. dojun rhee idea to business process chapter 8 part 4Dojun Rhee
 
[창업에듀]45.3 시장기회 고객 욕구와 시장 세분화
[창업에듀]45.3 시장기회 고객 욕구와 시장 세분화[창업에듀]45.3 시장기회 고객 욕구와 시장 세분화
[창업에듀]45.3 시장기회 고객 욕구와 시장 세분화쪼 꼬
 
52. 고객 욕구와 시장 세분화
52. 고객 욕구와 시장 세분화52. 고객 욕구와 시장 세분화
52. 고객 욕구와 시장 세분화창업 에듀
 
Idea to-business-process-4
Idea to-business-process-4Idea to-business-process-4
Idea to-business-process-4Dojun Rhee
 

Semelhante a 기술5기 1조 (20)

(금융회사들을 위한) 핀테크 시대의 자산관리 서비스 전략
(금융회사들을 위한) 핀테크 시대의 자산관리 서비스 전략(금융회사들을 위한) 핀테크 시대의 자산관리 서비스 전략
(금융회사들을 위한) 핀테크 시대의 자산관리 서비스 전략
 
Introducing doomoolmori 150806_ppt
Introducing doomoolmori 150806_pptIntroducing doomoolmori 150806_ppt
Introducing doomoolmori 150806_ppt
 
한양대 사업계획서 슬라이드_최종
한양대 사업계획서 슬라이드_최종한양대 사업계획서 슬라이드_최종
한양대 사업계획서 슬라이드_최종
 
구매 기록 데이터 기반 솔루션 제공
구매 기록 데이터 기반 솔루션 제공구매 기록 데이터 기반 솔루션 제공
구매 기록 데이터 기반 솔루션 제공
 
스타트업의 전략적 사고
스타트업의 전략적 사고스타트업의 전략적 사고
스타트업의 전략적 사고
 
컨설팅 Toolkit Part I
컨설팅 Toolkit Part I컨설팅 Toolkit Part I
컨설팅 Toolkit Part I
 
Emforce datalab insight report_google analytics interests
Emforce datalab insight report_google analytics interestsEmforce datalab insight report_google analytics interests
Emforce datalab insight report_google analytics interests
 
Idea to-business-process-8
Idea to-business-process-8Idea to-business-process-8
Idea to-business-process-8
 
Sales cloud oracle for Korean Small and Mid company
Sales cloud oracle for Korean Small and Mid companySales cloud oracle for Korean Small and Mid company
Sales cloud oracle for Korean Small and Mid company
 
Ice 발표자료(2013 11 15_수정)
Ice 발표자료(2013 11 15_수정)Ice 발표자료(2013 11 15_수정)
Ice 발표자료(2013 11 15_수정)
 
Beyond Big Data MEGA MART_V0.9
Beyond Big Data MEGA MART_V0.9Beyond Big Data MEGA MART_V0.9
Beyond Big Data MEGA MART_V0.9
 
PYCON 2017 발표자료 한성준
PYCON 2017 발표자료 한성준PYCON 2017 발표자료 한성준
PYCON 2017 발표자료 한성준
 
책 "제품의 탄생" 소개
책 "제품의 탄생" 소개책 "제품의 탄생" 소개
책 "제품의 탄생" 소개
 
대신리포트_모닝미팅_151216
대신리포트_모닝미팅_151216대신리포트_모닝미팅_151216
대신리포트_모닝미팅_151216
 
금융회사의 경영패러다임 변화와 과제
금융회사의 경영패러다임 변화와 과제금융회사의 경영패러다임 변화와 과제
금융회사의 경영패러다임 변화와 과제
 
Dr. dojun rhee idea to business process chapter 8 part 4
Dr. dojun rhee  idea to business process chapter 8 part 4Dr. dojun rhee  idea to business process chapter 8 part 4
Dr. dojun rhee idea to business process chapter 8 part 4
 
Project rac v.3
Project rac v.3Project rac v.3
Project rac v.3
 
[창업에듀]45.3 시장기회 고객 욕구와 시장 세분화
[창업에듀]45.3 시장기회 고객 욕구와 시장 세분화[창업에듀]45.3 시장기회 고객 욕구와 시장 세분화
[창업에듀]45.3 시장기회 고객 욕구와 시장 세분화
 
52. 고객 욕구와 시장 세분화
52. 고객 욕구와 시장 세분화52. 고객 욕구와 시장 세분화
52. 고객 욕구와 시장 세분화
 
Idea to-business-process-4
Idea to-business-process-4Idea to-business-process-4
Idea to-business-process-4
 

Mais de Kangwook Lee (20)

빅데이터
빅데이터빅데이터
빅데이터
 
분석8기 4조
분석8기 4조분석8기 4조
분석8기 4조
 
기술8기 2조
기술8기 2조기술8기 2조
기술8기 2조
 
기술7기 2조
기술7기 2조기술7기 2조
기술7기 2조
 
기술6기 3조
기술6기 3조기술6기 3조
기술6기 3조
 
Apply교육
Apply교육Apply교육
Apply교육
 
빅데이터 분석활용 가이드 (1)
빅데이터 분석활용 가이드 (1)빅데이터 분석활용 가이드 (1)
빅데이터 분석활용 가이드 (1)
 
Editing textvariables
Editing textvariablesEditing textvariables
Editing textvariables
 
Summarizing data
Summarizing dataSummarizing data
Summarizing data
 
Subsetting andsorting
Subsetting andsortingSubsetting andsorting
Subsetting andsorting
 
Readingfromothersources
ReadingfromothersourcesReadingfromothersources
Readingfromothersources
 
Readingfromapis
ReadingfromapisReadingfromapis
Readingfromapis
 
Reading files4
Reading files4Reading files4
Reading files4
 
Reading files3
Reading files3Reading files3
Reading files3
 
Reading files2
Reading files2Reading files2
Reading files2
 
Reading files1
Reading files1Reading files1
Reading files1
 
Down loadingfiles
Down loadingfilesDown loadingfiles
Down loadingfiles
 
9
99
9
 
8
88
8
 
7
77
7
 

기술5기 1조

  • 1. 빅데이터 기술전문가 5기 1조 ThinkBig - Smart Financial Marketing Analysis (증권사 Big Data를 활용한 고객 분석) 조원 : • 김영민 • 안병현 • 양승영 • 김석수 • 양윤기 조장 : • 박종욱
  • 2. Contents 1.개요 1.1 프로젝트 배경 1.2 활용 기술 1.3 분석 Framework 2.프로젝트 상세 2.1 Sampling 2.2 Exploration 2.3 Modification 2.4 Modeling 2.5 Assessment 3.분석 결과 3.1 고객 군집 분석 3.2 금융상품 추천 분석 Appendix. 기타 분석 결과
  • 4. 1.1 프로젝트 배경 Scouter들의 경험과 직관 신장 체력 자세 출신 기존의 선수 영입 방법 Sabermetrics에 기반한 통계적 수치 타점 타율 출루 삼진 Oakland Athletics의 선수 영입 방법 메이저리그 최다승 팀 아메리칸리그 최다 연승 기록
  • 5. 1.1 프로젝트 배경 마케터들의 경험과 직관 접촉 재력 설문 배경 기존 금융회사의 상품 Sales 방법 빅데이터 분석에 기반한 고객 군집 분석 및 상품 추천 접촉 이력 상품 이력 거래 유형 고객 정보 이번 프로젝트를 통해 구현하는 상품 Offering 방법 고객별 최적화된 상품 추천  가입율 증대 고객 군집별 마케팅 전략 수립  이탈 고객 최소화
  • 6. 1.2 활용 기술 H 금융사 DB MapReduce ETL Data Storage Layer Data Processing Layer WAS Data Analysis Layer Visualization Layer Node 수 • Data Node : 3대 • Name Node : 1대 • WAS & R : Local PC Specification • CPU : 3.5GHz • Core : 4 • Memory : 8GB • HDD : 500GB
  • 7. 1.3 분석 Framework SAS의 SEMMA 분석 절차 방법론에 따라 프로젝트 수행 SEMMA Sampling Exploration Modification Modeling Assessment 단계 상세 Sampling • 분석 데이터 생성 - 통계적 추출 - 조건 추출 • 모델 평가를 위한 데이터 준비 Exploration • 분석 데이터 탐색 - 기초 통계, 그래픽적 탐색 - 변수 유의성 및 상관분석 • 데이터 오류 검색 • 데이터 현황을 통한 비즈니스 이해 • 이상현상/변화 탐색 Modification • 분석 데이터 수정 및 변환 - 수량화 - 표준화 - 변환 - 그룹화 • 데이터 특성을 극대화 할 수 있는 방안 모색 • 최적의 모델링을 위한 다양한 형태의 파생변수 생성/선 택 Modeling • 모델 구축 • 데이터 패턴 발견 • 비즈니스 문제 해결을 위한 모델 및 알고리즘 적용 Assessment • 모델 평가 및 검증 • 모델간 비교 • 추가 분석 수행 여부 결정
  • 8. Contents 1.개요 1.1 프로젝트 배경 1.2 활용 기술 1.3 분석 Framework 2.프로젝트 상세 2.1 Sampling 2.2 Exploration 2.3 Modification 2.4 Modeling 2.5 Assessment 3.분석 결과 3.1 고객 군집 분석 3.2 금융상품 추천 분석 Appendix. 기타 분석 결과
  • 9. 2.1 Sampling H 증권회사의 Data로부터 추출한 2011년~2013년까지 정보를 활용 고객 Master Data 개 요 • 고객 프로파일 정보 및 고객가치, 거래특성정보 변 수 • 고객 구분 : 개인, 법인 등 • 고객 기본 정보 : 연령, 성별 • 고객 가입일 • 고객 가치 - 증권사 등급 - 그룹 등급 - 주요 고객 여부 • 거래 특성 정보 - 투자 성향 - 최종 거래일 - 최종 접촉일 - 최고 자산 평가일 • 고객 이탈정보 수 량 • 약 400만건  유효 고객 약 60만건 비 고 • 개인정보와 관련된 내용 삭제 고객 Portfolio 정보 개 요 • 2011년 1월 ~ 2013년 13월 • 고객별 보유한 금융상품 포트폴리오 정보 변 수 • 상품별 월 평균 잔고 (23종) - 주식형 - 혼합주식형 - 혼합채권형 - 채권형 - R P - MMF - 예수금 - AI - 채권 - CP - CD - CMA-R P 수 량 • 월별 약 400만건 X 36개월  전체기간 약 1억4천 row  약 32억 개 Data Field 비 고 • 월 기간 중 상품별 평균잔액 및 기여 수익 정보 포함 - 신탁 - 위탁 - 저축 - 선물옵션 - 해외선물 - CMA-MMF - ELS - CMA-MMW - 예금 - 콜론 - 해외주식 기타 정보 개 요 • Marketing Campaign관련 데이터 • 외부 데이터 변 수 • 고객별 채널 접촉 정보 - 2011~2013년, 월별 고객의 채널(ARS, HTS, MTS, 인터넷 뱅킹, 내점 등) 접촉 이력정보 • Campaign 수행 이력 정보 - 2011~2013년까지 고객을 대상으로 실행한 Marketing Campaign 실행 정보 • 종합 주가 지수 정보 - 2011~2013년 수 량 • 채널 접촉 정보 : 약 400만건 • Campaign 수행 이력 정보 : 12건 비 고 • 종합 주가 지수의 경우, 월말을 기준으로 산정
  • 10. 2.2 Exploration ANOVA 분석 및 기본적인 데이터 시각화를 통해 데이터의 속성 파악
  • 11. 2.3 Modification 분석할 데이터를 선택하고, 분석에 용이하도록 파생변수를 생성함 총 거래일 = 최종거래일 가입일- 마케팅 휴면일 = 최종거래일 최종 접촉일- • 만약 –값인 경우 마케팅을 안 하거나 한지 오래된 것으로 간주 • 0의 경우, 마케팅을 한적이 없는 것으로 간주 • +값이면 최근 마케팅에 효과가 있는 것으로 간주 이탈 소요 기간 = 최종거래일 이탈일- • 최종거래부터 이탈 시점까지 소요되는 기간 최고자산 소요기간 = 최고자산평가일 가입일- • 가입 후, 고객이 최고자산을 가지는데 까지 소요되는 기간 Portfolio 비율 = 상품 군 평균 잔고 전체 평균 잔고- • 해당 상품에 고객이 예치하는 비율 최고자산 이탈 소요일 = 최고자산평가일 이탈일- • 최고자산을 가진 이후, 이탈까지 걸리는 기간 • 0인경우, 정상고객 또는 거래 없음
  • 12. 2.4 Modeling 기초 분석된 결과와 데이터들을 토대로 다양한 분석 모델을 적용함 Clustering : K-Mean Algorithm Recommendation : Collaborative Filtering K Determination 대상 • 약 4백만 고객 중, 최종 거래일이 2012.1월 이후인 개인 고객 변수 • 고객의 거래특성, 인구통계정보와 2013 1월~12월까지의 월별 보유상품 포트폴리오의 평잔/분산/표준편차 정보를 변수로 투입 모델 생성 • Cluster별 고객 추천 변수 • 고객 Portfolio 정보 - 고객이 1번이라도 가입한 이력이 있는 상품에 대하여 잔고 비율을 산출하여 산출 전체 고객 데이터 Recommendation (Collaborative Filtering) Clustering (K-Mean) 군집 1 군집 2 군집 3 군집 4 … 고객 선택 or 신규 고객 상품 추천
  • 13. 2.5 Assessment 도출된 Cluster간의 유의미하다고 판단되는 변수에 대하여 해당 Cluster와 대립되는 Cluster간의 귀무가설을 토대로 T-검정 시행 Cluster 1 Cluster 2 Cluster 3 Cluster 4 …vs. 유의미하다 판단되는 변수 유의미하다 판단되는 동일 변수 Two Sample T-Test P-Value < 0.05 귀무가설 채택 귀무가설 기각 Yes No
  • 14. Contents 1.개요 1.1 프로젝트 배경 1.2 활용 기술 1.3 분석 Framework 2.프로젝트 상세 2.1 Sampling 2.2 Exploration 2.3 Modification 2.4 Modeling 2.5 Assessment 3.분석 결과 3.1 고객 군집 분석 3.2 금융상품 추천 분석 Appendix. 기타 분석 결과
  • 15. 3.1 고객 군집 분석 (1/6) – 공통 사항 고객수 비중 연령 성별 투자성향 대투등급 그룹등급 주요고객 고객상태 거래기간 최종거래경과 평잔비중 수익비중 1 52423 7.91 57.43 2.59 10.65 11.10 14.30 23.05 13.02 17.41 0.72 0.14 0.02 2 97 0.01 59.54 2.26 32.68 35.26 38.76 13.40 27.84 11.41 0.09 49.12 86.25 3 1578 0.24 55.59 2.25 26.44 34.25 35.40 14.77 29.71 11.25 0.10 43.65 11.45 4 171154 25.83 42.46 2.44 16.40 13.47 18.96 22.75 30.34 5.85 0.08 0.73 0.16 5 146175 22.06 55.66 2.55 11.28 11.31 14.97 23.76 16.57 19.93 0.67 0.29 0.05 6 259919 39.22 41.31 2.46 11.03 10.12 13.75 28.24 10.97 4.43 0.77 0.05 0.01 7 31299 4.72 55.26 2.47 27.39 30.63 33.25 12.79 31.85 14.56 0.07 6.03 2.06 군집 고 객 속 성 1 2 1 평균연령 분포가 전반적으로 중년 이상 유효 고객의 노화 심각 젊은 고객층을 유치할 수 있는 대비책 마련이 시급함 2 2: 남성 고객 3: 여성 고객 높은 남성 고객 비중 여성 고객층이 선호하는 상품을 토대로 공격적인 마케팅 전략 마련 Cluster 1 7.91% Cluster 2 0.01% Cluster 3 0.24% Cluster 4 25.83% Cluster 5 22.06% Cluster 6 39.22% Cluster 7 4.72% 기타 0.25% Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7 고객 분포
  • 16. 3.1 고객 군집 분석 (2/6) – 분류 1 Cluster별 직접 접촉 경과일 평균 Cluster별 최종 거래 경과일 평균 0 2 4 6 8 10 Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7 0 0.2 0.4 0.6 0.8 Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7 단위 : Month
  • 17. 3.1 고객 군집 분석 (3/6) – 분류 2 고객군별 잔고 비중을 살펴볼 때, 2,3번 군집이 전체의 93%를 차지하고, 수익 비중 또한 전체의 97%를 차지하므로 2,3번 군집을 ‘핵심 고객 군’ 으로 분류 Cluster 1 0.14% Cluster 2 49.12% Cluster 3 43.65% Cluster 4 0.73% Cluster 5 0.29% Cluster 6 0.05% Cluster 7 [백분율] 기타 1.21% Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 cluster 7 Cluster 1 0.02% Cluster 2 86.25% Cluster 3 11.45% Cluster 4 0.16% Cluster 5 0.05% Cluster 6 0.01% Cluster 7 2.06% 기타 0.24% Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7 Cluster별 고객 잔고 비중 Cluster별 고객 수익 비중
  • 18. 3.1 고객 군집 분석 (4/6) – 핵심 고객군 0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00 80.00 90.00 100.00 평잔합계비중 주식형 혼합주식형 혼합채권형 채권형 RP MMF 예수금 AI 채권 CP CMA_RP 신탁 증권위탁 증권저축 선물옵션 해외선물 CMA_MMF ELS CMA_MMW 예금 콜론 해외주식 Cluster 2 Cluster 3 Cluster 7 • 2번 군집의 경우, 상품 유형에 대하여 전반적으로 고르게 분산 투자를 하고 있으며 비중이 매우 높음  전문투자자문 서비스를 받고 있거나 특별 관리를 받는 고객일 가능성이 높음 • 3번 군집의 경우, 증권 위탁에 대한 투자비율이 상대적으로 매우 높고, 안전 자산에 대한 선호도가 높음  분산 투자를 유도 • 계속해서 핵심 고객의 지위를 유지할 수 있도록 VIP 관리 서비스를 발굴 및 제공해야 함 단위 : % Cluster 2,3
  • 19. 3.1 고객 군집 분석 (5/6) – 관리 사각지대 0 200 400 600 800 1,000 1,200 1,400 1,600 주식형 혼합주식형 혼합채권형 채권형 RP MMF 예수금 AI 채권 CP CMA_RP 신탁 증권위탁 증권저축 선물옵션 해외선물 CMA_MMF ELS CMA_MMW 예금 콜론 해외주식 • 평균 잔고 비중이 0.14%, 수익 비중 0.02%로 미비 • 평균 거래기간이 17년 이상 된 고객이면서, 최종 거래가 7개월 정도로 아직 유효한 고객군 • 주식형 및 증권위탁에 대한 비중이 높아, 다소 공격적인 투자 성향을 가진 것으로 판단  주식수익률대회 등의 이벤트 마케팅으로 당사 HTS나 MTS등의 채널로 유도할 수 있는 마케팅 시급 Cluster 1 단위 : 천원
  • 20. 3.1 고객 군집 분석 (6/6) – 장려 고객군 0 10,000 20,000 30,000 40,000 50,000 60,000 70,000 80,000 90,000 단위 : 천원 • 고객 수 비중 약 5%대로, 각종 고객 등급은 중간 이상의 일반 고객이나, 대부분이 관리대상으로 등록되어있는 우수 고객군 • 평균 거래 기간이 15년으로 길고, 최종 거래 경과일수가 1달 이내로 대체로 거래가 활발한 고객 군 • 전체 잔고 비중 6% 정도로, 핵심 고객군 이외에 가장 견실한 고객 군 • 안정 또는 위험 중립형의 고객  종합자산관리 마케팅 등을 통해 포트폴리오 다양화를 유도할 수 있는 마케팅 전략 필요 Cluster 7
  • 21. 3.2 금융 상품 추천 분석 추천 분석 시스템 Demo 시연
  • 22.
  • 23.
  • 24. Appendix. 기타 분석 종합 주가지수와 수익금 추이 0 500 1000 1500 2000 2500 0 5,000 10,000 15,000 20,000 25,000 30,000 수익금 종합 주가지수단위 : 백만원
  • 25. Appendix. 기타 분석 Marketing Campaign 효과 측정 0 10,000 20,000 30,000 40,000 50,000 60,000 70,000 80,000 90,000 100,000 12,000 12,500 13,000 13,500 14,000 14,500 고객 위탁금 총액 접촉 횟수 Campaign 시행 단위 : 10억원
  • 26. Appendix. 기타 분석 고객 Portfolio 변화 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% exsec call yekm cma_mmw els cma_mmf exfutr futrops save yuitak sintak cma-rp cd cp bond ai yesu mmf 예수금 선물옵션 예탁금