2. Contents
1.개요
1.1 프로젝트 배경
1.2 활용 기술
1.3 분석 Framework
2.프로젝트 상세
2.1 Sampling
2.2 Exploration
2.3 Modification
2.4 Modeling
2.5 Assessment
3.분석 결과
3.1 고객 군집 분석
3.2 금융상품 추천 분석
Appendix. 기타 분석 결과
4. 1.1 프로젝트 배경
Scouter들의
경험과 직관
신장 체력 자세 출신
기존의 선수 영입 방법
Sabermetrics에 기반한
통계적 수치
타점 타율 출루 삼진
Oakland Athletics의 선수 영입 방법
메이저리그 최다승 팀
아메리칸리그 최다 연승 기록
5. 1.1 프로젝트 배경
마케터들의
경험과 직관
접촉 재력 설문 배경
기존 금융회사의 상품 Sales 방법
빅데이터 분석에 기반한
고객 군집 분석 및 상품 추천
접촉
이력
상품
이력
거래
유형
고객
정보
이번 프로젝트를 통해 구현하는
상품 Offering 방법
고객별 최적화된 상품 추천 가입율 증대
고객 군집별 마케팅 전략 수립 이탈 고객 최소화
6. 1.2 활용 기술
H 금융사 DB
MapReduce
ETL Data
Storage
Layer
Data
Processing
Layer
WAS
Data
Analysis
Layer
Visualization
Layer
Node 수
• Data Node : 3대
• Name Node : 1대
• WAS & R : Local PC
Specification
• CPU : 3.5GHz
• Core : 4
• Memory : 8GB
• HDD : 500GB
7. 1.3 분석 Framework
SAS의 SEMMA 분석 절차 방법론에 따라 프로젝트 수행
SEMMA
Sampling
Exploration
Modification
Modeling
Assessment
단계 상세
Sampling
• 분석 데이터 생성
- 통계적 추출
- 조건 추출
• 모델 평가를 위한 데이터 준비
Exploration
• 분석 데이터 탐색
- 기초 통계, 그래픽적 탐색
- 변수 유의성 및 상관분석
• 데이터 오류 검색
• 데이터 현황을 통한 비즈니스 이해
• 이상현상/변화 탐색
Modification
• 분석 데이터 수정 및 변환
- 수량화
- 표준화
- 변환
- 그룹화
• 데이터 특성을 극대화 할 수 있는 방안 모색
• 최적의 모델링을 위한 다양한 형태의 파생변수 생성/선
택
Modeling
• 모델 구축
• 데이터 패턴 발견
• 비즈니스 문제 해결을 위한 모델 및 알고리즘 적용
Assessment
• 모델 평가 및 검증
• 모델간 비교
• 추가 분석 수행 여부 결정
8. Contents
1.개요
1.1 프로젝트 배경
1.2 활용 기술
1.3 분석 Framework
2.프로젝트 상세
2.1 Sampling
2.2 Exploration
2.3 Modification
2.4 Modeling
2.5 Assessment
3.분석 결과
3.1 고객 군집 분석
3.2 금융상품 추천 분석
Appendix. 기타 분석 결과
9. 2.1 Sampling
H 증권회사의 Data로부터 추출한 2011년~2013년까지 정보를 활용
고객 Master Data
개
요
• 고객 프로파일 정보 및
고객가치, 거래특성정보
변
수
• 고객 구분 : 개인, 법인 등
• 고객 기본 정보 : 연령, 성별
• 고객 가입일
• 고객 가치
- 증권사 등급
- 그룹 등급
- 주요 고객 여부
• 거래 특성 정보
- 투자 성향
- 최종 거래일
- 최종 접촉일
- 최고 자산 평가일
• 고객 이탈정보
수
량
• 약 400만건
유효 고객 약 60만건
비
고
• 개인정보와 관련된 내용
삭제
고객 Portfolio 정보
개
요
• 2011년 1월 ~ 2013년 13월
• 고객별 보유한 금융상품
포트폴리오 정보
변
수
• 상품별 월 평균 잔고 (23종)
- 주식형
- 혼합주식형
- 혼합채권형
- 채권형
- R P
- MMF
- 예수금
- AI
- 채권
- CP
- CD
- CMA-R P
수
량
• 월별 약 400만건 X 36개월
전체기간 약 1억4천 row
약 32억 개 Data Field
비
고
• 월 기간 중 상품별 평균잔액
및 기여 수익 정보 포함
- 신탁
- 위탁
- 저축
- 선물옵션
- 해외선물
- CMA-MMF
- ELS
- CMA-MMW
- 예금
- 콜론
- 해외주식
기타 정보
개
요
• Marketing Campaign관련
데이터
• 외부 데이터
변
수
• 고객별 채널 접촉 정보
- 2011~2013년, 월별
고객의 채널(ARS, HTS,
MTS, 인터넷 뱅킹,
내점 등) 접촉
이력정보
• Campaign 수행 이력 정보
- 2011~2013년까지
고객을 대상으로
실행한 Marketing
Campaign 실행 정보
• 종합 주가 지수 정보
- 2011~2013년
수
량
• 채널 접촉 정보 : 약 400만건
• Campaign 수행 이력 정보 :
12건
비
고
• 종합 주가 지수의 경우,
월말을 기준으로 산정
11. 2.3 Modification
분석할 데이터를 선택하고, 분석에 용이하도록 파생변수를 생성함
총 거래일 =
최종거래일 가입일-
마케팅 휴면일 =
최종거래일 최종 접촉일-
• 만약 –값인 경우 마케팅을 안 하거나 한지 오래된 것으로
간주
• 0의 경우, 마케팅을 한적이 없는 것으로 간주
• +값이면 최근 마케팅에 효과가 있는 것으로 간주
이탈 소요 기간 =
최종거래일 이탈일-
• 최종거래부터 이탈 시점까지 소요되는 기간
최고자산 소요기간 =
최고자산평가일 가입일-
• 가입 후, 고객이 최고자산을 가지는데 까지 소요되는 기간
Portfolio 비율 =
상품 군 평균 잔고 전체 평균 잔고-
• 해당 상품에 고객이 예치하는 비율
최고자산 이탈 소요일 =
최고자산평가일 이탈일-
• 최고자산을 가진 이후, 이탈까지 걸리는 기간
• 0인경우, 정상고객 또는 거래 없음
12. 2.4 Modeling
기초 분석된 결과와 데이터들을 토대로 다양한 분석 모델을 적용함
Clustering : K-Mean Algorithm Recommendation : Collaborative Filtering
K Determination
대상
• 약 4백만 고객 중, 최종 거래일이 2012.1월
이후인 개인 고객
변수
• 고객의 거래특성, 인구통계정보와 2013
1월~12월까지의 월별 보유상품 포트폴리오의
평잔/분산/표준편차 정보를 변수로 투입
모델 생성 • Cluster별 고객 추천
변수
• 고객 Portfolio 정보
- 고객이 1번이라도 가입한 이력이
있는 상품에 대하여 잔고 비율을
산출하여 산출
전체 고객 데이터
Recommendation (Collaborative Filtering)
Clustering (K-Mean)
군집 1 군집 2 군집 3 군집 4 …
고객 선택
or 신규 고객
상품 추천
13. 2.5 Assessment
도출된 Cluster간의 유의미하다고 판단되는 변수에 대하여 해당 Cluster와 대립되는 Cluster간의
귀무가설을 토대로 T-검정 시행
Cluster 1 Cluster 2 Cluster 3 Cluster 4 …vs.
유의미하다 판단되는 변수 유의미하다 판단되는 동일 변수
Two Sample T-Test
P-Value < 0.05
귀무가설
채택
귀무가설
기각
Yes No
14. Contents
1.개요
1.1 프로젝트 배경
1.2 활용 기술
1.3 분석 Framework
2.프로젝트 상세
2.1 Sampling
2.2 Exploration
2.3 Modification
2.4 Modeling
2.5 Assessment
3.분석 결과
3.1 고객 군집 분석
3.2 금융상품 추천 분석
Appendix. 기타 분석 결과
15. 3.1 고객 군집 분석 (1/6) – 공통 사항
고객수 비중 연령 성별 투자성향 대투등급 그룹등급 주요고객 고객상태 거래기간 최종거래경과 평잔비중 수익비중
1 52423 7.91 57.43 2.59 10.65 11.10 14.30 23.05 13.02 17.41 0.72 0.14 0.02
2 97 0.01 59.54 2.26 32.68 35.26 38.76 13.40 27.84 11.41 0.09 49.12 86.25
3 1578 0.24 55.59 2.25 26.44 34.25 35.40 14.77 29.71 11.25 0.10 43.65 11.45
4 171154 25.83 42.46 2.44 16.40 13.47 18.96 22.75 30.34 5.85 0.08 0.73 0.16
5 146175 22.06 55.66 2.55 11.28 11.31 14.97 23.76 16.57 19.93 0.67 0.29 0.05
6 259919 39.22 41.31 2.46 11.03 10.12 13.75 28.24 10.97 4.43 0.77 0.05 0.01
7 31299 4.72 55.26 2.47 27.39 30.63 33.25 12.79 31.85 14.56 0.07 6.03 2.06
군집
고 객 속 성
1 2
1
평균연령 분포가
전반적으로 중년 이상
유효 고객의 노화
심각
젊은 고객층을
유치할 수 있는
대비책 마련이
시급함
2
2: 남성 고객
3: 여성 고객
높은 남성 고객 비중
여성 고객층이
선호하는
상품을 토대로
공격적인
마케팅 전략
마련
Cluster 1
7.91%
Cluster 2
0.01%
Cluster 3
0.24%
Cluster 4
25.83%
Cluster 5
22.06%
Cluster 6
39.22%
Cluster 7
4.72%
기타
0.25%
Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7
고객 분포
16. 3.1 고객 군집 분석 (2/6) – 분류 1
Cluster별 직접 접촉 경과일 평균 Cluster별 최종 거래 경과일 평균
0 2 4 6 8 10
Cluster 1
Cluster 2
Cluster 3
Cluster 4
Cluster 5
Cluster 6
Cluster 7
0 0.2 0.4 0.6 0.8
Cluster 1
Cluster 2
Cluster 3
Cluster 4
Cluster 5
Cluster 6
Cluster 7
단위 : Month
18. 3.1 고객 군집 분석 (4/6) – 핵심 고객군
0.00
10.00
20.00
30.00
40.00
50.00
60.00
70.00
80.00
90.00
100.00
평잔합계비중
주식형
혼합주식형
혼합채권형
채권형
RP
MMF
예수금
AI
채권
CP
CMA_RP
신탁
증권위탁
증권저축
선물옵션
해외선물
CMA_MMF
ELS
CMA_MMW
예금
콜론
해외주식
Cluster 2
Cluster 3
Cluster 7
• 2번 군집의 경우, 상품 유형에 대하여 전반적으로 고르게 분산 투자를 하고 있으며 비중이 매우 높음
전문투자자문 서비스를 받고 있거나 특별 관리를 받는 고객일 가능성이 높음
• 3번 군집의 경우, 증권 위탁에 대한 투자비율이 상대적으로 매우 높고, 안전 자산에 대한 선호도가 높음
분산 투자를 유도
• 계속해서 핵심 고객의 지위를 유지할 수 있도록 VIP 관리 서비스를 발굴 및 제공해야 함
단위 : %
Cluster 2,3
19. 3.1 고객 군집 분석 (5/6) – 관리 사각지대
0
200
400
600
800
1,000
1,200
1,400
1,600
주식형
혼합주식형
혼합채권형
채권형
RP
MMF
예수금
AI
채권
CP
CMA_RP
신탁
증권위탁
증권저축
선물옵션
해외선물
CMA_MMF
ELS
CMA_MMW
예금
콜론
해외주식
• 평균 잔고 비중이 0.14%, 수익 비중 0.02%로 미비
• 평균 거래기간이 17년 이상 된 고객이면서, 최종 거래가 7개월 정도로 아직 유효한 고객군
• 주식형 및 증권위탁에 대한 비중이 높아, 다소 공격적인 투자 성향을 가진 것으로 판단
주식수익률대회 등의 이벤트 마케팅으로 당사 HTS나 MTS등의 채널로 유도할 수 있는 마케팅 시급
Cluster 1
단위 : 천원
20. 3.1 고객 군집 분석 (6/6) – 장려 고객군
0
10,000
20,000
30,000
40,000
50,000
60,000
70,000
80,000
90,000
단위 : 천원
• 고객 수 비중 약 5%대로, 각종 고객 등급은 중간 이상의 일반 고객이나, 대부분이 관리대상으로
등록되어있는 우수 고객군
• 평균 거래 기간이 15년으로 길고, 최종 거래 경과일수가 1달 이내로 대체로 거래가 활발한 고객 군
• 전체 잔고 비중 6% 정도로, 핵심 고객군 이외에 가장 견실한 고객 군
• 안정 또는 위험 중립형의 고객
종합자산관리 마케팅 등을 통해 포트폴리오 다양화를 유도할 수 있는 마케팅 전략 필요
Cluster 7
24. Appendix. 기타 분석
종합 주가지수와 수익금 추이
0
500
1000
1500
2000
2500
0
5,000
10,000
15,000
20,000
25,000
30,000
수익금 종합 주가지수단위 : 백만원
25. Appendix. 기타 분석
Marketing Campaign 효과 측정
0
10,000
20,000
30,000
40,000
50,000
60,000
70,000
80,000
90,000
100,000
12,000
12,500
13,000
13,500
14,000
14,500
고객 위탁금 총액 접촉 횟수 Campaign 시행
단위 : 10억원
26. Appendix. 기타 분석
고객 Portfolio 변화
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
exsec
call
yekm
cma_mmw
els
cma_mmf
exfutr
futrops
save
yuitak
sintak
cma-rp
cd
cp
bond
ai
yesu
mmf
예수금
선물옵션
예탁금