2023. 2. 11. 22:46ㆍ관심있는 주제/Customer Segmentation
본 글에서는 마케팅에서 생존 분석이 왜 필요한 지에 대해서 다뤄보고자 한다.
기업의 입장에서는 고객의 특성을 파악하고 고객의 가치를 측정하여 적절한 마케팅전략을 수립하는 것은 고객가치를 상승시키고 지속적 경쟁우위를 유지하는데 있어서 매우 중요함.
고객가치란
고객 가치에 대한 개념은 시장의 경쟁 환경 및 고객의 구매성향 변화와 정보기술의 발전 등으로 치열한 시장의 경쟁구도 속에서 고객과의 지속적인 관계를 유지함으로써 기업의 이익을 극대화하고자 하는 목적에서 출발
고객관계관리(CRM)
고객가치에 대한 올바른 측정과 고객의 가치분석은 고객가치에 따라 차별화된 대표적 마케팅 전략과 기업의 경쟁력강화의 핵심수단으로 CRM(customer relationship management)의 중요한 요소가 되었음.
CRM을 잘할 때 기대할 수 있는 효과
- 충성 고객 확보를 통해 지속적인 매출
- Cross-Sell, Up-Sell을 통해 추가 구매
- 기존 고객 데이터를 통해 신규 고객의 니즈 예측
고객생애가치(CLV)
고객의 가치는 고객이 기업에게 가져다주는 이익과 고객이 기업의 상품을 사용하며 기업의 고객으로 유지되는 기간의 함수로 정의할 수 있다고 함.
이러한 관점에서 고객의 생애가치를 측정하는 모형을 고객생애가치(Cutomer Lifetime Value; CLV) 모형이라고 함.
고객생애가치로 활용할 수 있는 태스크
- 캠페인 관리(campaign management)
- 리스크 관리(risk management)
- 도용 방지 분석(fraud detection analysis)
- 이탈 분석(Churn analysis)
고객 생애 가치(CLV)는 고객이 비즈니스와 관계를 맺는 전체 기간 동안 비즈니스에 있어 고객이 갖는 총 가치
1. 고객 생애 가치가 높은 고객
- 고객 유지 캠페인 진행
- 고객들의 생애가치를 유지하게 해야 함.
2. 고객 생애 가치가 낮은 고객
- 고객 방치 혹은 이탈 유도 전략
- 혹은 높이기 위한 전략 수행
예시)
고객생애가치 높은 고객
통신사 | 보조금 지불 |
은행이나 카드사 같은 금융업 | 연회비, 이체수수료 등 각종 수수료 혜택 |
데이터의 종류
대부분 기업에서는 중도전달자료로 데이터를 가지고 있다.
처치 treat 이후부터 관찰이 종료되는 시점 사이에서 사건 발생 여부를 확인할 수 없는 자료
- 현재 계속 남아있는 고객
- 이미 이탈하여 해지 또는 종료된 고객
이는 지극히 당연한 상황이다.
실제 기업들의 데이터 웨어하우스에서는 프로젝트를 수행하지 않았다면, 모델링을 위해서 데이터 마트를 따로 구축하지 않았을 것이고, 이러한 데이터를 산재되어 있다.
이러한 상황에서 고객 생애 가치는 일반적으로 다음과 같이 측정한다고 한다.
고객개별에 대한 생애가 치를 정의하지 않고, 과거 몇 년 동안 그 회사의 과거사용기간을 가지고 고객의 가치를 판단하고 있다.
또 고객의 수명예측은 고객 개별에 대한 고객수명을 예측하기보다는 집단의 월별 평균 해지율이나 월별 평균 이탈률을 가지고 집단의 평균적 수명을 예측하고 있는 실정이다. (2011년 논문이라 맞지 않을 수 있다.)
임상에서는 다음과 같다고 한다.
임상에서의 중도 절단 Censored 자료
- Loss to follow up : 환자가 다른 지역으로 이주하여 추적이 불가능
- Drop out : 환자가 치료를 거부하거나 다른 사유로 치료를 중단
- Termination of the study : 사건이 발생하기 전에 관찰기간이 종료
- Death from unrelated cause : 본 연구와 상관없는 다른 이유로 사망
고객생애가치정의
일반적으로 고객생애가치는 고객의 주어진 기간 동안 가져다주는 가치, 고객의 서비스 기간과 할인율의 3가지 구성요소로 구성되는데, 고객으로부터 그 회사와 평생 동안 관계로부터 얻어지는 모든 미래가치의 현재가치로써 정의된다.
논문 참고
즉 논문에서도 나왔듯이 고객생애가치를 구할 때 모델링으로 얻을 수 있는 부분은 이 고객이 얼마나 이 기업에 머물지를 알아야 앞으로의 생애가치를 구할 수 있게 된다. (이탈 확률) - 고객 수명 예측 필요
막상 고객생애가치함수를 보면, 실질적으로 해당 데이터를 구할 수 있을지가 고민이 된다.
생애가치함수는 실제 이벤트를 통해서 나온 결과를 기반으로 하는 것이니, 실제 비즈니스 지표로 측정을 한다고 상상을 하면, 결국 각 상황에 맞게 마케팅을 이 고객한테 몇 번을 해야 반응이 오고, 이 반응을 위해서 지불된 비용과 할인율을 얼마이고, 이러한 시뮬레이션을 갖춰줘야 CLV를 산출할 수 있을 것 같은데 여러모로 분석을 하려고 하면 쉽지 않을 것 같다는 생각이 든다.
고객수명 예측방법론
특정 논문에서는 개별 고객에 대한 수명을 예측하고자 2개의 모형을 결합했다고 한다.
임상실험이나 상품수명 등의 중도절단자료 예측에 많이 사용되는 통계학의 생존분석 방법인 준모수적(semi-parametric) 접근법인 Cox의 비례위험 모형(proportional hazards model, Cox, 1972)과 모수(parametric)적인 생존함수 추정을 결합한 모형적합방법을 제시하고자 한다.
즉 각각 동질의 고객들로 이루어진 세그먼트의 과거 그 기업의 상품을 이용한 기간 동안의 정보를 기반으로 생존함수를 구해 각 개별 고객의 미래이용기간을 예측함으로써 각 개별 고객이 그 회사에 남아 있을 전체 수명을 예측하는 방법이다
(고객세분화에 기반한 생존분석을 활용한 고객수명 예측 모델)
고객 세분화에 생존 분석을 활용하여 고객수명 예측을 하면 다음과 같은 장점이 있다고 한다.
- 가입시점이 다른 모든 고객을 반영하고 있다는 것
- 고객들의 공변량을 모형의 영향변수로 포함하여 고객의 개별적 특성을 반영하여 개별 고객수명에 대한 오차를 줄일 수 있다
- 관측시점 이후의 수명을 예측함으로써 시간의 흐름에 따른 이탈률 또는 해지율의 변동추이를 반영하게 되어 더욱더 현실성을 반영
해당 논문의 결과를 보지만, 결국 결론은 고객의 생애가치를 더 정확하게 파악할 수 있다는 점이 장점인 것 같은데... 이것의 장점은 고객 세분화를 한 상태에서 고객들의 생애가치를 잘 분석하여, 생애가치주기가 떨어지는 집단에게만 마케팅을 더 한다던지 아니면 그 집단은 무시한다던지와 같은 전략을 짜는데 보고서 정도의 역할로 쓰일 수 있을 것 같다 생각이 들었다.
(기타) 이탈 시점에 대한 정의
각 도메인마다 고객들의 이탈 시점은 분명 다르게 정의가 될 것이고, 게임에서 유저들의 이탈을 정의한느 것에 대해서 인상 깊어서 글을 남긴다.
마찬가지로 해당 게임데이터의 유저들 역시 분석을 하게 되면 데이터가 중도 절단 Censored 자료가 될 것이다.
이러한 상황에서 해당 시점에서 이 유저를 이탈한 지 여부를 결정하기가 쉽지 않을 것이다.
(어떻게 정의하든 반박이 나올 수밖에 없고, 논리적으로 설득하기 어려운 구조)
아래 논문에서는 이러한 상황 때문에 2개의 반응 변수로 나눴다고 한다.
저자는 절단된 시점을 기준으로 14일간의 미접속 여부에 따라 해당 유저가 잔존하는지 여부를 결정하는 식으로 정의했고,
생존 시간 같은 것들도 게임 출시일이나, 아니면 관측을 한 시점으로부터 볼지와 같이 참 난해한 부분이라고 생각한다.
이게 어떤 게임 출시일 같이 특정 이벤트를 기준으로 보게 되면, 분석에서 현실 시점을 반영하지 못한다는 의견이 받을 수 있고, 특정 관측 시점을 자른 시점을 고려하게 되면, 기존의 고객 특성이 잘 반영이 안 될 수 있는 단점이 있고
그래서 저자는 2개를 다 사용한 게 아닐까 하는 생각이 든다...
참고
https://towardsdatascience.com/survival-analysis-to-understand-customer-retention-e3724f3f7ea2
https://www.clvs.co.kr/post/what-is-crm-1
'관심있는 주제 > Customer Segmentation' 카테고리의 다른 글
마케팅에서 페르소나에 대한 자료 정리 (0) | 2022.07.17 |
---|