월간 세미나
home
패키지
home
👩‍👧‍👦

RFM 지수와 유저 등급

이전 글(‘RFM 분석이란 무엇일까요’)에서는 RFM 분석 기법을 알아보고 간단한 데이터를 통해 직접 RFM 분석을 해봤습니다. 혹시 이 글을 먼저 읽으시는 분들 중에서 RFM 분석이 무엇인지 모르시는 분들께서는 앞 글을 먼저 읽고 와주세요.
제가 앞서 썼던 글에서 사실 RFM 분석을 실무에서 적용할 때 가장 중요한 것은 RFM이라는 분석 기법의 개념이 아니라 그래서 어떤 기준으로 분류할 것인지를 결정하고 찾아가는 부분이라고 말씀드렸습니다. 이번 글에서는 RFM의 세가지 수치인 ‘Recency(구매 최신성)’, ‘Frequency(구매 빈도)’, ‘Monetary(구매 금액)’을 이용해 유저 그룹을 어떻게 분류 해볼 수 있는지 구체적인 방법들에 대해 이야기 해보도록 하겠습니다.

segmentation이란 무엇인가요?

우선 유저군 분류(segmentation)가 무엇이고 왜 해야하는지에 대해 생각해보겠습니다. 유저군 분류는 말 그대로 유저를 몇개의 그룹으로 나누어 분류하는 방식으로 서비스의 특성에 따라 분류의 목적에 따라 수백 수천가지의 방식이 있을 수 있습니다.
우리는 왜 유저들을 나누어서 봐야하는 걸까요? segmentation이라는 개념이 정확하게 존재하지 않을 때에도 우리는 자연스럽게 고객들을 몇가지 집단으로 나누어 관리를 하곤 했는데요. 단골 고객, VIP 고객이라는 개념도 바로 그런 개념 중 하나라고 할 수 있습니다.
네이트 판 게시글 https://pann.nate.com/talk/357248027
지금 당장 같은 음식점에서 같은 돈을 내고 식사를 하고 있는 고객이라고 하더라도 그 고객이 단골 고객이라면, 음식점 사장님 입장에서는 단골 손님이 이전까지도 매출에 많이 기여를 했고 앞으로도 기여를 해줄 것으로 기대할 수 있기 때문에 좀 더 후하게 양을 더 많이 줄 수도 있잖아요. 또 다른 음식점에 가지말고 또 와달라는 의미로 서비스를 줄 수도 있구요. 거꾸로 단골이 아닌 손님들을 대할 때에는 새로오신 손님들을 단골로 만들기 위해서 손해를 조금 감수하더라도 사이드 메뉴를 서비스로 주어서 맛을 보게 해줄 수도 있고요. 또는 자주 방문하긴 하지만 와서 매번 물만 마시고 가는 손님에게는 아무런 혜택을 주지 않을 수도 있겠죠.
전체 유저를 몇개의 그룹으로 나눈다는 말은 각 유저 집단을 분류한 기준이 생긴다는 말과 똑같습니다. 기준이 생기면 그 기준에 따라 각 그룹의 유저들의 가치를 대략적으로나마 산정할 수 있게되며, 나뉘어진 유저 집단의 특성에 맞춰 서로 다른 혜택을 제공하는 등 개인화 된 전략을 사용 할 수 있습니다. 당연히 모든 유저에게 동일한 혜택을 주는 것보다는 유저 집단의 특성에 맞는 혜택을 주는 것이 좀 더 좋은 반응을 이끌어 낼 수가 있겠죠?
우리가 만나는 모든 서비스에서도 이런 비슷한 일들이 벌어집니다. 통신사에서 매기는 고객들의 등급, 이커머스 사이트에서 매기는 고객의 등급, 카드사에서 매기는 고객의 등급 등은 모두 다 전체 고객중 이 고객들이 우리 비즈니스에게 얼마나 많이 기여를 했는지를 구분하기 위한 방식인거에요.

유저들을 하나의 수치로 나타내는 방법

그럼 이제 RFM 분석 방법론을 통해 어떻게 유저군을 구분할 수 있을지 이야기를 해보도록 하겠습니다. 유저들의 RFM 값을 이용해 유저들의 가치를 하나의 수치로 계산하는 방법에 대해 알아보도록 하겠습니다.

RFM 지수

이전 글(‘RFM 분석이란 무엇일까요’)에서 RFM 분석으로 유저가 구매한 내역을 기준으로 얼마나 최근에 구매를 했는지, 얼마나 자주 구매를 했는지, 얼마나 큰 금액으로 구매를 해왔는지를 확인할 수 있다고 말씀드렸습니다. 이렇게 구해진 수치를 가지고 ‘RFM 지수’라는 것을 계산해낼 수가 있는데요.
RFM 지수란 Recency, Frequency, Monetary 각각의 항목의 중요도를 반영하여 계산해낸 하나의 값으로 유저들의 구매 패턴 데이터를 통해 유저들의 가치를 매긴 값이라고 생각할 수 있습니다. 간단하게 실습을 한 번 해볼까요.
아래와 같은 유저 데이터를 가진 서비스가 있다고 해봅시다. 이 서비스에서는 소액이라도 플랫폼에서 구매를 자주하는 유저들을 가장 가치 있는 유저들이라고 판단하며, RFM 지수를 구하기 위한 가중치를 a = 8, b = 10, c = 1로 설정했다고 가정해보겠습니다. 최근 구매일은 숫자가 커질수록 좋지 않은 지표이므로 음수 값으로 변환하여 계산합니다.
유저
최근 구매일
총 구매 횟수
총 구매 금액
RFM 지수
1
2일 전
12
903
1007
2
4일 전
7
462
500
3
16일 전
1
943
825
4
27일 전
2
120
-76
5
43일 전
6
623
339
6
52일 전
9
135
-191
7
70일 전
2
801
261
8
90일 전
1
13
-697
RFM 지수가 큰 유저부터 내림차순으로 정렬해보겠습니다.
유저
최근 구매일
총 구매 횟수
총 구매 금액
RFM 지수
1
2일 전
12
903
1007
3
16일 전
1
943
825
2
4일 전
7
462
500
5
43일 전
6
623
339
7
70일 전
2
801
261
4
27일 전
2
120
-76
6
52일 전
9
135
-191
8
90일 전
1
13
-697
총 구매 횟수가 가장 많고 최근 구매일이 가장 최신인 1번 유저가 단연 RFM 지수가 가장 높게 나왔습니다. 2번 유저는 5번 유저에 비해 구매 금액은 적지만 구매 횟수가 더 많고 최근 구매일에 상당한 차이가 나기 때문에 더 높은 RFM 점수를 받았습니다. RFM 지수를 직접 구해보니 ‘구매일, 구매 횟수, 구매 금액’ 각각 별개의 데이터로 보이던 지표들이 ‘해당 서비스에서 가치가 높은 유저를 판단 할 수 있을만한 값’으로 환산이 되는 것 같습니다.

가중치는 왜 필요할까요?

이전 글(‘RFM 분석이란 무엇일까요’)에서 쿠팡과 29CM라는 플랫폼은 취급하는 상품의 특성이나 비즈니스의 특성이 다르기 때문에 RFM 항목별 중요도도 조금씩 다를 것이다 라고 이야기를 했었습니다.
예를 들어 위에서 RFM 지수를 구해봤던 예시처럼 쿠팡에서는 소액이라도 자주 플랫폼을 이용하는 것을 더 가치있다고 판단하고 29CM에서는 소액으로 자주 결제하는 유저들 보다는 한 번에 구매할 때 구매 금액을 크게 쓰는 유저들이 더 가치가 있다고 판단 한다면, RFM 지수를 구하기 위한 가중치는 쿠팡에서는 b>a>c 로, 29CM에서는 c>b>a 로 설정할 수 있겠죠.
동일한 샘플 유저군을 기준으로 쿠팡과 29CM 방식으로 RFM 지수를 각각 구해보도록 하겠습니다.
유저
최근 구매일
총 구매 횟수
총 구매 금액
쿠팡 RFM 지수 순위
29CM RFM 지수 순위
1
-2
12
903
1
2
2
-4
7
462
3
5
3
-16
1
943
2
1
4
-27
2
120
6
7
5
-43
6
623
4
4
6
-52
9
135
7
6
7
-70
2
801
5
3
8
-90
1
13
8
8
각각의 유저들에 대해 쿠팡의 계산식으로 매긴 RFM 지수의 순위와 29CM의 계산식으로 매긴 RFM 지수의 순위가 조금씩 다른 것을 볼 수 있죠. 쿠팡의 RFM 지수는 총 구매횟수가 상대적으로 많은 1번 유저를 가장 가치 있는 유저로 보았지만, 29CM의 RFM 지수는 1회 구매시 구매 금액이 가장 큰 3번 유저를 가장 가치 있는 유저로 보고 있습니다. 이렇게 같은 유저의 똑같은 구매 내역을 보더라도 각각의 비즈니스의 특성에 따라서 어떤 지표를 더 중요하게 생각하는지가 달라지기 때문에 각 유저의 가치는 서비스별로 모두 다르게 측정될 수 있습니다.

유저군 나누기

유저들의 가치가 환산이 되었으니 분류를 해봐야겠죠. 우리 서비스에서는 고객들의 분류를 딱 두가지로만 하면 된다고 하면 파레토의 법칙을 이용하여 RFM 점수가 높은 상위 20%의 고객을 충성고객으로 분류 해볼 수도 있겠고요. 5단계로 고객 등급을 나눠야한다고 하면 각 등급별로 포함되는 유저들의 숫자가 동일하게끔 유저군을 나눠 볼 수도 있을 것 같습니다. 이 외에도 여러가지 방식으로 유저군을 나눌 수 있는데요.
이때 유저군이 잘 나뉘었는지, 가중치가 적절했던 것인지를 알고 싶다면, 전체 매출에 대해 각 그룹 유저들이 기여하는 바가 얼마나 되는지를 구해보고 그룹별 기여도의 분산이 상대적으로 크게 나뉜 조건이 어떤 것인지를 확인해보면 됩니다.
유저
최근 구매일
총 구매 횟수
총 구매 금액
RFM 지수
1
2일 전
12
903
1007
3
16일 전
1
943
825
2
4일 전
7
462
500
5
43일 전
6
623
339
7
70일 전
2
801
261
4
27일 전
2
120
-76
6
52일 전
9
135
-191
8
90일 전
1
13
-697
위와 같이 구한 RFM 지수를 이용하여 2가지 방식으로 그룹을 나눠보겠습니다.
<1번 조건으로 나눈 유저 그룹>
유저 그룹
인원수
매출액
매출 기여도
A 그룹
2
1846만원
46%
B 그룹
3
1886만원
47%
C 그룹
3
268만원
7%
총계
8
4000만원
100%
<2번 조건으로 나눈 유저 그룹>
유저 그룹
인원수
매출액
매출 기여도
D 그룹
3
2308만원
58%
E 그룹
2
1424만원
35%
F 그룹
3
268만원
7%
총계
8
4000만원
100%
1번 조건에서는 A 그룹과 B 그룹이 매출에 기여하는 기여도가 비슷했지만, 2번 조건에서는 D 그룹, E 그룹, F 그룹에서 각각 총 매출에 기여한 기여도가 훨씬 달라졌죠. 기여도의 분산을 고려하면 2번 조건을 통해 나누는 것이 조금 더 분류가 잘 된 것 같아요. 2번 조건으로 유저 그룹 분류한다고 결정한다면, 이 데이터를 이용하면 기여도가 가장 높은 D 그룹의 유저들에게 VIP 혜택을 주는 등의 CRM 전략을 세워볼 수 있겠죠?

RMF 지수를 통해 유저군을 나눌 때 주의할 점

RFM 지수는 함축적이고 요약적인 하나의 값이기 때문에 각각의 그룹을 구성하는 유저들의 특징에 대해서 직관적으로 파악하기가 어렵습니다. 각 그룹에 분류된 유저들이 최근 구매한 유저들이 많은 그룹인지, 단순히 구매금액이 많은 그룹인지 등을 보기 위해서는 그룹별 Recency, Frequency, Monetary의 분포나 평균값 등을 확인하여 그룹에 맞는 전략을 만들어야 합니다.
또한 이렇게 나눈 그룹은 현재까지의 데이터를 기반으로한 사후 분석내용이므로 각 그룹에 대해 실제 푸시, 메일링 등의 실험을 진행하며 해당 그룹들에서 유의미한 컨버전 차이가 실제로 발생하는지도 직접 검증 해볼 필요가 있습니다.

참고자료

이보민 데이터 분석가
데이터 분석가, 데이터리안 강의 기획자, 레몬 러버 입니다.

함께 읽어보면 좋은 글

List
Search
GA로 블로그 분석하기
GA
서비스분석
퍼널분석
사용자행동데이터