내가 찾은 변수가 인과관계가 맞는지 확인하는 법
안녕하세요?
신사동 마케터입니다.
지난 글에서는 서비스가 지향해야 하는 지표인 북극성지표에 대해 알아봤는데요. 북극성 지표는 인과관계가 성립해야 한다고 했습니다. 그런데 이 인과관계라는 걸 증명하기가 생각보다 쉽지 않아요. 게다가 상관관계라는 겉으로 보기엔 매우 비슷한 개념도 존재합니다. 그럼 어떻게 해야 할까요? 이런 경우 인과관계를 확인하는 체크리스트가 있습니다. 이번 포스팅은 세 가지 체크리스트에 대해 이야기 해보겠습니다.
#1. 역의 인과관계
#2. 제3의 변수
#3. 우연의 일치
1. 역의 인과관계
첫번째 체크리스트는 역의 인과관계가 성립하는지 확인하는 거예요.
X가 Y의 원인이 되는 것보다 Y가 X의 원인이 되는 것이 더 합리적인지 생각해보는 거예요. 예를 들어서 앱 마케팅 중 스탬프를 찍어주거나 배지같은 걸 주는 보상 마케팅이 있는데요. 금전적 보상이 있는 건 아니지만 심리적으로 유저의 활동을 인정해주는 거죠. 그런데 배지를 가진 사람들이 리텐션이 높다고 해서 배지 마케팅과 리텐션의 인과관계가 만족한다고 할 수 있을까요? 리텐션이 높은 사람이 배지를 많이 받은 걸 수도 있어요. 역의 인과관계를 확인하려면 원인지표와 결과지표를 뒤집어서 생각했을 때 말이 되는 지 생각해보면 됩니다.
2. 제3의 변수
두번째 체크리스트는 제 3의 변수가 없는지 생각해보는 건데요.
예를 들어 여름 시즌만 되면 매출이 증가한다는 데이터를 발견했을 때 여름과 매출은 인과관계라고 할 수 있을까요? 여름마다 진행했던 대규모 프로모션이라는 제 3의 변수 영향을 받았을 수도 있지 않았을까요? 이런 경우 시즌 상관없이 프로모션 성과와 매출의 상관관계를 비교해보고 어느 경우가 상관관계가 더 높은지 확인 해봐야 합니다.
3. 우연의 일치
세번째 체크리스트는 우연의 일치에요.
아이폰 사용여부와 대한민국 신생아 수는 상관계수가 1에 가깝게 나온다고 해도 우연의 일치일 확률이 높겠죠. 사실 랜덤으로 두 변수를 넣고 상관관계를 따지면 상관관계가 아예 없는 경우보다 조금이라도 혹은 우연찮게 높은 상관관계가 나오기도 합니다. 따라서 상관관계를 분석하기 전에 합리적인 연관성이 있는 가설을 세우는 과정이 무척이나, 무척이나 중요합니다. 이 부분에 대해서도 차차 글에서 풀어볼게요.
이렇게 인과관계를 만족하기란 꽤나 까다로워요. 따라서 현업에서는 상관관계를 1차 검증한 후 추려진 변수들 중에서 인과관계의 조건을 만족하는 변수를 찾습니다. 다음 글에서는 인과관계의 3가지 조건에 대해 알아볼게요~!
오늘도 행복하세요~!
▶그로스해커의 KPI설정법 | 제대로 된 지표와 함께 서비스를 성장시키고 싶다면
'데이터'를 어떻게 활용해야 하는지 배우고 싶은 분들,
'데이터'를 통해 인사이트를 찾고 싶은 분들,
'데이터'추출을 위한 가설 수립에 어려움을 겪는 분들,
'데이터'를 어떻게 해석해야 하는 지 배우고 싶은 분들이라면
인사이터에서 진행 중인 <그로스해커의 KPI설정법> 수업을 참고 해주세요.