본문 바로가기
학습노트/아티클,도서

[강의노트] 데이터 리터러시

by kime2 2024. 1. 3.
스파르타코딩클럽에서 제공해주는 강의를 기반으로 요약하였습니다

이 문제를 풀려면 어떤 데이터를 사용해야 할까..

데이터 리터러시란

  • 데이터를 읽고 비판적으로 분석하여 결과를 의사소통에 활용할 수 있는 능력
  • 데이터를 통해 올바른 질문을 던질 수 있도록 만들어줌

데이터 해석의 오류

  • 심슨의 역설: 부분에서 성립된 대소관계가 그 부분을 종합한 '전체'에 대해서 성립하지 않는 모순
  • 시각화를 활용한 왜곡: 자료의 표현 방법에 따라서 해석의 오류 여지가 존재
  • 샘플링 편향: 전체를 대표하지 못하는 편향된 샘플선정응로 인해 오류가 발생

상관관계 / 인과관계

  • 상관관계: 두 변수가 얼마나 상호 의존적인지를 파악(원인과 결과는 알 수 없음)
  • 인과관계: 실질적으로 하나의 요인으로 인해 다른 요인의 수치가 변함(인과관계)

 

데이터분석 접근방법

1. 문제 및 가설 정의 2. 데이터 분석 3. 결과 해석 및 액션도출
생각(데이터 리터러시) 작업 생각

 

1. 문제정의 : SO WHAT? WHY SO? 

  • 분석하려는 특정 상황 및 현상에 대한 진술로 프로젝트의 목표 및 분석방향 설정
  • 모호하지 않도록 구체적이며 근본적인 문제임
  • 결과적으로 풀고자 하는것 (예:사용자가 줄어들어 수익이 감소할 경우->  문제: 수익감소/ 원인: 사용자감소)
💡 누구를 설득하기 위함인지, 어떻게 변화하고자 하는지 생각

 

 

문제정의 방법론
MECE 로직트리
1. 문제해결과 분석에서 사용되는 접근방식
2. 문제를 상호 배타적 + 포괄적인 구성요소로 구분
1. MECE원칙을 기반으로 복잡한 문제를 더 작은 하위문제로 분해
2. 접근: 상위문제 -> 하위문제
3. 인과관계: 작은가지 -> 큰가지
4. 로직트리 분류: 개념적/반대되는 말(유입/유출)/세그먼트 기반 (라이트유저/일반유저/헤비유저)등
출처: https://www.casenews.co.kr/news/articleView.html?idxno=10078

데이터 유형 비교

  정량적 데이터 정성적 데이터
유형 정형데이터
반정형 데이터
비정형 데이터
특징/관점 객관적 내용 주관적 내용
구성/형태 수치/기호/데이터베이스/스프레드 시트 문자,언어/웹로그, 텍스트파일
위치 DBMS,로컬시스템 등 내부 웹사이트, 모바일 플랫폼 등 외부
분석 통계분석 용이 통계분석 어려움

 

정량적 데이터 활용

  • 측정가능한 지표사용(일일 활성 사용자수, 재방문 비율 등)
  • 패턴파악 및 의사결정과정의 판단 근거로 사용 가능

지표설정

문제정의: 어떤 문제를 풀고자 하는 가 ➡️ 지표설정: 어떤 결과를 기대하는 가

 

지표 설정 사례

ACTIVE USER - 사이트 진입: 메인 홈 화면에 진입 시 활성유저
진입허들  지표측정  액션효율
- 진입 후 추가행위: 사이트 진입보다 허들이 조금 높음
- 최종액션: 서비스 구입한 유저
진입허들  지표측정  액션효율
- 어디까지 경험한 유저를 활성유저하고 하는지
- 일반유저와 활성유저를 나누는 기준
- 유저의 서비스 효용성 체감 지점
- 핸들링 가능한 유저의 크기
Retention
Ratio
(재방문율)
서비스를 사용한 사람이 다시 서비스를 사용하는 비율 %
한번 획득한 유저가 서비스로 다시 돌아왔는가?에 대한 지표
리텐션이 높은 서비스는 획득비용에 투자한 비용을 빠르게 회수할 수 있음
<N-DAY리텐션>
- 최초 사용일로부터 N일 후에 재방문한 Active User의 비율
- 서비스의 사용 주기가 길 경우, N-day 리텐션을 사용하면 실제보다 더 과소평가
-매일 접속하는 서비스에 적합(카카오톡, 인스타그램, 게임 등)
<Unbounded 리텐션>
- 특정 날짜를 포함하여 그 이후에 재방문한 유저의 비율

- 특정일을 포함하여 그 이후에 한 번이라도 재방문한 유저의 비율(실제로 매일 방문하지 않았아도 방문한 것으로 포함)
유저가 정기적으로 반복해서 방문하는 서비스가 아닐 경우 적합(채용사이트, 쇼핑몰, 부동산 서비스)
- 해당 지표는 절대적인 수치보다는 지표가 어떻게 변화하는 지에 대해 트렌드를 보는 용도
<Bracket 리텐션>
- 설정한 특정 기간을 기반으로 재방문율을 측정
(1(0일차) / 2(1-3일차) / 3(4-6일차) / 4(7-11일차)
- 하루 정도 서비스에 접속을 안했더라도, 리텐션에 영향을 주지 않기 때문에 기준이 조금 더 널널함
- 사용주기가 길거나 주기적인 경우 적합(식료품 배달서비스, 세차)
Funnel (퍼널) - 유저들이 어디서 이탈하는가?

-퍼널은 잠재고객을 유입시키며 최종적인 목표 액션을 달성할 때까지의 과정

- 각 단계의 전환율을 측정
AARRR - 디지털 마케팅시 퍼널을 활용하는 프레임워크로 단계별 전환율을 지표화 하여 서비스 보완 지점을 찾음
LTV (Life Time Value, 고객 평생 가치) - 고객 생애 주기 기간 중 해당 유저가 얼마만큼의 이익을 주는지 측정

*고객생애주기기간: 한 명의 유저가 서비스를 사용하기 시작하여 이탈할 때까지의 기간

- 지표가 높을 수록 유저와 서비스의 관계가 좋음
  • 이익 x Life Time x 할인율(미래 비용에 대한 현재 가치)
  • 연간 거래액 x 수익률 x 고객 지속 연수
  • 고객의 평균 구매 단가 x 평균 구매 횟수
  • (매출액 – 매출 원가) / 구매자 수
  • 평균 구매 단가 x 구매 빈도 x 구매 기간
  • (평균 구매 단가 x 구매 빈도 x 구매 기간) – (신규 획득 비용 + 고객 유지 비용)
  • 월 평균 객단가 / 월 가중 평균 잔존율

 

북극성 지표

정의 특징
 - 제품의 성공을 정의하는 CORE VALUE - 회사의 사업 목표를 나타내는 지표 중 선행지표(후행X)

- 제품/사업 조직이 무엇에 최적화되어야 하고, 무엇을 포기해도 되는 지에 대한 방향 제시

 

결과와 결론

  • 결과: 계산과 분석을 통해 나온 수치적 결과물
  • 결론: 결과에 기반한 해석(단 과도한 추론 및 편향 주의) ➡️ 의사결정에 대한 설득자료
  • 고객 만족도와 구매 빈도 사이의 강한 상관관계를 보여준다(결과),이는 고객 만족도 향상이 전반적인 매출 증가로 이어질 수 있다(결론)

 

결론보고 플로우

※어떠한 목적(문제정의)으로 결론을 누구에게 공유할 것인지 고려

전체 내용을 한 문장으로 정리/요약 ➡️ 해당 보고서의 메인 주제 ➡️ 해당 보고서를 쓴 이유와 원하는 결과

➡️ 문제 정의 단계 ➡️ 핵심 내용 전개 ➡️ 결론 및 액션 

 

같이 보면 좋을 자료들

https://yozm.wishket.com/magazine/detail/1481/

 

'MECE'로 논리적인 의견 전달하기 | 요즘IT

기획 파트에서 '논리적'이라는 뜻은 '내용'과 상관이 있다. 하지만 논리적으로 '보이는 것'은 디자인, 표현의 영역이다. 꼼꼼히 제품 기획하고 제작하시는 것만큼, 우리는 표현도 제대로 하고 있

yozm.wishket.com

https://www.openads.co.kr/content/contentDetail?contsId=6989

 

마케터가 알아야 할 퍼널 관련 지식 총정리!

마케터가 알아야 할 퍼널 관련 지식 총정리!

www.openads.co.kr

https://playinpap.github.io/retention-ltv-simulation/

 

Excel로 Retention 변화에 따른 LTV 시뮬레이션하기

1. 개요 작년 하반기 나는 Retention 지표 향상을 목표로 하는 목적조직에 소속되어있었다. Rete…

playinpap.github.io

https://blog.toss.im/article/tossbdm

 

무한한 사업 전략의 세계로 건너가는 법

‘유난한 도전’의 길에 같이 서 있는 동료들을 위해 토스팀에서 진행된 세션을 정리해서 공개해요. 토스팀원들이 반드시 챙겨보는 인기 세션들만 모았어요. 여러 직군, 직무의 기본기 뿐만 아

blog.toss.im

 

https://eopla.net/magazines/1519#

 

이제 LTV(고객생애가치)를 정확히 계산해 봅시다

마케팅, 특히 퍼포먼스 영역에서 가장 중요한 한 가지 개념을 꼽자면 CAC(Customer Acquisition Cost)와 LTV(Life Time Value)가 아닐까 싶습니다. 유저 한 명을 획득하는 데 드는 비용보다, 유저의 생애가치가

eopla.net