스파르타코딩클럽에서 제공해주는 강의를 기반으로 요약하였습니다
데이터 리터러시란
- 데이터를 읽고 비판적으로 분석하여 결과를 의사소통에 활용할 수 있는 능력
- 데이터를 통해 올바른 질문을 던질 수 있도록 만들어줌
데이터 해석의 오류
- 심슨의 역설: 부분에서 성립된 대소관계가 그 부분을 종합한 '전체'에 대해서 성립하지 않는 모순
- 시각화를 활용한 왜곡: 자료의 표현 방법에 따라서 해석의 오류 여지가 존재
- 샘플링 편향: 전체를 대표하지 못하는 편향된 샘플선정응로 인해 오류가 발생
상관관계 / 인과관계
- 상관관계: 두 변수가 얼마나 상호 의존적인지를 파악(원인과 결과는 알 수 없음)
- 인과관계: 실질적으로 하나의 요인으로 인해 다른 요인의 수치가 변함(인과관계)
데이터분석 접근방법
1. 문제 및 가설 정의 | 2. 데이터 분석 | 3. 결과 해석 및 액션도출 |
생각(데이터 리터러시) | 작업 | 생각 |
1. 문제정의 : SO WHAT? WHY SO?
- 분석하려는 특정 상황 및 현상에 대한 진술로 프로젝트의 목표 및 분석방향 설정
- 모호하지 않도록 구체적이며 근본적인 문제임
- 결과적으로 풀고자 하는것 (예:사용자가 줄어들어 수익이 감소할 경우-> 문제: 수익감소/ 원인: 사용자감소)
💡 누구를 설득하기 위함인지, 어떻게 변화하고자 하는지 생각
문제정의 방법론 | ||
MECE | 로직트리 | |
1. 문제해결과 분석에서 사용되는 접근방식 2. 문제를 상호 배타적 + 포괄적인 구성요소로 구분 |
1. MECE원칙을 기반으로 복잡한 문제를 더 작은 하위문제로 분해 2. 접근: 상위문제 -> 하위문제 3. 인과관계: 작은가지 -> 큰가지 4. 로직트리 분류: 개념적/반대되는 말(유입/유출)/세그먼트 기반 (라이트유저/일반유저/헤비유저)등 |
|
출처: https://www.casenews.co.kr/news/articleView.html?idxno=10078 |
데이터 유형 비교
정량적 데이터 | 정성적 데이터 | |
유형 | 정형데이터 반정형 데이터 |
비정형 데이터 |
특징/관점 | 객관적 내용 | 주관적 내용 |
구성/형태 | 수치/기호/데이터베이스/스프레드 시트 | 문자,언어/웹로그, 텍스트파일 |
위치 | DBMS,로컬시스템 등 내부 | 웹사이트, 모바일 플랫폼 등 외부 |
분석 | 통계분석 용이 | 통계분석 어려움 |
정량적 데이터 활용
- 측정가능한 지표사용(일일 활성 사용자수, 재방문 비율 등)
- 패턴파악 및 의사결정과정의 판단 근거로 사용 가능
지표설정
문제정의: 어떤 문제를 풀고자 하는 가 ➡️ 지표설정: 어떤 결과를 기대하는 가
지표 설정 사례
ACTIVE USER | - 사이트 진입: 메인 홈 화면에 진입 시 활성유저 진입허들▼ 지표측정△ 액션효율▼ - 진입 후 추가행위: 사이트 진입보다 허들이 조금 높음 - 최종액션: 서비스 구입한 유저 진입허들△ 지표측정▼ 액션효율△ |
- 어디까지 경험한 유저를 활성유저하고 하는지 - 일반유저와 활성유저를 나누는 기준 - 유저의 서비스 효용성 체감 지점 - 핸들링 가능한 유저의 크기 |
Retention Ratio (재방문율) |
서비스를 사용한 사람이 다시 서비스를 사용하는 비율 % 한번 획득한 유저가 서비스로 다시 돌아왔는가?에 대한 지표 리텐션이 높은 서비스는 획득비용에 투자한 비용을 빠르게 회수할 수 있음 |
<N-DAY리텐션> - 최초 사용일로부터 N일 후에 재방문한 Active User의 비율 - 서비스의 사용 주기가 길 경우, N-day 리텐션을 사용하면 실제보다 더 과소평가 -매일 접속하는 서비스에 적합(카카오톡, 인스타그램, 게임 등) |
<Unbounded 리텐션> - 특정 날짜를 포함하여 그 이후에 재방문한 유저의 비율 - 특정일을 포함하여 그 이후에 한 번이라도 재방문한 유저의 비율(실제로 매일 방문하지 않았아도 방문한 것으로 포함) - 유저가 정기적으로 반복해서 방문하는 서비스가 아닐 경우 적합(채용사이트, 쇼핑몰, 부동산 서비스) - 해당 지표는 절대적인 수치보다는 지표가 어떻게 변화하는 지에 대해 트렌드를 보는 용도 |
<Bracket 리텐션> - 설정한 특정 기간을 기반으로 재방문율을 측정 (1(0일차) / 2(1-3일차) / 3(4-6일차) / 4(7-11일차) - 하루 정도 서비스에 접속을 안했더라도, 리텐션에 영향을 주지 않기 때문에 기준이 조금 더 널널함 - 사용주기가 길거나 주기적인 경우 적합(식료품 배달서비스, 세차) |
|
Funnel (퍼널) | - 유저들이 어디서 이탈하는가? -퍼널은 잠재고객을 유입시키며 최종적인 목표 액션을 달성할 때까지의 과정 - 각 단계의 전환율을 측정 |
|
AARRR | - 디지털 마케팅시 퍼널을 활용하는 프레임워크로 단계별 전환율을 지표화 하여 서비스 보완 지점을 찾음 | |
LTV (Life Time Value, 고객 평생 가치) | - 고객 생애 주기 기간 중 해당 유저가 얼마만큼의 이익을 주는지 측정 *고객생애주기기간: 한 명의 유저가 서비스를 사용하기 시작하여 이탈할 때까지의 기간 - 지표가 높을 수록 유저와 서비스의 관계가 좋음 |
|
북극성 지표
정의 | 특징 | |
- 제품의 성공을 정의하는 CORE VALUE | - 회사의 사업 목표를 나타내는 지표 중 선행지표(후행X) - 제품/사업 조직이 무엇에 최적화되어야 하고, 무엇을 포기해도 되는 지에 대한 방향 제시 |
결과와 결론
- 결과: 계산과 분석을 통해 나온 수치적 결과물
- 결론: 결과에 기반한 해석(단 과도한 추론 및 편향 주의) ➡️ 의사결정에 대한 설득자료
- 고객 만족도와 구매 빈도 사이의 강한 상관관계를 보여준다(결과),이는 고객 만족도 향상이 전반적인 매출 증가로 이어질 수 있다(결론)
결론보고 플로우
※어떠한 목적(문제정의)으로 결론을 누구에게 공유할 것인지 고려
전체 내용을 한 문장으로 정리/요약 ➡️ 해당 보고서의 메인 주제 ➡️ 해당 보고서를 쓴 이유와 원하는 결과
➡️ 문제 정의 단계 ➡️ 핵심 내용 전개 ➡️ 결론 및 액션
같이 보면 좋을 자료들
https://yozm.wishket.com/magazine/detail/1481/
https://www.openads.co.kr/content/contentDetail?contsId=6989
https://playinpap.github.io/retention-ltv-simulation/
https://blog.toss.im/article/tossbdm
https://eopla.net/magazines/1519#
'학습노트 > 아티클,도서' 카테고리의 다른 글
[도서] 데이터로 전문가처럼 말하기 (0) | 2024.07.11 |
---|---|
[도서] 통계 101 X 데이터 분석 (1) (0) | 2024.06.13 |
[도서] 컨버티드 : 마음을 훔치는 데이터 분석의 기술 (0) | 2024.06.09 |
[도서] 수학보다 데이터 문해력 (1) | 2024.06.07 |
[자료노트] TOSS INSIGHT (0) | 2024.03.26 |