본문 바로가기

학습노트/아티클,도서9

[도서] 수학보다 데이터 문해력 정성규 교수님의수학보다 데이터 문해력 발췌 통계적 가설검정의 딜레마 좋은 가설검정의 방법은 오류 발생률이 낮은 것을 선택하는 것귀무가설 기각 > 1종오류 : 귀무가설이 사실인데 대립가설을 선택하는 오류귀무가설 채택 > 2종 오류 : 대립가설이 사실인데 귀무가설을 선택하는 오류 두 오류는 하나를 얻으려면 다른 하나를 포기해야 하는 트레이드 오프 관계1종 오류는 귀무가설이 사실인 차원에서만 존재하고2종오류는 귀무가설이 거짓인 차원에서만 존재한다 그렇다면, 두 오류중 더 문제가 되는 것은?첫번째 오류가 더 충격이 큼2종 오류의 경우 원래 잘못 알고 있던(귀무가설)을 계속 믿는 것인데1종 오류의 경우 원래 알고 있는게 사실인데 잘못된 선택을 하는것 > 더 악화 해결책(이라기 보다는 대안) 첫번째 오류 발생률을 .. 2024. 6. 7.
[자료노트] TOSS INSIGHT PO가 꼭 알아야 할 개념 Carring Capacity(한계수용능력) 출처 : https://youtu.be/tcrr2QiXt9M?feature=shared   월 활성 유저수(MAU)는 매달 유저수와 나가는 유저수에 따라서 결정된다TotalCustomers = New Customer Today & Lost Customer Today Customer의 정의목적 : TotalCustomers 을 정하기 위함 1. Active에 대한 정의95%이상의 visitor가 꼭 하는 활동page by page, repeatable,meaningful한 action2. Churn에 대한 정의얼마나 안써야 안오는 거라고 정의할까? -1일,4일상식적으로 이정도 안썼으면 loss할 것 같다를 정해야 함(변경불가)-> 예).. 2024. 3. 26.
[강의노트] 데이터 리터러시 스파르타코딩클럽에서 제공해주는 강의를 기반으로 요약하였습니다 데이터 리터러시란 데이터를 읽고 비판적으로 분석하여 결과를 의사소통에 활용할 수 있는 능력 데이터를 통해 올바른 질문을 던질 수 있도록 만들어줌 데이터 해석의 오류 심슨의 역설: 부분에서 성립된 대소관계가 그 부분을 종합한 '전체'에 대해서 성립하지 않는 모순 시각화를 활용한 왜곡: 자료의 표현 방법에 따라서 해석의 오류 여지가 존재 샘플링 편향: 전체를 대표하지 못하는 편향된 샘플선정응로 인해 오류가 발생 상관관계 / 인과관계 상관관계: 두 변수가 얼마나 상호 의존적인지를 파악(원인과 결과는 알 수 없음) 인과관계: 실질적으로 하나의 요인으로 인해 다른 요인의 수치가 변함(인과관계) 데이터분석 접근방법 1. 문제 및 가설 정의 2. 데이터 분.. 2024. 1. 3.