본문 바로가기

분류 전체보기205

스파르타 코딩클럽 데이터분석 부스캠프 후기 1. 지원동기'데이터 분석은 어떤 툴로 쓰세요?'기획파트에 면접을 보러 갔을 때 들었던 질문입니다. 파이썬, R 등은 한번도 해본적이 없어서기획관련 직무를 지원할때 늘 데이터분석 등의 단어가 들어가면 무조건 패스했는데그렇게 고르고 골라 간 곳에서 질문이 데이터 분석을 해본적 있는지 였습니다. 그만큼 어떤 주제의 데이터를 보는 것은 필수 소향인것 같아그 다음날 스파르타 코딩클럽의 데이터 부스캠프 광고를 보고 지원했습니다. 2. 초보자 데이터 분석의 시작 당시 여러 부스캠프를 알아보면서 스파르타 코딩클럽에 지원한 이유는컴활2급을 할 수 있는 엑셀 이외의 다른 툴이나 언어는 해본적이 없었는데,다른 부스캠프는 면접이나 기본스킬에 대한 질문을 하는 곳도 있었습니다.그러나 스파르타는 초보자도 할 수 있도록 교육과정.. 2024. 11. 3.
[통계학습] 5장 성향점수 1. 성향점수1) 성향점수 : 관찰연구에서 두 그룹을 비교할 때, 각 그룹이 여러 특성에서 비슷하게 만들어 주는 도구로                e(x)를 통제하면, 곧 X를 통제할 때와 동일한 효과가 나타난다는 가정성향점수가 종일한 상황에서 처치는 무작위 배정된 것과 동일 효과 2) 사용시기 : 새로운 교육 프로그램 및 프로덕트의 이벤트 효과를 추정하고자 할때 3) 계산방법 성향점수를 계산할 때 사용할 독립변수를 선택 : 처치에 영향을 미치는 모든 변수를 포함성향점수 대신, 로지스틱 회귀분석 : 모델의 해석이 중요하고, 선형가정이 적저르 처지여부를 독립변수로 설명하는 모델을 생성하여 로짓함수로 활용상향점수 매칭 : KNN알고리즘K-d Tree알고리즘4) 성향점수의 직교화선형회귀도 선향점수 추정과 매우.. 2024. 10. 7.
[통계학습] 3장 인과추론 소개 인과 그래프(DAG:directed acyclic graph): 연관관계는 인과관계가 아닌 이유를 설명하는 도구, 비순환 + 비가역적 특징 - DAG에서 가장 중요한 정보는 그래프 안에 없을 수 있다는 사실▶ 한 변수에서 다른 변수로 연결되는 엣지가 없다는 것은 두 변수 사이에 직접적인 인과 관계가 없다고 가정 Q. 컨설팅을 하면 앞으로의 수익이 좋아질까? : 컨설턴트 고용과 회사 실적과의 인과관계 알기영향1. 컨설팅 ▶ 이후 6개월 수익 영향2. 이전 6개월 수익 ▶   컨설팅   ▶ 이후 6개월 수익실험군: 컨설팅을 한 회사대조군 : 컨설팅을 하지 않은 회사결과 : 미래 실적차이원인1 : 컨설팅 때문원인2 : 컨설팅을 한 회사는 원래 잘 하는 회사이기 때문 컨설팅 - 수익이 인과관계가 아닌 이유: 직.. 2024. 9. 18.
[통계학습] 1장 인과추론 소개 연관관계(상관관계) : 두개의 수치나 확률변수가 같이 움직이는 관계인과관계 : 한 변수의 변화가 다른 변수의 변화를 일우키는 것인과추론 : 연관 관계로부터 인과관계를 추론하고 언제, 왜 다른지 이해하는 과정 ▶ 중요성 : 기업에서는 매출 및 유입증대를 위해 무엇을 해야할지 알아야 하기 때문에 인과관계를 알아야 한다!▶ 목표 : T(처리)가 Y(결과)에 미치는 영향을 학습하는 과정▶ 문제 : 동일한 실험대상이 처치를 받은 상태와 받지 않은 상태를 동시에 만족하지 못한다 do(.) 연산자 : 모든 대상에 개입하여 어떤일이 일어날지 추로▶  do연산자를 통해 개별 실험 대상에 처치가 결과에 미치는 영향인 개별처치효과(ITE)에 대한 표현 가능 잠재적 결과 : 처치가 t인 상태일 때 살험대상 i의 결과는 Y될 .. 2024. 9. 2.
라이프챗 티스토리를 통한 라이프챗 콘텐츠https://lifechatt.com/?utm_source=tstory&utm_medium=social&utm_id=test 인생선배 인생대화 라이프챗1:1 초개인화 러닝플랫폼lifechatt.com 2024. 8. 28.
오답노트 1. 확률 P(적어도 하루는 쿠폰을 받음) = 1 - P(6일동안 하루도 쿠폰을 받지 못함)1 - 0.85^6▶ 답 : 약 0.623 2. 조합(여학생만 뽑는 경우의 수) / (전체 학생을 뽑는 경우의 수)여학생만 뽑는 경우의 수 : 5명중에 3명을 뽑음전체 학생을 뽑는 경우의 수 : 7명중에 3명을 뽑음  ▶ 답  2/7 [ 순열과 조합 ]순열 : 임의로 무엇을 뽑을 때, 순서가 영향을 줌조합 : 임의로 무엇을 뽑을 때, 순서에 영항을 받지 않음 3. 표본분포 표본분포의 평균 : 표본비율의 표본분포 평균은 모비율과 동일▶ 답 : 표본비율의 표본평균 = 모비율 = 0.93 표본분포의 표준편차 ▶ 답 : 0.93 [ 관련 이론 ]이항분포의 : 성공확률 P를 가지는 독립시행 n번 중 성공한 횟수를 나타내는 .. 2024. 8. 19.