학습노트52 벡터의 기본 개념 1. 벡터1) 개념벡터란 공간상에서 특정 방향과 길이를 가진 화살표이며 데이터를 시각화 하는 것을 목적으로 한다 2) 계산(벡터의 덧셈) *음수 방향의 벡터는 나중에 벡터를 결합할 때 더하지 말고 빼야 한다[3,2]+ [2,-1] = [5,1]▶ 두 벡터를 더하려면 차례로 연결하고 마지막 벡터의 끝으로 이동하여 끝나는 지점이 두 벡터를 합한 새로운 벡터▶ 교환법칙이 성립하기 때문에 무엇을 먼저 더하는 지는 중요하지 않음 3) 스케일링벡터의 길이를 늘이거나 줄이는 것으로 스칼라(scalar)라고 하는 하나의 값을 곱하거나 스케일링해서 벡터를 늘이거나 줄인다2[1,2] = [2,4]▶ 벡터의 크기를 조정해도 벡터의 방향은 변하지 않고 크기만 변함▶ 예외) 벡터에 음수를 곱하면 벡터의 뱡향이 바뀐다 4) 스팬.. 2024. 11. 30. [통계학습] 5장 성향점수 1. 성향점수1) 성향점수 : 관찰연구에서 두 그룹을 비교할 때, 각 그룹이 여러 특성에서 비슷하게 만들어 주는 도구로 e(x)를 통제하면, 곧 X를 통제할 때와 동일한 효과가 나타난다는 가정성향점수가 종일한 상황에서 처치는 무작위 배정된 것과 동일 효과 2) 사용시기 : 새로운 교육 프로그램 및 프로덕트의 이벤트 효과를 추정하고자 할때 3) 계산방법 성향점수를 계산할 때 사용할 독립변수를 선택 : 처치에 영향을 미치는 모든 변수를 포함성향점수 대신, 로지스틱 회귀분석 : 모델의 해석이 중요하고, 선형가정이 적저르 처지여부를 독립변수로 설명하는 모델을 생성하여 로짓함수로 활용상향점수 매칭 : KNN알고리즘K-d Tree알고리즘4) 성향점수의 직교화선형회귀도 선향점수 추정과 매우.. 2024. 10. 7. [통계학습] 3장 인과추론 소개 인과 그래프(DAG:directed acyclic graph): 연관관계는 인과관계가 아닌 이유를 설명하는 도구, 비순환 + 비가역적 특징 - DAG에서 가장 중요한 정보는 그래프 안에 없을 수 있다는 사실▶ 한 변수에서 다른 변수로 연결되는 엣지가 없다는 것은 두 변수 사이에 직접적인 인과 관계가 없다고 가정 Q. 컨설팅을 하면 앞으로의 수익이 좋아질까? : 컨설턴트 고용과 회사 실적과의 인과관계 알기영향1. 컨설팅 ▶ 이후 6개월 수익 영향2. 이전 6개월 수익 ▶ 컨설팅 ▶ 이후 6개월 수익실험군: 컨설팅을 한 회사대조군 : 컨설팅을 하지 않은 회사결과 : 미래 실적차이원인1 : 컨설팅 때문원인2 : 컨설팅을 한 회사는 원래 잘 하는 회사이기 때문 컨설팅 - 수익이 인과관계가 아닌 이유: 직.. 2024. 9. 18. [통계학습] 1장 인과추론 소개 연관관계(상관관계) : 두개의 수치나 확률변수가 같이 움직이는 관계인과관계 : 한 변수의 변화가 다른 변수의 변화를 일우키는 것인과추론 : 연관 관계로부터 인과관계를 추론하고 언제, 왜 다른지 이해하는 과정 ▶ 중요성 : 기업에서는 매출 및 유입증대를 위해 무엇을 해야할지 알아야 하기 때문에 인과관계를 알아야 한다!▶ 목표 : T(처리)가 Y(결과)에 미치는 영향을 학습하는 과정▶ 문제 : 동일한 실험대상이 처치를 받은 상태와 받지 않은 상태를 동시에 만족하지 못한다 do(.) 연산자 : 모든 대상에 개입하여 어떤일이 일어날지 추로▶ do연산자를 통해 개별 실험 대상에 처치가 결과에 미치는 영향인 개별처치효과(ITE)에 대한 표현 가능 잠재적 결과 : 처치가 t인 상태일 때 살험대상 i의 결과는 Y될 .. 2024. 9. 2. 오답노트 1. 확률 P(적어도 하루는 쿠폰을 받음) = 1 - P(6일동안 하루도 쿠폰을 받지 못함)1 - 0.85^6▶ 답 : 약 0.623 2. 조합(여학생만 뽑는 경우의 수) / (전체 학생을 뽑는 경우의 수)여학생만 뽑는 경우의 수 : 5명중에 3명을 뽑음전체 학생을 뽑는 경우의 수 : 7명중에 3명을 뽑음 ▶ 답 2/7 [ 순열과 조합 ]순열 : 임의로 무엇을 뽑을 때, 순서가 영향을 줌조합 : 임의로 무엇을 뽑을 때, 순서에 영항을 받지 않음 3. 표본분포 표본분포의 평균 : 표본비율의 표본분포 평균은 모비율과 동일▶ 답 : 표본비율의 표본평균 = 모비율 = 0.93 표본분포의 표준편차 ▶ 답 : 0.93 [ 관련 이론 ]이항분포의 : 성공확률 P를 가지는 독립시행 n번 중 성공한 횟수를 나타내는 .. 2024. 8. 19. [통계 학습] 칸 아카데미 오답노트6 평균 추론에 필요한 조건 : t검정에 대한 일반조건1. 임의성2. 일반성 : 표본평균의 표본분포가 정규분포를 따라야 함모집단의 분포를 확인할 수 없기 때문에 표본분포와 표본의 크기를 바탕으로 결정대표본 (n>=30) : 표본의 크기가 상당히 크다면 (n>30) 표본 분포는 표본 자료의 형태나 모집단에 가까워 정규분포에 가까워진다소표본 (n3. 독립성 : 각각의 관측값이 독립적, 비복원추출을 한다면 표본의 크기는 모집단의 10%미만> 관측값이 독립적이라면 신뢰구간을 만들거나 유의성검정을 시행시 표본평균의 표준편차에 대한 공식 활용 가능 보통 모표분편차를 모르기 때문에 모표준편차의 추정치로써 표본표준편차로 대체대체하여 구한 표준편차를 표준오차 라고 함 z통계량과 t통계량 사용비율 VS 평균평균에서 t통계.. 2024. 8. 12. 이전 1 2 3 4 ··· 9 다음