연관관계(상관관계) : 두개의 수치나 확률변수가 같이 움직이는 관계
인과관계 : 한 변수의 변화가 다른 변수의 변화를 일우키는 것
인과추론 : 연관 관계로부터 인과관계를 추론하고 언제, 왜 다른지 이해하는 과정
▶ 중요성 : 기업에서는 매출 및 유입증대를 위해 무엇을 해야할지 알아야 하기 때문에 인과관계를 알아야 한다!
▶ 목표 : T(처리)가 Y(결과)에 미치는 영향을 학습하는 과정
▶ 문제 : 동일한 실험대상이 처치를 받은 상태와 받지 않은 상태를 동시에 만족하지 못한다
do(.) 연산자 : 모든 대상에 개입하여 어떤일이 일어날지 추로
▶ do연산자를 통해 개별 실험 대상에 처치가 결과에 미치는 영향인 개별처치효과(ITE)에 대한 표현 가능
잠재적 결과
: 처치가 t인 상태일 때 살험대상 i의 결과는 Y될 것이다
▶ 실험군과 대조군이 처치 외의 다른 이유 때문에 서로 다르다면, 두 그룹은 인과효과가 아닌 편향된 추정값으로 산출
- 사실적 결과 : 관측할 수 있는 한가지 잠재적 결과
- 반사실적 결과 : 관측할 수 없는 다른 한가지 결과
▶ 잠재적 결과 중 하나만 관측할 수 있으므로 개별 처치효과를 알 수 없다
인과추론의 가정
1. 일치성 : T로 지정된 처치 외에 숨겨진 여러 형태의 처리는 존재하지 않는다
- 처치를 여러번 했는데, 그중 일부만 고려했다면 일치성위배
- 처치가 잘못된 경우 일치성 위배
2. 상호간섭 없음(SUTVA) :하나의 실험 대상에 대한 효과는 다른 실험 대상의 영향을 받지 않는다
- 파급효과 및 네트워크 효과가 있을 경우 SUTVA위배
인과 추정량
1. 평균처치 효과(ATE) :처치T가 평균적으로 미치는 영향
2. 실험군에 대한 평균 처치 효과(ATT) : 처치 받은 대상에 대한 처치 효과
3. 조건부 평균 처치 효과(CATE) :변수X로 정의된 그룹에 대한 처치 효과(개인화에 유용)
▶ 터치가 조금 증가할때 값이 얼마나 변화할 것으로 기대하는지 나타내는 방법
연관관계가 인과관계가 아닌 이유
편향 : 추정량이 추정하려는 매개변수와 다른 경우
- 교환가능성 : 실험군과 대조군이 서로 비교가능할 경우 연관관계는 인과관계가 될 수 있다
- 독립성가정 : 처치가 잠재적 결과에 관한 어떠한 정보도 제공하지 않는다
- 식별 : 관측 가능한 데이토러 인과 추정량을 표현하는 방법을 알아내는 단계
- 추정 : 실제 데이터를 사용하여 아서 식별한 인과 추정향을 추정하는 단계
- 랜덤화 ▶ 독립성 가정을 거의 강제적으로 충족시킴
- 독립성가정 : 처치가 잠재적 결과에 관한 어떠한 정보도 제공하지 않는다
'학습노트 > 통계' 카테고리의 다른 글
[통계학습] 5장 성향점수 (0) | 2024.10.07 |
---|---|
[통계학습] 3장 인과추론 소개 (0) | 2024.09.18 |
오답노트 (0) | 2024.08.19 |
[통계 학습] 칸 아카데미 오답노트6 (0) | 2024.08.12 |
[통계 학습] 칸 아카데미 오답노트5 (0) | 2024.08.03 |