본문 바로가기
학습노트/통계

[통계학습] 1장 인과추론 소개

by kime2 2024. 9. 2.

연관관계(상관관계) : 두개의 수치나 확률변수가 같이 움직이는 관계

인과관계 : 한 변수의 변화가 다른 변수의 변화를 일우키는 것

인과추론 : 연관 관계로부터 인과관계를 추론하고 언제, 왜 다른지 이해하는 과정

 

▶ 중요성 : 기업에서는 매출 및 유입증대를 위해 무엇을 해야할지 알아야 하기 때문에 인과관계를 알아야 한다!

▶ 목표 : T(처리)가 Y(결과)에 미치는 영향을 학습하는 과정

▶ 문제 : 동일한 실험대상이 처치를 받은 상태와 받지 않은 상태를 동시에 만족하지 못한다

 

do(.) 연산자 : 모든 대상에 개입하여 어떤일이 일어날지 추로

▶  do연산자를 통해 개별 실험 대상에 처치가 결과에 미치는 영향인 개별처치효과(ITE)에 대한 표현 가능

 

잠재적 결과

: 처치가 t인 상태일 때 살험대상 i의 결과는 Y될 것이다

▶  실험군과 대조군이 처치 외의 다른 이유 때문에 서로 다르다면, 두 그룹은 인과효과가 아닌 편향된 추정값으로 산출

  • 사실적 결과 : 관측할 수 있는 한가지 잠재적 결과
  •  반사실적 결과 : 관측할 수 없는 다른 한가지 결과

▶   잠재적 결과 중 하나만 관측할 수 있으므로 개별 처치효과를 알 수 없다

 

인과추론의 가정

1. 일치성 : T로 지정된 처치 외에 숨겨진 여러 형태의 처리는 존재하지 않는다

  • 처치를 여러번 했는데, 그중 일부만 고려했다면 일치성위배
  • 처치가 잘못된 경우 일치성 위배

2. 상호간섭 없음(SUTVA) :하나의 실험 대상에 대한 효과는 다른 실험 대상의 영향을 받지 않는다

  • 파급효과 및 네트워크 효과가 있을 경우 SUTVA위배

인과 추정량

1. 평균처치 효과(ATE) :처치T가 평균적으로 미치는 영향

2. 실험군에 대한 평균 처치 효과(ATT) : 처치 받은 대상에 대한 처치 효과

3. 조건부 평균 처치 효과(CATE) :변수X로 정의된 그룹에 대한 처치 효과(개인화에 유용)

▶  터치가 조금 증가할때 값이 얼마나 변화할 것으로 기대하는지 나타내는 방법

 

연관관계가 인과관계가 아닌 이유

편향 : 추정량이 추정하려는 매개변수와 다른 경우

  • 교환가능성 : 실험군과 대조군이 서로 비교가능할 경우 연관관계는 인과관계가 될 수 있다
    • 독립성가정 : 처치가 잠재적 결과에 관한 어떠한 정보도 제공하지 않는다
      1. 식별 : 관측 가능한 데이토러 인과 추정량을 표현하는 방법을 알아내는 단계
      2. 추정 : 실제 데이터를 사용하여 아서 식별한 인과 추정향을 추정하는 단계
      3. 랜덤화 독립성 가정을 거의 강제적으로 충족시킴

              

 

'학습노트 > 통계' 카테고리의 다른 글

[통계학습] 5장 성향점수  (0) 2024.10.07
[통계학습] 3장 인과추론 소개  (0) 2024.09.18
오답노트  (0) 2024.08.19
[통계 학습] 칸 아카데미 오답노트6  (0) 2024.08.12
[통계 학습] 칸 아카데미 오답노트5  (0) 2024.08.03