본문 바로가기
학습노트/통계

[통계 학습] 칸 아카데미 오답노트1

by kime2 2024. 7. 8.

1. 범주형 자료의 추세

1) 조건부확률
요세미티 국립공원에 있는 암벽등반 명소에서 임의로 명의 암벽등반가를 뽑아 표본을 추출하고, 암벽등반 사고를 당한 적이 있는지와 암벽등반에 관련된 자격증이 있는지 설문하였습니다. 결과는 다음과 같습니다.
요세미티 국립공원에서 등반 파트너를 찾고 있는데 게릭, 몰리, 라이언을 만났다고 합시다. 게릭은 막 심한 등반 사고를 당했습니다. 몰리는 안전장비에 암벽등반 자격증을 걸고 있고, 라이언에 대해서는 아무것도 모릅니다.

 

  •  P(게릭에게 자격증이 있음) = 2(사고를 당했는데 자격증이 있는 사람들의 계수) / 8(사고를 당한 사람들의 계수) = 0.25
  • 몰리가 사고를 당한적이 없을 확률 = 138(자격증이 있는데 사고를 당한적 없는 사람들의 계수) / 140(자격증이 있는 사람들의 계수)
  • 라이언에게 자격증이 있고 사고를 당한 적도 없을 확률 = 138(자격증이 있는데 사고를 당한적 없는 사람들의 계수) / 200(전체 사람들)

 

2) 독립
 
조나단은 무글루텐 식이요법이 긍정적인 삶의 태도를 갖는데에 도움을 준다는 뉴스를 보았습니다. 맞는 말인 것 같았지만, 조나단은 극단적으로 식이요법을 바꾸기 전에 뉴스가 맞는지 조사해야겠다고 생각했습니다. 조나단은 학교에서 명에게 무글루텐 식이요법을 사용하는지 물어본 다음, 그 사람이 긍정적인 사람인지 부정적인 사람인지 판단했습니다.

 

조나단은 무글루텐 식이요법과 긍정적인 삶의 태도는 아무 상관관계가 없다는 사실을 발견했습니다.

 

무글루텐과 긍정과는 서로 관련이 없기 때문에 무글루텐을 하든 하지않든  전체의 60%임

무글루턴이면서 긍정 = 무글루턴인원 중 60% = 20*0.6

무글루턴이 아니면서 긍정 = 글루턴인원 중 60% = 80*0.6

 

3) 에밀리는 악기상에서 기타 고치는 일을 합니다. 에밀리는 고친 기타의 종류와 고친 부분을 기록해 두었습니다. 그 기록은 다음과 같습니다.

빈도표를 바탕으로 다음의 백분율을 계산해 보세요.
백분율을 소수 셋째 자리에서 반올림하여 나타내세요.

넥을 수리한 어쿠스틱 기타의 백분율   

> 41 / 131

넥 수리가 필요 없었던 모든 어쿠스틱 기타의 백분율 

바디 수리나 줄 교체가 필요했던 일렉트릭 기타의 백분율 

>  82/131

 

 

4) 조건분포와 주변분포

조건분포 주변분포

조건분포 : 두 확률분포 X와 Y에 대하여 Y값이 주어진 조건에서의 X의 확률분포를 X의 조건분포

예) 각 날씨에 대한 도착시간을 따로따로 보고 있음

 

주변분포 : 변량가운데 한 편의 분포를 무시했을 때의 다른 한 편만의 분포

 

3단원

1) 평균절대편차

평균 > 평균과 값의 편차의 절대값 > 모든 편차의 합 > 평균

2) 분산

표본분산

모분산

 

 

3) 사분범위 IQR

 

1 2 3 4 5 6 7 8 9
0 1 1 3 3 3 4 5 7

 

  1. 중앙값 계산하기 : 3
  2. 제1사분위 : 중앙값의 왼쪽에 있는 자료들의 중앙값 : 1 + 1 / 2
  3. 제3사분위 : 중앙값 오른쪽에 있는 자료들의 중앙값 : 4 + 5 / 2
  4. IQR : Q3 - Q1 : 3.5

 

 

4) 상자그림

 

  1. 전체의 중앙값이 32어야함 > 5번째 6번째의 평균값
  2. 1번째 값이 25 마지막 10번째 값이 38
  3. 1~5번까지의 중앙값이 29, 6번 ~ 10번까지 중앙값이 35