학습노트52 [강의노트] 통계 - 통계적 가설검정, p-value 스파르타코딩클럽의 강의와 Kmooc/공돌이 수학정리노트를 참고하여 작성하였습니다1. 통계적 가설검정목적: 주어진 자료가 특정 가설을 충분히 뒷받침하는지 여부를 결정하는 통계쩍 추론 방법 2. 검정가설의 절차귀무가설 검증과정귀무가설 가정 -> 실험 수행 -> 귀무가설로는 결과 해석 불가 -> 귀무가설 기각 -> 대립가설 채택귀무가설: 현 상태에 대한 잠정적 가정(새로울 게 없다 -> 목적: 기각하고 싶음)대립가설: 우리가 알고 싶은 것(새로운 것이 있다)귀무가설이 참이라면 이런 극단적인 값을 가지는 통계량을 구하기 힘들다 -> 귀무가설 기각1) 귀무가설을 기각한다(대립가설이 참이기 때문에 귀무가설이 참이라고 할 수 없다)2) 대립가설이 참이라고 말할 충분한 증거가 없다(귀무가설을 기각할 수 없다)귀무가설.. 2024. 1. 22. [강의노트] 통계 - 검정통계량, ANOVA 스파르타코딩클럽의 강의와 Kmooc/공돌이 수학정리노트를 참고하여 작성하였습니다https://angeloyeo.github.io/2020/02/29/ANOVA.html F-value의 의미와 분산분석 - 공돌이의 수학정리노트 (Angelo's Math Notes) angeloyeo.github.io 1. ANOVA(anlysis od variance 분산분석)*검정통계량: 통계적 가설의 진위여부를 검정하기 위해 표본으로 부터 계산하는 통계량(예: t-test,anova..)의미: 여러 집단의 평균이 다르다고 볼 수 있는지 알아보는 테스트 by 분산이용한 평균 비교-> 각 집단의 평균은 조금씩 다를 수 밖에 없는데, 그 차이가 유의미하게 큰지 확인하기 위해 분산 이용차이/불확실도(t-test와 의미는 동일.. 2024. 1. 22. [강의노트] 통계 - 검정통계량, t-value 스파르타코딩클럽의 강의와 Kmooc/공돌이 수학정리노트를 참고하여 작성하였습니다+ 참고: https://angeloyeo.github.io/2021/01/05/confidence_interval.html 신뢰 구간의 의미 - 공돌이의 수학정리노트 (Angelo's Math Notes) angeloyeo.github.io0. 평균1) 평균을 망치는 요소(1) 왜도: skewness특장한 방향으로 데이터가 쏠려있는 것(보통 꼬리를 당긴 것 처럼 생겼다)보통을 그래프를 통해 보이며, 왜도가 있을 경우 평균이 전체 데이터를 대표하지 못함(2) 이상치: outlier다른 관측치와 유의하게 다른 데이터유의하다는 것의 의미가 다르지만 보통 소수의 데이터가 평균에 크게 영향을 주기 때문에 평균을 구할 때 제거하거나 .. 2024. 1. 19. [강의노트] Python - Pandas, matplotlib 활용1 스파르타코딩클럽의 강의를 참고하여 작성하였습니다 데이터 분석 순서 1. 문제 정의 및 가설 설정하기 2. 데이터 분석 기본 세팅 하기 3. 데이터 분석하기 4 분석 결과 시각화 하기 5. 최종 결론 내리기 목표 수강생들이 가장 많이 혹은 가장 적게 듣는 시간과 요일을 데이터 분석으로 찾기 2. 데이터 분석 기본 세팅 하기 : Pandas 사용 선언 하기 > 데이터 가져오기 > 데이터 확인 및 표 읽기 > 공백란 제거하기 # 2. 데이터 분석 세팅하기 import pandas as pd # pd->데이터 분석 도구 sparta_data=pd.read_table('/content/access_detail.csv',sep=',') sparta_data.head() print(sparta_data.isnull(.. 2024. 1. 17. [강의노트] Python 분석 - 상관계수 실습 스파르타코딩클럽의 강의를 참고하여 작성하였습니다. 실습주제: 상관계수 활용 분석가설 글루타치온이 당뇨병발생에 큰 영향을 줄 것이다. 1단계: 데이터 분석 기본 세팅하기 1) Pandas 사용 선언 하기 2) 데이터 가져오기 3) 데이터 확인 및 표 읽기 4) 공백란 제거하기 import pandas as pd data = pd.read_table('/content/diabetes.csv',sep=',') data.head() print(data.isnull().sum()) 데이터 공백 확인 2단계 데이터 분석하기 1) 상관계수 구하기 2) 결과확인하기 3) 상관계수 1인 요소 제거: 발병률에 대한 상관계수를 구하는 것이니 발병률에 대한 요소 빼기 corr=data.corr(method='pearson').. 2024. 1. 16. [강의노트] Python 분석- 상관계수(2), barplot 스파르타코딩클럽의 강의를 참고하여 작성하였습니다. 이전 분석에서는 타이타닉 생존과 나이에 대한 상관계수가 없어보였다. 좀더 미세하게 나이대와 생존에 상관계수를 분석해 보자 https://kime2pan.tistory.com/59 [강의노트] Python 분석 - 상관계수(1) 스파르타코딩클럽의 강의를 참고하여 작성하였습니다. 목표 나이-생종의 상관관계 분석하기 by Pandas 상관계수란! 1단계: 데이터 분석 기본 세팅하기 1) Pandas 사용 선언 하기 2) 데이터 가져오기 3) kime2pan.tistory.com 목표 나이대별 생존과상관관계 구하기 1단계: 데이터 분석 기본 세팅하기 1) 라이브러리 사용 선언 하기 2) 데이터 가져오기 3) 데이터 확인 및 표 읽기 4) 공백란 제거하기 #1) .. 2024. 1. 14. 이전 1 ··· 5 6 7 8 9 다음