본문 바로가기

학습노트/Python14

[강의노트] Python - 데이터전처리: Pandas(3) - 실습 스파르타코딩클럽의 강의를 참고하여 정리하였습니다 1. pandas 불러오기 import pandas as pd import seaborn as sns 2-1. 데이터불러오기 seaborn에 있는 오픈 데이터 불러오기 data= sns.load_dataset('tips') 2-2. 데이터 저장하기 -> 현재위치에 저장 기능: 나중에 데이터 전처리가 끝나고 데이터 저장 가능 #현재위치(파일)에 파일 저장 data.to_csv("tips_data.csv") #파일을 지정하여 저장하고 싶을 때 "피일명/데이터.확장자" data.to_csv("temp/tips_data.csv") #인덱스 없이 저장하고 싶을 때 data.to_csv("tips_data.csv", index=False) #인덱스 없이 불러오고 싶을.. 2024. 1. 25.
[강의노트] Python - 데이터전처리: pandas(1) 스파르타코딩클럽의 강의를 참고하여 정리하였습니다 데이터의 목적: 설득 데이터전처리 1. 데이터 분석 설계 : 무엇을 위해 어떤 형태의 데이터가 필요한가 목표설정하기: 무엇을 위해 데이터 전처리와 시각화가 필요한 것인가? 예상 산출물 정의하기: 데이터 처리 및 시각화해서 나타날 예상 결과물은 무엇인가? As-is(현재) VS To-be(이상) 생각하기: 현제 문제와 상황이 무엇인지 인지하고 어떤식으로 개선할 것인가 생각하며 분석 방향성 고려 2. 데이터 전처리 의미: 내가 원하는 데이터를 보기 위해 하는 모든 활동 목적: 데이터를 통해 얻고자(확인하고자) 하는것/의사결정을 위해 무엇이 필요한 것 3. Pandas: 데이터 전처리를 위한 도구 1) 판다스 및 데이터 불러오기 import pandas as p.. 2024. 1. 23.
[강의노트] Python - Pandas, matplotlib 활용1 스파르타코딩클럽의 강의를 참고하여 작성하였습니다 데이터 분석 순서 1. 문제 정의 및 가설 설정하기 2. 데이터 분석 기본 세팅 하기 3. 데이터 분석하기 4 분석 결과 시각화 하기 5. 최종 결론 내리기 목표 수강생들이 가장 많이 혹은 가장 적게 듣는 시간과 요일을 데이터 분석으로 찾기 2. 데이터 분석 기본 세팅 하기 : Pandas 사용 선언 하기 > 데이터 가져오기 > 데이터 확인 및 표 읽기 > 공백란 제거하기 # 2. 데이터 분석 세팅하기 import pandas as pd # pd->데이터 분석 도구 sparta_data=pd.read_table('/content/access_detail.csv',sep=',') sparta_data.head() print(sparta_data.isnull(.. 2024. 1. 17.
[강의노트] Python 분석 - 상관계수 실습 스파르타코딩클럽의 강의를 참고하여 작성하였습니다. 실습주제: 상관계수 활용 분석가설 글루타치온이 당뇨병발생에 큰 영향을 줄 것이다. 1단계: 데이터 분석 기본 세팅하기 1) Pandas 사용 선언 하기 2) 데이터 가져오기 3) 데이터 확인 및 표 읽기 4) 공백란 제거하기 import pandas as pd data = pd.read_table('/content/diabetes.csv',sep=',') data.head() print(data.isnull().sum()) 데이터 공백 확인 2단계 데이터 분석하기 1) 상관계수 구하기 2) 결과확인하기 3) 상관계수 1인 요소 제거: 발병률에 대한 상관계수를 구하는 것이니 발병률에 대한 요소 빼기 corr=data.corr(method='pearson').. 2024. 1. 16.
[강의노트] Python 분석- 상관계수(2), barplot 스파르타코딩클럽의 강의를 참고하여 작성하였습니다. 이전 분석에서는 타이타닉 생존과 나이에 대한 상관계수가 없어보였다. 좀더 미세하게 나이대와 생존에 상관계수를 분석해 보자 https://kime2pan.tistory.com/59 [강의노트] Python 분석 - 상관계수(1) 스파르타코딩클럽의 강의를 참고하여 작성하였습니다. 목표 나이-생종의 상관관계 분석하기 by Pandas 상관계수란! 1단계: 데이터 분석 기본 세팅하기 1) Pandas 사용 선언 하기 2) 데이터 가져오기 3) kime2pan.tistory.com 목표 나이대별 생존과상관관계 구하기 1단계: 데이터 분석 기본 세팅하기 1) 라이브러리 사용 선언 하기 2) 데이터 가져오기 3) 데이터 확인 및 표 읽기 4) 공백란 제거하기 #1) .. 2024. 1. 14.
[강의노트] Python 분석 - 상관계수(1) 스파르타코딩클럽의 강의를 참고하여 작성하였습니다. 목표 나이-생종의 상관관계 분석하기 by Pandas 상관계수란! 1단계: 데이터 분석 기본 세팅하기 1) Pandas 사용 선언 하기 2) 데이터 가져오기 3) 데이터 확인 및 표 읽기 4) 공백란 제거하기 #1) pandas사용하기 import pandas as pd #2) 데이터 가져오기 -> '파일경로' titanic = pd.read_table('/content/train.csv',sep=',') #3) 데이터 확인 및 표읽기 -> 아무표시 없을 경우 5중 titanic.head() #4) 공백란 제거하기 print(titanic.isnull().sum()) #-> 공백데이터확인 titanic = titanic.dropna() #->공백제거하기 .. 2024. 1. 14.