분류 전체보기205 [빅분기] 2유형 1) 분류 : 랜덤포레스트 + 평가(교차검증) :f1_macro#1. 라이브러리 불러오기 import pandas as pd #2. 데이터 불러오기 train = pd.read_csv("../input/big-data-analytics-certification-kr-2022/train.csv")test = pd.read_csv("../input/big-data-analytics-certification-kr-2022/test.csv")#3. EDAtrain.head()train.info()train.describe(include ="O")#4.전처리#1) 범주형 : 원핫 인코딩 -> pd.get_dummiestrain= pd.get_dummies(train)test = pd.get_dummies(test.. 2024. 6. 20. [문제풀이] Hacker Rank - Draw The Triangle 1, 2 출처 Draw The Triangle 2 | HackerRankDraw the triangle pattern using asterisks.www.hackerrank.com문제1P(R) represents a pattern drawn by Julia in R rows. The following pattern represents P(5)문제에 대한 해석P( ) 에 5를 입력하면 다음과 같이 출력된다.20일 넣을 경우는 ?-> * 20개를 시작으로 20행으로 1행이후 *이 1개씩 감소하다가 마지막 행에는 1개의 *이 있어야 함 풀이(MYSQL)set @n = 21;select repeat('* ', @n :=@n-1)from information_schema.tableslimit 20; 작동순서💡SQL 실행.. 2024. 6. 20. [빅분기]유형1 기출 Big Data Certification KR (kaggle.com) 1) 데이터에서 IQR을 활용해 Fare컬럼의 이상치를 찾고, 이상치 데이터의 여성 수를 구하시오[py] T1-1. 이상치를 찾아라(IQR활용) Expected Questions | Kaggle# 라이브러리 및 데이터 불러오기import pandas as pddf = pd.read_csv('../input/titanic/train.csv')# IQR 구하기Q1 = df['Fare'].quantile(0.25)Q3 = df['Fare'].quantile(0.75)IQR = Q3-Q1# 이상치 데이터 구하기# 이상치 = Q1-IQR*1.5# 이상치 = Q3+IQR*1.5out1 = df[df['Fare'] Q3+IQR*1.5]# 이상.. 2024. 6. 19. [문제풀이] Hacker Rank - Symmetric Pairs 출처 Symmetric Pairs | HackerRankWrite a query to output all symmetric pairs in ascending order by the value of X.www.hackerrank.com 문제Two pairs (X1, Y1) and (X2, Y2) are said to be symmetric pairs if X1 = Y2 and X2 = Y1.Write a query to output all such symmetric pairs in ascending order by the value of X. List the rows such that X1 ≤ Y1.문제에 대한 해석X와 Y가 짝이 되기 위해서는 다음의 조건이 필요하다X1 = Y2 and X2 = Y1. .. 2024. 6. 19. [빅분기] 판다스 전처리 100제 출처 https://www.datamanim.com/dataset/99_pandas/pandasMain.html# 판다스 연습 튜토리얼 — DataManimQuestion 43 df의 데이터 중 new_price값이 lst에 해당하는 경우의 데이터 프레임을 구하고 그 갯수를 출력하라 lst =[1.69, 2.39, 3.39, 4.45, 9.25, 10.98, 11.75, 16.98]www.datamanim.com 1.데이터를 로드하라. 데이터는 \t을 기준으로 구분되어있다. df = pd.read_csv('https://raw.githubusercontent.com/Datamanim/pandas/main/lol.csv',sep='\t') 데이터 컬럼 구분 sep = '' 컬럼구분이 별로로 되어있을 경우 .. 2024. 6. 18. [문제풀이] Hacker Rank - Placements 출처 Placements | HackerRankWrite a query to output the names of those students whose best friends got offered a higher salary than them.www.hackerrank.com 문제You are given three tables: Students, Friends and Packages. Students contains two columns: ID and Name. Friends contains two columns: ID and Friend_ID (ID of the ONLY best friend). Packages contains two columns: ID and Salary (offered salary.. 2024. 6. 18. 이전 1 ··· 9 10 11 12 13 14 15 ··· 35 다음