본문 바로가기

분류 전체보기205

[문제풀이] Hacker Rank - Challenges 출처 Challenges | HackerRankPrint the total number of challenges created by hackers.www.hackerrank.com 문제Julia asked her students to create some coding challenges. Write a query to print the hacker_id, name, and the total number of challenges created by each student. Sort your results by the total number of challenges in descending order. If more than one student created the same number of challen.. 2024. 6. 18.
분류(3) ~ 통계적 머신러닝(1) 5.5 분균형 데이터 다루기불균형 데이터에서 예측 모델링 성능을 향상시킬 수 있는 방법과소표본 : 분류모델에서 개수가 많은 클래스 데이터 중 일부 소수만을 사용하는 것 (유의어 : 다운샘플)과잉표본 : 분류모겔에서 희귀 클래스 데이터를 중복하여, 필요하면 부트스트랩해서 사용하는 것(유의어 : 업샘플)상향 , 하양 가중치 : 모델에서 희귀 혹은 다수 클래스에 높은/낮은 가치를 주는 것데이터 생성: 부트스트랩과 비슷하게 다시 샘플링한 레코드를 빼고 원래 원본과 살짝 다르게 데이터를 생성하는 것z점수 : 표준화 결과K : 최근접 이웃 알고리즘에서 이웃들의 개수주요개념데이터의 심각한 불균형( 즉, 관심있는 결과의 데이터가 희박할 때)은 분류 알고리즘에서 문제가 될 수 있다불균형 데이터를 다루는 한가지 방법은 다.. 2024. 6. 17.
[문제풀이] Hacker Rank - SQL Project Planning 출처 SQL Project Planning | HackerRankWrite a query to output the start and end dates of projects listed by the number of days it took to complete the project in ascending order.www.hackerrank.com 문제If the End_Date of the tasks are consecutive, then they are part of the same project. Samantha is interested in finding the total number of different projects completed.Write a query to output the star.. 2024. 6. 14.
[도서] 통계 101 X 데이터 분석 (1) 1. 통계학이란데이터 분석의 목적데이터를 요약하는 것대상을 설명하는 것기술통계 : 수집한 데이터를 정리하고 요약하는 방법확보한 데이터에만 집중하면서 데이터 자체의 성질을 이해하는 것을 목표로 함추론통계 : 수집한 데이터로부터 데이터의 발생원을 추정하는 방법추론통계의 방법 : 통계적추론, 가설검정 2. 모집단과 표본데이터 분석의 첫 단계는 분석 목적을 정하는 것이다분석의 목적과 알고자 하는 대상에 기초하여 직접 모집단을 설정모집단 : 통계학에서 알고자 하는 대상 전체모집단의 성질을 알 수 있다면 대상을 설명하거나 이해할 수 있고,미지의 데이터를 예측할 수 있다 Q. 어떻게 모집단의 성질을 알 수 있을까?A. 전수조사 but..시간과 비용.. 그렇다면 표본조사추론통계 : 모집단의 일부를 분석하여 모집단의 전.. 2024. 6. 13.
[문제풀이] Hacker Rank - Contest Leaderboard 출처 Contest Leaderboard | HackerRankGenerate the contest leaderboard.www.hackerrank.com 문제The total score of a hacker is the sum of their maximum scores for all of the challenges. Write a query to print the hacker_id, name, and total score of the hackers ordered by the descending score. If more than one hacker achieved the same total score, then sort the result by ascending hacker_id. Exclude all.. 2024. 6. 13.
[통계학습] 분류 (2) 5.3.3 일반화선형모형 ~ 5.4 분류 모델 평가하기5.3.6 선형회귀와 로지스틱 회귀의 유사점과 차이점 모델을 피팅하는 방식(최소제곱법을 사용할 수 없다)모델에서 잔차의 측징과 분석 1) 모델피팅보통 선형회귀에서는 모델피팅을 위해 최소제곱법을 사용그러나 로지스틱 회귀에서는 최대우도추정(maximum likelihood estimation : MLE) 사용하여 모델일 피팅> 우리가 보고 있는 데이터를 생성했을 가능성이 가장 큰 모델을 찾는 것로지스틱 회귀에서 종속변수는 0과 1이 아니라 응답이 1인 로즈 오즈비의 추정치이다> MLE는 예쌍 로그 오즈비가 관찰된 결과를 가장 잘 설명하는 모델을 찾는 것 최소제곱법 : 회귀모형과 데이터간 차이(잔차)의제곱을 계산하여 최솟값이 되는 파라미터를 구하는 것 주요.. 2024. 6. 12.