20240816 8

[TIL] 머신러닝의 심화 - 데이터분석 프로세스(2)

3. 데이터 전처리- 이상치 이상치란 보통 관측된 데이터 범위에서 많이 벗어난 아주 작은 값 혹은 큰 값을 말한다. 이상치를 확인하는 방법으로는 크게 Extreme Studentized Deviation(ESD)와 IQR(Inter Quantile Range)로 2가지가 있다. 이상치는 주관적인 값으로 데이터 삭제는 분석가가 결정한다. 이상치는 도메인과 비즈니스 맥락에 따라 기준이 달라지고 데이터 삭제 시 품질은 좋아질 수 있지만 정보 손실을 동반하므로 주의해야 한다.# ESD를 이용한 처리import numpy as npmean = np.mean(data)std = np.std(data)upper_limit = mean + 3*stdlower_limit = mean - 3*std-------------..

[WIL] 주간회고 8주차

이번주는 공부랑 권태기 저번주 금요일부터 진짜 너무 공부하기 싫어서 10분 보고 밍기적 10분 보고 밍기적 무한반복 그러다보니 기억에 남는 거 하나도 없네 예.. 다시 들어야죠.. _〆( ŏ̥̥̥̥םŏ̥̥̥̥ ) 그니까 첨부터 잘 들었어야하는딩 왜 그랬을까 그래도 다시 들으니까 이해 완  물론 이해는 했지만 뭔지 기억은 못하고 있는 중 난 말하는 감자다  이번주는 광복절있어서 되게 빨리 지나간 것 같다 사실 또 공부하기 싫어서 이거 쓰는 즁 _(┐「ε:)_ ㅎ

[TIL] 머신러닝의 심화 - 데이터분석 프로세스(1)

1. 데이터 수집 데이터를 수집하려면 개발을 통해 데이터를 적재하고 수집하는 데이터 엔지니어링 역량이 필요하다. 이 부분은 개발자가 직접 설계하고 저장한다. 데이터 분석가는 이미 존재하는 데이터를 SQL 혹은 Python을 통해 추출하고 리포팅 혹은 머신러닝을 통한 예측을 담당한다.Data Source설명OLTP DatabaseOnLine Transaction Processing 은 온라인 뱅킹,쇼핑, 주문 입력 등 동시에 발생하는 다수의 트랜잭션(데이터베이스 작업의 단위) 처리 유형Enterprise Applications회사 내 데이터 (ex 고객 관계 데이터, 제품 마케팅 세일즈)Third - PartyGoogle Analytics와 같은 외부소스에서 수집되는 데이터Web/Log사용자의 로그데이터 ..

[프로그래머스] 문제 45. 3월에 태어난 여성 회원 목록 출력하기

20240702 풀이-- 코드를 입력하세요SELECT MEMBER_ID , MEMBER_NAME , GENDER , DATE_FORMAT(DATE_OF_BIRTH, '%Y-%m-%d')FROM MEMBER_PROFILEWHERE TLNO IS NOT NULL AND GENDER = 'W' AND MONTH(DATE_OF_BIRTH) = 3ORDER BY MEMBER_ID20240816 풀이-- 생일이 3월-- 여성 회원-- 회원 ID, 이름, 성별, 생년월일 조회-- 전화번호가 NULL이면 제외-- 회원 ID를 기준으로 오름차순SELECT *FROM MEMBER_PROFILE;SELECT MEMBER_ID , MEMBER_NAME , GENDER , DATE..

Code Kata/SQL 2024.08.16

[프로그래머스] 문제 44. 가격대 별 상품 개수 구하기

20240703 풀이-- 코드를 입력하세요SELECT CASE WHEN PRICE >= 0 AND PRICE = 10000 AND PRICE = 20000 AND PRICE = 30000 AND PRICE = 40000 AND PRICE = 50000 AND PRICE = 60000 AND PRICE = 70000 AND PRICE = 80000 AND PRICE = 90000 AND PRICE 20240816 풀이-- 만원 단위의 가격대 별로 상품 개수 출력-- PRICE_GROUP, PRODUCTS-- 가격대를 기준으로 오름차순SELECT *FROM PRODUCT;SELECT FLOOR(PRICE / 10000) * 10000 AS PRICE_GROUP , COUNT(*) AS PRODUCTSF..

Code Kata/SQL 2024.08.16

[프로그래머스] 문제 43. 조건에 맞는 사용자와 총 거래금액 조회하기

20240702풀이SELECT B.USER_ID , B.NICKNAME , SUM(A.PRICE) TOTAL_SALESFROM USED_GOODS_BOARD A INNER JOIN USED_GOODS_USER B ON A.WRITER_ID = B.USER_IDWHERE A.STATUS = 'DONE'GROUP BY 1HAVING SUM(A.PRICE) >= 700000ORDER BY 320240816 풀이-- 거래 완료-- 총 거래 금액 70만원 이상-- 회원 ID, 닉네임, 총거래금액-- 총거래금액을 기준으로 오름차순SELECT *FROM USED_GOODS_BOARD;SELECT *FROM USED_GOODS_USER;SELECT B.USER_ID , B.NICKNAME ..

Code Kata/SQL 2024.08.16

[프로그래머스] 문제 42. 평균 일일 대여 요금 구하기

20240701 풀이-- 코드를 입력하세요SELECT ROUND(AVG(DAILY_FEE), 0) AVERGE_FEEFROM CAR_RENTAL_COMPANY_CARWHERE CAR_TYPE = 'SUV'20240816 풀이-- 자동차 종류 SUV-- 평균 일일 대여 요금-- 컬럼명 'VAERAGE_FEE'-- 소수 첫 번째 자리에서 반올림SELECT *FROM CAR_RENTAL_COMPANY_CAR;SELECT ROUND(AVG(DAILY_FEE)) AS AVERAGE_FEEFROM CAR_RENTAL_COMPANY_CARWHERE CAR_TYPE IN ('SUV') https://school.programmers.co.kr/learn/courses/30/lessons/151136 프로그래머스코드 중..

Code Kata/SQL 2024.08.16

[프로그래머스] 문제 41. 조건에 맞는 도서 리스트 출력하기

20240701 풀이-- 코드를 입력하세요SELECT BOOK_ID , DATE_FORMAT(PUBLISHED_DATE, '%Y-%m-%d') PUBLISHED_DATEFROM BOOKWHERE CATEGORY = '인문' AND YEAR(PUBLISHED_DATE) = 2021ORDER BY 220240816 풀이-- 2021년 출판-- 인문 카테고리-- 도서 ID, 출판일-- 출판일 기준으로 오름차순SELECT *FROM BOOK;SELECT BOOK_ID , DATE_FORMAT(PUBLISHED_DATE, '%Y-%m-%d') AS PUBLISHED_DATEFROM BOOKWHERE CATEGORY IN ('인문') AND YEAR(PUBLISHED_DATE) = 2021ORDER..

Code Kata/SQL 2024.08.16