분류 전체보기 208

[프로그래머스] 문제 3. 중복 제거하기

20240626 풀이SELECT COUNT(DISTINCT NAME) countFROM ANIMAL_INSWHERE NAME IS NOT NULL20240808 풀이-- 동물의 이름 개수-- 이름이 NULL은 집계하지 않고 중복은 하나로SELECT *FROM ANIMAL_INS;SELECT COUNT(DISTINCT NAME)FROM ANIMAL_INS;-- COUNT(*)은 NULL 값을 포함-- COUNT(column)은 NULL 값을 제외20250121 풀이-- 동물의 이름 몇 개인지 조회-- 이름이 NULL인 경우 제외-- 중복 이름은 하나로SELECT COUNT(DISTINCT(NAME)) AS COUNTFROM ANIMAL_INSWHERE NAME IS NOT NULL; https://scho..

Code Kata/SQL 2024.08.08

[프로그래머스] 문제 2. 역순 정렬하기

20240626 풀이SELECT NAME , DATETIMEFROM ANIMAL_INSORDER BY ANIMAL_ID DESC20240808 풀이-- 동물의 이름, 보호 시작일 조회-- 동물 아이디 역순으로SELECT NAME , DATETIMEFROM ANIMAL_INSORDER BY ANIMAL_ID DESC;20250120 풀이-- 동물의 이름과 보호 시작일 조회-- ANIMAL_ID 역순SELECT NAME , DATETIMEFROM ANIMAL_INSORDER BY ANIMAL_ID DESC; https://school.programmers.co.kr/learn/courses/30/lessons/59035 프로그래머스코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로..

Code Kata/SQL 2024.08.08

[프로그래머스] 문제 1. 이름이 있는 동물의 아이디

20240625 풀이SELECT ANIMAL_IDFROM ANIMAL_INSWHERE NAME IS NOT NULL20240808 풀이SELECT *FROM ANIMAL_INS;SELECT ANIMAL_IDFROM ANIMAL_INSWHERE NAME NOT IN ('NULL')ORDER BY ANIMAL_ID;20250120 풀이SELECT ANIMAL_IDFROM ANIMAL_INSWHERE NAME IS NOT NULLORDER BY ANIMAL_ID; https://school.programmers.co.kr/learn/courses/30/lessons/59407 프로그래머스코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 ..

Code Kata/SQL 2024.08.08

[TIL] Python 챌린지 - 6회차

1. Streamlit 소개 Streamlit은 데이터 과학자와 머신러닝 엔지니어를 위한 오픈소스 Python 라이브러리이다. 복잡한 데이터 애플리케이션을 빠르고 쉽게 만들 수 있도록 설계되었으며 단순한 Pyhon 스크립트 만으로도 대화형 웹 애플리케이션을 만들 수 있다. 2. Streamlit 설치 및 기본 구조pip install streamlitimport streamlit as stdef main(): st.title("My Streamlit App") # 앱의 내용을 여기에 추가합니다if __name__ == "__main__": main() 3. Streamlit 주요 UI 요소 - 텍스트 출력import streamlit as stst.title("Streamlit 텍스트 출..

[아티클 스터디] 일이 되게 만드는 사람, 주니어 PM 3인의 커리어 이야기

1. PM '프로덕트를 담당하는 사람' 담당하고 있는 프로덕트의 고쳐야 할 지표를 찾아 문제 해결 방향성을 잡고 이후 초안을 만들어 검토 후 배포한다. PM은 해당 프로덕트에 책임을 지고 계속 발전시켜야 하는 주인의식이 중요한 직무이다. 2. PM의 필요한 역량 첫째, 커뮤니케이션을 잘하는 사람 둘째, 주도적으로 일하는 사람 셋째, 세상의 니즈를 파악할 수 있는 사람 3. 있으면 더 좋다! 첫째, 문서화 능력 둘째, 개발 지식 https://spartacodingclub.kr/blog/junior-pm-interview 일이 되게 만드는 사람, 주니어 PM 3인의 커리어 이야기어떻게 PM을 꿈꾸게 되었는지부터 PM을 준비하는 사람들을 위한 조언까지, 팀스파르타 주니어PM 3인의 커리어 이야기를 확인해 보..

아티클스터디 2024.08.07

[TIL] Python 챌린지 - 5회차

1. 객체 지향 프로그래밍(OOP)이란? 객체 지향 프로그래밍이란 코드를 객체라는 논리적 단위로 구조화하는 프로그래밍 패러다임을 말한다. 객체는 데이터(속성)와 그 데이터를 처리하는 메서드(함수)를 하나의 단위로 묶은 것을 말한다. OOP는 데이터와 메서드를 하나의 단위로 묶어 외부로부터 보호하는 '캡슐화', 기존 클래스의 특성을 새로운 클래스가 물려받을 수 있는 '상속', 같은 이름의 메서드가 다른 기능을 수행할 수 있는 '다형성'과 같은 세 가지의 주요 특징을 가지고 있다. 이러한 특징들은 코드의 재사용성을 높이고 유지보수를 용이하게 만든다. 2. OOP로 리팩토링하는 이유- 코드 구조화 관련 기능을 하나의 클래스로 묶어 코드를 더 논리적으로 구조화할 수 있다.- 재사용성 클래스를 만들면 다른 프로젝..

[TIL] Python 베이직 - 6회차

1. 기초 통계 분석- describe수치형 데이터범주형 데이터count데이터 개수count데이터 개수mean평균unique고유 데이터 값 개수std표준편차top가장 많이 출현한 데이터 수min최솟값freq가장 많이 출현한 데이터 빈도max최대값   - info 각 컬럼변 데이터 타입 및 결측치 확인df.info() - 상관관계 분석 변수간 선형 상관관계의 강도를 -1 ~ 1 사이의 값으로 계산해서 측정한다.df_num.corr()# 'pearson' (기본값): 표준 피어슨 상관 계수를 계산# 선형관계(이상치가 적고 정규분포에 가까울때)가 있을때 유용--------------------------------------------------------------------------------------..

[TIL] 통계학 기초 - 6주차

1. 재현 가능성 재현 가능성이란 동일한 연구나 실험을 반복했을 때 일관된 결과가 나오는지 여부를 말하는 것으로 연구의 신뢰성을 높이는 중요한 요소이다. 결과가 재현되지 않는다면 해당 가설의 신뢰도가 떨어진다. 최근 'p값을 사용하지 않는 것이 좋다'와 '유의 수준을 0.05에서 변경하는 것이 좋다' 두 가지로 값에 대한 논쟁이 두드러지고 있다.- 재현성 위기 원인 1) 실험 조건을 동일하게 조성하기 어려움 완전 동일하게 다시 똑같은 실험을 수행하는 것이 쉽지 않으며 가설검정 자체도 100% 검정력을 가진 것이 아니기 때문에 오차가 나타날 수 있음 2) 가설 검정 사용방법에 있어서 잘못됨 p값이 0.05가 유도되게끔 조작하는 것이 가능(p해킹)하며 실제로는 통계적으로 아무 의미가 없음에도 의미가 있다고 ..

[TIL] 통계학 기초 - 5주차

1. 피어슨 상관계수 두 연속형 변수 간의 선형 관계를 측정하는 지표로 -1에서 1 사이의 값을 가진다. 1은 완전한 양의 선형, -1은 완전한 음의 선형, 0은 선형 관계가 없음을 의미한다. 공부 시간과 시험 점수 간의 선형적인 관계가 예상될 때 사용하며 비선형 관계에서는 사용할 수 없다.import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom scipy.stats import pearsonr# 예시 데이터 생성np.random.seed(0)study_hours = np.random.rand(100) * 10exam_scores = 3 * study_hours + np.random.randn(..

[WIL] 주간회고 6주차

지난주 금요일 오후에 튜터님 찾아뵙고 내용물이 폭포처럼 불어났다 말씀해 주신 부분 최대한 받아 적고 다시 정리하는데 진짜 많은 피드백을 해주셔서 너무 놀랍고 감사했다 (●'ᴗ'●)ノ♥  많은 조언과 방향성을 말씀해 주셨지만 너무 어려워서 시도 못한 게 더 많다ㅎ..ㅠ 아쉽지만 실력 더 키워서 도전해 보는 걸루  프로젝트는 마무리 됐지만 내 자격증은 아직 진행 중 ㅎ 해야 되는 게 너무 많아서 쉽사리 손에 잡히지 않지만 주말 빡공 가보자고 백수가 5만원이나 냈으니 무적권 붙어야 한다...  취업지원금 상담 댕기오고 팀 바꾸고 바쁜 그묘일 지금 통계학 기초 4주차 들었는데 하나도 이해 못 했다 다시 들어도 이해 못 할 거 같은데 어카죠... (•̥́_•ૅू˳)

[TIL] 통계학 기초 - 4주차

1. 단순선형회귀 하나의 독립 변수(X)와 하나의 종속 변수(Y)간의 관계를 직선으로 모델링하는 방법으로 간단하고 해석이 용이하여 데이터가 선형적이지 않을 경우 적합하지 않다. 독립 변수의 변화에 따라 종속 변수가 어떻게 변화하는지 설명하고 예측하는 것이 특징이다. 단순선형회귀 회귀식은 Y = β0 + β1X  β0 (β0는 절편, β1는 기울기)이다. import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.linear_model import LinearRegressionfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import me..

[TIL] Python 챌린지 - 3, 4회차

1. 프로젝트 개요- 목적 Selenium과 XPath를 사용하여 네이버 뉴스 사이트에서 기사 목록과 내용을 수집- 대상 사이트 네이버 뉴스 IT/과학 섹션- 사용 기술 Python, Selenium WebDriver, XPath- 결과물 뉴스 기사 제목, 내용, 날짜, URL 수집 2. 환경 설정# 필요한 라이브러리 임포트 및 WebDriver 설정!pip install seleniumfrom selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDriverWai..

[TIL] 통계학 기초 - 3주차

1. A/B 검정 두 버전(A와 B) 중 어느 것이 더 효과적인지 평가하기 위해 사용되는 검정방법이다. 사용자들을 두 그룹으로 나눠 각 그룹에 다른 버전을 제공한 후 반응을 비교하는 것으로 마케팅, 웹사이트 디자인 등에서 많이 사용된다.  두 그룹 간의 변화가 우연이 아닌 통계적으로 유의미한지를 확인하는 것으로 일반적으로 전환율, 클릭률, 구매수, 방문 기간, 방문한 페이지 수, 특정 페이지 방문 여부, 매출 등의 지표를 통해 비교한다.import numpy as npimport scipy.stats as stats# 가정된 전환율 데이터group_a = np.random.binomial(1, 0.30, 100) # 30% 전환율group_b = np.random.binomial(1, 0.45, 100..

[TIL] 통계학 기초 - 2주차(2)

4. 정규분포 종 모양의 대칭 분포로 대부분의 데이터가 평균 주위에 몰려있는 분포를 말한다. 평균을 중심으로 좌우 대칭이며 평균에서 멀어질수록 데이터의 빈도가 감소한다. 키와 몸무게, 시험점수 등과 같은 상황에서 관찰된다. 5. 긴 꼬리 분포 대부분의 데이터가 분포의 한쪽 끝에 몰려있고 반대쪽은 긴 꼬리가 이어지는 형태의 분포이다. 정규분포와 달리 대칭적이지 않고 비대칭적인 것이 특징이다. 특정한 하나의 분포를 의미하지 않으며 여러 종류의 분포(파레토 분포, 지프의 법칙, 멱함수)를 포함할 수 있다. 소득분포, 온라인쇼핑, 도서판매(소량의 베스트셀러 도서 - 다량의 비인기 도서)와 같은 일부가 전체적으로 큰 영향을 미치는 경우에 볼 수 있다. # 긴 꼬리 분포 생성 (예: 소득 데이터)long_tail ..

[TIL] 통계학 기초 - 2주차(1)

1. 모집단과 표본- 모집단과 표본 모집단이란 관심의 대상이 되는 전체 집단을 말하고 표본이란 이 모집단에서 추출한 일부를 말한다. 표본을 사용하는 이유는 모든 데이터를 수집하는 것은 물리적으로 불가능한 경우가 많고 비용과 시간을 절약할 수 있다는 현실적인 제약 때문이다.- 대표성 잘 설계된 표본은 모집단의 특성을 반영할 수 있다. 이를 통해 표본에서 얻은 결과를 모집단 전체에 일반화할 수 있다. 무작위로 표본을 추출하면 편향을 최소화하고 모집단의 다양한 특성을 포함할 수 있다.- 데이터 관리 및 모델 검증 큰 데이터셋은 분석에 많은 컴퓨팅 자원이 필요할 수 있지만 작은 표본은 이런 부담을 줄여준다. 또한, 작은 표본은 데이터 품질을 더 쉽게 관리하고 오류나 이상값을 식별하여 수정할 수 있다. 표본 데이..