Today I Learned (TIL) 71

[TIL] 데이터 분석 파이썬 종합반 - 1주차

1. print 함수 파이썬의 출력문 중 가장 많이 사용하는 함수로 화면에 값을 출력하는 데 사용한다. print() 괄호 안에 출력하고자 하는 값을 넣어주면 되고 여러 값을 출력하고 싶으면 쉼표(,)로 구분하여 값을 넣어주면 된다.print("Hello, World!") # 문자를 파이썬에서 사용할 땐 “”(따옴표) 사이에 문자를 작성-----------------------------------------------------------------------------------------------x = 10 # 변수란, 무언가를 담고 있는 바구니print(x)-----------------------------------------------------------------------------..

[TIL] 데이터 리터러시 - 1주차(2)

4. 지표 설정- 지표 특정 목표나 성과를 측정하기 위한 구체적이고 측정 가능한 기준으로 목표 달성도를 평가하고 전략적 결정에 필요한 핵심 정보를 제공한다. 정의한 문제에 대해 정확하게 파악하기 위해 필요하다. '어떤 문제를 풀고자 하는가?'를 정의했다면 '어떤 결과를 기대하는가?'에 대한 정량화된 기준을 세워야 한다.-  Active User (활성유저) 1) Active User (활성유저)의 역할 ▷ 활성 유저에 대한 정의에 따라 전략과 방향이 달라짐 ▷ 활성 유저에 대한 정의로 '이탈 유저'가 정의됨 ▷ 투자를 위한 서비스 지표에 중요한 역할을 하게 됨 2) Active User (활성유저) 설정해 보기 ▷ 사이트 진입 유저 ▷ 사이트 진입 후 추가 행동을 한 유저 ▷ 최종 액션까지 수행한 유저 ..

[TIL] 데이터 리터러시 - 1주차(1)

1. 데이터 리터러시- 데이터 리터러시의 정의 데이터를 올바르게 읽고 이해하여 이를 통해 비판적으로 분석하여 결과를 의사소통에 활용할 수 있는 능력을 말한다. 데이터 리터러시는 올바른 질문을 던질 수 있도록 만들어 준다.- 데이터 분석에 대한 착각1) 데이터 분석 학습에 대한 일반적인 접근 데이터 분석을 배우기 위해 SQL, Python, Tableau 등을 학습하지만 실전에서 사용하려고 하면 잘 되지 않음2) 데이터 분석에 대한 착각 ▷ 데이터를 잘 분석하면 문제, 목적, 결론이 나올 것이라고 생각 ▷ 데이터를 잘 가공하면 유용한 정보를 얻을 수 있다고 생각 ▷ 분석에 실패하면 방법론, 스킬이 부족한 것이라고 생각 - 데이터 리터러시가 필요한 이유 데이터 분석 접근법은 크게 '문제 및 가설정의(생각)'..

[TIL] Python 정리

1. 계산 함수 - solution 값을 입력받아 값을 반환하는 함수로 주어진 제한 사항 내에서 정확하게 작동한다.def solution(num1, num2): return num1 // num2 # 몫 구하기는 //활용-----------------------------------------------------------------------------------------------# 예시 1print(solution(10, 3)) # 출력: 7# 예시 2print(solution(-50000, 50000)) # 출력: -100000# 예시 3print(solution(12345, 12345)) # 출력: 0 - rnage 특정 구간의 숫자 범위를 만들어주는 함수이다.def solutio..

[TIL] 엑셀보다 쉽고 빠른 SQL - 5주차

1. 조회한 데이터에 아무 값이 없다면  또는 상식적이지 않은 값을 가지고 있다면 어떻게 해야할까?- 데이터가 없을 때의 연산 결과 변화 케이스 1) 없는 값을 제외해주기 2) 다른 값을 대신 사용하기 ▷ 다른 값이 있을 때 조건문 이용하기 : if(rating>=1, rating, 대체값) ▷ null 값일 때 : coalesce(age, 대체값)- 데이터가 상식적이지 않은 값을 가지고 있을 때 1) 조건문으로 값의 범위를 지정하기 2. 업무 시작을 단축시켜 주는 마법의 문법 (Window Function - RANK, SUM)- Window Function의 사례와 기본 구조 Window Function은 각 행의 관계를 정의하기 위한 함수로 그룹 내의 연산을 쉽게 만들어 준다. 기본 SQL 구조로 ..

[TIL] 엑셀보다 쉽고 빠른 SQL - 4주차

1. 여러번의 연산을 한 번의 SQL문으로 수행하기(Subquery)- Subqury가 필요한 경우 1) 여러번의 연산을 수행해야 할 때 2) 조건문에 연산 결과를 사용해야 할 때 3) 조건에  Query 결과를 사용하고 싶을 때- Subqury 사용 가능한 곳 1) SELECT 절 (스칼라 서브쿼리): 특정 열의 값을 계산하거나 변환할 수 있음 2) FROM 절 (인라인 뷰): 임시 테이블처럼 사용할 수 있음. 사용시 반드시 별칭을 정해줘야 함 3) WHERE 절 (중첩 서브쿼리): 조건을 필터링할 수 있음 4) HAVING 절: 그룹화된 결과를 필터링할 수 있음 5) ORDER BY 절 6) INSERT 문의 VALUES 절 7) UPDATE 문의 SET 절 2. 필요한 데이터가 서로 다른 테이블에 ..

[TIL] 파이썬 문법 기초 - 1주차 심화

1. 튜플, 집합- 튜플(tuple)  리스트와 비슷하지만 불변인 자료형이다. 순서가 존재.a = (1,2,3)print(a[0])-----------------------------------------------------------------------------------------------# 아래와 같은 작업은 불가능합니다!a = (1,2,3)a[0] = 99-----------------------------------------------------------------------------------------------a_dict = [('bob','24'),('john','29'),('smith','30')] - 집합(set) 중복 제거 가능.a = [1,2,3,4,5,3,4,2,1,..

[TIL] 파이썬 문법 기초 - 1주차 기초

1. 변수 선언과 자료형- 변수 선언a = 3 # 3을 a에 넣는다.print(a)b = a # a에 들어 있는 값인 3을 b에 넣는다.print(b)a = 5 # a에 5라는 새로운 값을 넣는다.print(a, b) # 5 3 - 숫자형 자료형a = 7b = 2a+b # 9 a-b # 5a*b # 14a/b # 3.5a+3*b # 13 (여러 연산을 한 줄에 할 경우 사칙연산의 순서대로!)(a+3)*b # 20 (소괄호를 이용해서 먼저 계산할 부분을 표시해줄 수 있어요!)---------------------------------------------------------------------------------------..

[TIL] 엑셀보다 쉽고 빠른 SQL - 3주차

1. 업무 필요한 문자 포맷이 다를 때, SQL로 가공하기 (REPLACE, SUBSTRING, CONCAT)- Query 결과를 바로 사용할 수 없을 때 함수 사용 1) 특정 문자를 다른 문자로 바꾸기replace(바꿀 컬럼, 현재 값, 바꿀 값)  2) 원하는 문자만 남기기substr(조회 할 컬럼, 시작 위치, 글자 수)  3) 여러 컬럼의 문자 합치기(붙일 수 있는 문자의 종류는 컬럼, 한글, 영어, 숫자, 기타 특수문자가 있다.)concat(붙이고 싶은 값1, 붙이고 싶은 값2, 붙이고 싶은 값3, ~~~) 2. 조건에 따라 포맷을 다르게 변경해야 한다면(IF, CASE)- 범주별로 다른 연산(계산, 문자 바꾸기) 적용하기 1) 조건에 따라 다른 방법을 적용하고 싶을 때if(조건, 조건을 충족할..

[TIL] 엑셀보다 쉽고 빠른 SQL - 2주차

1.  엑셀 대신 SQL로 한번에 계산하기 (SUM, AVERAGE, COUNT, MIN, MAX) - 숫자 연산 기호는 SQL에서도 사용- 숫자 연산 종류연산자설명+더하기-빼기*곱하기/나누기 - 합계와 평균 함수 사용 1) 합계: SUM(컬럼) 2) 평균: AVG(컬럼)- 전체 데이터 갯수 구하기 1) 데이터 갯수: COUNT(컬럼 혹은 * 혹은 1 사용) 2) 중복 제거: DISTINCT- 데이터의 최솟값과 최댓값 1) 최솟값: MIN(컬럼) 2) 최댓값: MAX(컬럼) 2. GROUP BY로 범주별 연산 한 번에 끝내기 - GROUP BY의 개념 원하는 것의 값을 내기 위해 WHERE절을 사용해 수십개의 쿼리를 작성하게 되면 비효율적이므로 여러번의 Query 없이, 카테고리를 지정하여 수식 함수로 ..

[TIL] 엑셀보다 쉽고 빠른 SQL - 1주차

1. 테이블과 컬럼- 데이터 베이스 데이터 베이스는 '데이터가 저장되어 있는 큰 폴더를 말한다.- 테이블과 컬럼 테이블은 엑셀과 유사한 구조로 데이터를 갖고 있고, 각 열을 '컬럼' 혹은 '필드'부른다. 2. SQL 데이터 조회하기 (SELECT, FROM) - SELECT / FROM 문의 개념 가장 기본적인 사항은 '어느 테이블에서 데이터를 가져올까'를 생각하는 것이다. 원하는 곳에서 데이터를 가져오는 기본 명령어는 SELECT, FROM이다. SELECT는 데이터를 가져오는 기본 명령어로, 데이터를 조회하는 모든 Query에 사용 되고 FROM은 데이터를 가져올 테이블을 특정해주는 문법이다. 3. 필요한 항목만 뽑아서 사용하기 모든 항목을 조회하기 위해서는 '*'을 사용하고 필요한 항목만 뽑아오고 ..