내일배움캠프 106

[TIL] Python 베이직 - 3회차

1. 함수란? 코드 재사용성, 가독성 향상, 유지보수 용이하여 함수를 사용한다.# 함수의 기본 구조def add(a, b): return a + b result = add(3, 5)print(result) # 출력: 8-----------------------------------------------------------------------------------------------# 입력이 없는 구조: 고정된 결괏값이나 특정 동작을 수행할 수 있다.def say(): return 'Hi' greeting = say()print(greeting) # 출력: Hi---------------------------------------------------------------..

[TIL] SQL 챌린지 - 3회차

1. 자료형- Python의 기본자료형 문자열, 숫자형, 리스트, 딕셔너리, 튜플- SQL의 기본자료형 문자열, 숫자형, 날짜 2. 숫자 자료형- 비트와 바이트 - 정수형 정수형 자료형은 AUTO_INCREMENT 제약조건을 이용하여 ID를 생성하는데 유용하다.구분범위저장크기특징 TINYINT Signed: -128 ~ 127Unsigned: 0 ~ 2551byte매우 작은 정수 값을 저장하며 메모리 사용 최소화 SMALLINT Signed: -32,768 ~ 32,767Unsigned: 0 ~ 65,5352bytes작은 정수 값 MEDIUMINT Signed: - 800만 ~ 800만Unsigned: 0 ~ 1600만3bytes중간 크기 정수 값 INT Signed: 약 - 20억 ~ 20억*Unsig..

[TIL] 데이터 시각화 - Matplotlib

1. 데이터 시각화의 목적- 데이터 시각화가 중요한 이유 분석된 결과에 따라 다양한 의사결정이 이루어지는데 이때, 전달하고자 하는 목적을 시각화된 자료와 함께 전달한다면 큰 설득력을 갖출 수 있다.- 데이터 시각화의 목적 1) 패턴 발견 및 이해 데이터 시각화는 데이터 내의 숨겨진 패턴을 발견하고 이해하는데 도움을 준다. 그래프나 차트를 통해 데이터의 특징을 시각적으로 파악할 수 있다.사례시각화시간에 따른 매출 추이 분석Line지역별 매출 비교 분석지도제품 카테고리별 매출 분석막대 그래프, 원형 차트고객 구매 패턴 분석히스토그램, Box Plot  2) 의사 결정 지원 시각화는 복잡한 데이터를 이해하고 결정을 내리는 데 도움을 준다. 시각화를 통해 정보를 명확하게 전달해서 의사 결정 과정을 지원한다.사례..

[TIL] SQL 챌린지 - 2회차

1. KEY- 관계형 데이터베이스 KEY 1) 식별자: 데이터베이스 설계 단계에서 사용하는 용어로 각 행을 고유하게 식별할 수 있는 모든 속성 혹은 속성 조합을 나타냄 2) 기본키: 각 행을 고유하게 식별하는 데 사용되는 선택된 식별자로 테이블 간의 관계(JOIN)를 기술하기 위해 사용구분설명특징 기본 키(Primary Key) 각 행을 고유하게 식별하게 사용되는 하나 이상의 컬럼한 테이블에는 하나의 키만 존재NULL 값을 가질 수 없음각 행에 고유한 값 외래 키(Foreign Key) 한 테이블의 컬럼이 다른 키의 기본키를 참조하는데 사용되는 컬럼부모 테이블의 기본 키와 동일제약조건을 통해 참조 무결성을 유지할 수 있음 2. 테이블 생성하기 (DDL) 데이블을 생성할 때 컬럼별로 제약조건을 설정할 수 ..

[WIL] 주간회고 4주차

Python 베이직반 신청해서 들었는데 공통 학습 때 배운 거 제외하고 베이직한 부분에 대해 학습할 거라고 생각했는딩 매우 동일한 내용이라 너무 아숩스 다른 선택 강의도 보고 정리하는 중인데 진짜 현웃 터졌다 난 노가다 했눈딩....... 정답만 맞으면 댓지모....  수요일에 시각화 강의를 받았다. 22년도 혼자 울면서 구글링하고 분석하고 결과내고 너무 힘들었던 그때가 떠오르는 순간... 분명 다 해봤던 것들인데 하나도 기억 안 난다ㅋㅋㅋㅋㅋㅋㅋㅋ ˶•⩊•˶ TIL 작성하면서 복습하고 나중에 빨리빨리 진행할 수 있게 강의 다시 들었는데 어떤 차트로 시각화하는 게 더 전달력이 높을지 아직 잘 모르겠다 설명이 써있는데 그래두 아직 몰루  일단 계속 복습 가보자고~~!!

[TIL] Python 챌린지 - 2회차

1. API란? API (Application Programming Interface)란 애플리케이션 간 통신을 위한 규약을 말한다. 웹 API란 HTTP 프로토콜을 통해 데이터를 주고받는 인터페이스를 말한다. 2. HTTP 호출과 API 호출의 차이구분목적응답 형식HTTP 호출일반적인 웹 페이지나 리소스 요청주로 HTML, CSS, JavaScript등의 웹 문서를 반환API 호출특정 기능이나 데이터에 접JSON이나 XML 같은 구조화된 데이터 형식으로 응답 3. JSON(JavaScript Object Notation)이란? 데이터를 저장하고 전송하기 위한 경량의 데이터 교환 형식이다.  사람이 읽고 쓰기 쉬우며 기계가 파싱하고 만들어내기 쉽다. 또한, 언어 독립적이어서 대부분의 프로그래밍 언어에서 ..

[아티클 스터디] 데이터 시각화는 왜 중요할까?

1. 시각정보는 쉽게 알 수 있다 데이터가 시각화되어 전달되면 우리의 뇌는 빠른 속도로 많은 양의 정보를 처리할 수 있다. 트렌트, 패턴, 아웃라이어 등 정보를 쉽게 파악할 수 있는 시각화는 테이블만으로는 찾기 어려운 많은 정보를 직관적으로 이해하고 인사이트를 발견해낼 수 있도록 도와준다. 2. 의사 결정에 도움을 준다 첫째, 데이터 시각화는 많은 양의 데이터와 정보를 담을 수 있다. 의사 결정자들은 한눈에 많은 양의 데이터를 파악하여 큰 그림을 그릴 수 있다. 둘째, 데이터 시각화를 이해하는데 특별한 과학이나 통계 등의 교육이 필요하지 않다. 셋째, 우리의 뇌는 시각화된 정보를 처리하는데 탁월하다. 넷째, 데이터 시각화는 흥미로운 디자인으로 주제에 대한 관심을 끌고, 집중을 보다 오래 유지할 수 있다...

아티클스터디 2024.07.19

[TIL] SQL 베이직 - 2회차

1. SQL 집계함수: COUNT, MAX, MIN, SUM, AVG  SQL의 집계함수는 여러 행 또는 열로부터 하나의 결과값을 반환한다. 집계함수는 전체 데이터를 대상으로 사용하거나, 특정 컬럼을 기준으로 사용할 수 있다. 집계함수는 NULL값 가진 행을 제외 하고 수행하기 때문에 count()를 이용해 행의 개수를 세었을 때 NULL 값을 제외한 수가 반환된다. AVG를 이용할 때도 NULL 값을 제외하고 평균을 구한다.  2. SQL 그룹화: GROUP BY와 HAVING GROUP BY절 집계함수에 그룹(기준) 이 더해진 개념이다. 특정 컬럼을 기준으로 데이터를 요약해서 비교하고 싶을 때 사용한다. SELECT문에 기준컬럼과 집계함수가 둘 다 있는 경우 GROUP BY는 필수이다.# 집계함수,..

[온라인강의] 데이터 시각화 - Matplotlib

숙제 1import seaborn as snsimport matplotlib.pyplot as pltimport pandas as pdflights_data = sns.load_dataset('flights')flights_data 문제 1 연도별 총 승객 수a = flights_data.groupby('year')['passengers'].sum().reset_index()plt.rcParams['font.family'] = 'Malgun Gothic'plt.rc('font', size = 15)plt.figure(figsize = (8, 5))plt.plot(a['year'], a['passengers'], color = 'lightcoral', marker = 'o')plt.xlabel('year'..

[온라인강의] 데이터 전처리 - Pandas

숙제 1import seaborn as snsiris_data = sns.load_dataset('iris')iris_data 문제 1 'species' 열 값이 'setosa'인 데이터 선택하기# Q1. 정답a = iris_data[iris_data['species'] == 'setosa']a.head() 문제 2 10부터 20까지의 행과 1부터 3까지의 열 선택하기# Q2. 정답iris_data.iloc[10:21, 1:4] 숙제 2import seaborn as snstips_data = sns.load_dataset('tips')tips_data 문제 1 total_bill이 30 이상인 데이터만 선택하기# Q1. 정답c = tips_data[tips_data['total_bill'] >= 30]..

[TIL] Python 챌린지 - 1회차

1. 웹사이트구분 정적 웹사이트 동적 웹사이트 콘텐츠 고정된 HTML 파일로 구성되어 있어 모든 사용자에게 동일한 내용을 보여줌사용자 요청에 따라 실시간으로 생성되어 개인화된 내용을 제공 할 수 있음 서버 처리 서버는 단순히 미리 작성된 파일을 전송함서버에서 스크립트를 실행하여 동적으로 콘텐츠를 생성 데이터베이스 일반적으로 데이터베이스를 사용하지 않음대부분 데이터베이스를 사용하여 정보를 저장하고 검색 상호작용 사용자와의 상호작용이 제한적사용자와 다양한 방식으로 상호작용할 수 있음 로딩 속도 일반적으로 빠름정적 웹사이트보다 상대적으로 느릴 수 있음 2. 웹 크롤링 기호: '뉴스 헤드라인 수집'- Requests 라이브러리 Python용 HTTP 라이브러리를 말한다. HTTP는 웹 브라우저와 서버 간 데이터..

[TIL] 데이터 전처리 - Pandas(3)

6. 데이터 병합- concat데이터프레임을 위아래로 혹은 좌우로 연결할 수 있는 함수이다. axis를 통해 연결하고자 하는 축(방향)을 지정하고 기본값은 0으로 되어있어 위아래로 연결다. 1로 설정하면 좌우로 연결이 가능하다. ignore_index의 기본값은 False이며, 연결된 결과 데이터프레임의 인덱스를 유지한다. True로 설정하면 새로운 인덱스를 생성한다.import pandas as pddf1 = pd.DataFrame({'A': ['A0', 'A1', 'A2'], 'B': ['B0', 'B1', 'B2']})df2 = pd.DataFrame({'A': ['A3', 'A4', 'A5'], 'B': ['B3', 'B4', 'B5']})# 위아래로 데이터프레임 연결result_vertical ..

[TIL] 데이터 전처리 - Pandas(2)

4. 데이터 확인하기- 데이터 확인data.head() # head()은 기본 5개 행에 대한 데이터를 보여줌data.head(3) # ()안에 숫자만큼 데이터를 보여줌data.info() # 데이터 정보 파악(인덱스, 컬럼명, 컬럼의 데이터 개수, 데이터 타입), null 값을 확인data.describe() # 데이터의 기초통계량을 확인(숫자값에 대해서만 확인이 가능) - 결측치, 중복, 이상치 확인df.isnull().sum() # 결측치 확인, 결측치 갯수 확인도 가능df.dropna() # 결측치 제거df.duplicated(subset=['컬럼1', '컬럼2', '컬럼3']) # 중복 데이터 확인df.drop_duplicates(subset=['컬럼1', '컬럼2', '컬럼3']) # 중복 데..

[TIL] 데이터 전처리 - Pandas(1)

1. 데이터 전처리 데이터 분석을 위해 수집된 데이터들을 방향성을 가공하며 내용물을 파악하는 과정을 말한다. 2. Pandas- Pandas란? 데이터를 조작하고 쉽게 분석할 수 있게 도와주는 라이브러리이다. Pandas에서 사용되는 대표적인 데이터 오브젝트는 Series, DataFrame 2가지 이다.import pandas as pd# 에러날 경우 !pip install pandas구분 Excel Pandas 자동화와 프로그래밍 기능 다양한 라이브러리를 사용하여 데이터를 불러오고 변환하며 분석할 수 있음반복적이고 복잡한 작업을 자동화할 수 있음시각적 사용자 인터페이스를 통해 데이터를 다루는 스프레드시트 프로그램으로 작업은 주로 수동으로 수행되며, 고급 기능을 프로그래밍적으로 확장하기 어려움 대용..

[TIL] Python 베이직 - 1회차

1. 변수의 주소, 타입, 메모리 확인하기 모든 변수는 메모리를 할당받고, 주소값을 갖게 된다. 파이썬에서 기본 자료형(int, float, str 등)은 불변 객체이기 때문에 직접적으로 메모리 주소를 공유하게 할 수는 없다. int 형식은 유동적으로 변하고 float는 고정이다. str 형식은 49바이트를 할당받고 시작한다.import sys# 변수 선언int_var = 1float_var = 3.14str_var = "Hello"# 변수의 자료형 출력print(f"Type of int_var: {type(int_var)}")print(f"Type of float_var: {type(float_var)}")print(f"Type of str_var: {type(str_var)}")# 변수의 메모리 주소..