Python 46

[온라인강의] 데이터 전처리 - Pandas

숙제 1import seaborn as snsiris_data = sns.load_dataset('iris')iris_data 문제 1 'species' 열 값이 'setosa'인 데이터 선택하기# Q1. 정답a = iris_data[iris_data['species'] == 'setosa']a.head() 문제 2 10부터 20까지의 행과 1부터 3까지의 열 선택하기# Q2. 정답iris_data.iloc[10:21, 1:4] 숙제 2import seaborn as snstips_data = sns.load_dataset('tips')tips_data 문제 1 total_bill이 30 이상인 데이터만 선택하기# Q1. 정답c = tips_data[tips_data['total_bill'] >= 30]..

[TIL] Python 챌린지 - 1회차

1. 웹사이트구분 정적 웹사이트 동적 웹사이트 콘텐츠 고정된 HTML 파일로 구성되어 있어 모든 사용자에게 동일한 내용을 보여줌사용자 요청에 따라 실시간으로 생성되어 개인화된 내용을 제공 할 수 있음 서버 처리 서버는 단순히 미리 작성된 파일을 전송함서버에서 스크립트를 실행하여 동적으로 콘텐츠를 생성 데이터베이스 일반적으로 데이터베이스를 사용하지 않음대부분 데이터베이스를 사용하여 정보를 저장하고 검색 상호작용 사용자와의 상호작용이 제한적사용자와 다양한 방식으로 상호작용할 수 있음 로딩 속도 일반적으로 빠름정적 웹사이트보다 상대적으로 느릴 수 있음 2. 웹 크롤링 기호: '뉴스 헤드라인 수집'- Requests 라이브러리 Python용 HTTP 라이브러리를 말한다. HTTP는 웹 브라우저와 서버 간 데이터..

[TIL] 데이터 전처리 - Pandas(3)

6. 데이터 병합- concat데이터프레임을 위아래로 혹은 좌우로 연결할 수 있는 함수이다. axis를 통해 연결하고자 하는 축(방향)을 지정하고 기본값은 0으로 되어있어 위아래로 연결다. 1로 설정하면 좌우로 연결이 가능하다. ignore_index의 기본값은 False이며, 연결된 결과 데이터프레임의 인덱스를 유지한다. True로 설정하면 새로운 인덱스를 생성한다.import pandas as pddf1 = pd.DataFrame({'A': ['A0', 'A1', 'A2'], 'B': ['B0', 'B1', 'B2']})df2 = pd.DataFrame({'A': ['A3', 'A4', 'A5'], 'B': ['B3', 'B4', 'B5']})# 위아래로 데이터프레임 연결result_vertical ..

[TIL] 데이터 전처리 - Pandas(2)

4. 데이터 확인하기- 데이터 확인data.head() # head()은 기본 5개 행에 대한 데이터를 보여줌data.head(3) # ()안에 숫자만큼 데이터를 보여줌data.info() # 데이터 정보 파악(인덱스, 컬럼명, 컬럼의 데이터 개수, 데이터 타입), null 값을 확인data.describe() # 데이터의 기초통계량을 확인(숫자값에 대해서만 확인이 가능) - 결측치, 중복, 이상치 확인df.isnull().sum() # 결측치 확인, 결측치 갯수 확인도 가능df.dropna() # 결측치 제거df.duplicated(subset=['컬럼1', '컬럼2', '컬럼3']) # 중복 데이터 확인df.drop_duplicates(subset=['컬럼1', '컬럼2', '컬럼3']) # 중복 데..

[TIL] 데이터 전처리 - Pandas(1)

1. 데이터 전처리 데이터 분석을 위해 수집된 데이터들을 방향성을 가공하며 내용물을 파악하는 과정을 말한다. 2. Pandas- Pandas란? 데이터를 조작하고 쉽게 분석할 수 있게 도와주는 라이브러리이다. Pandas에서 사용되는 대표적인 데이터 오브젝트는 Series, DataFrame 2가지 이다.import pandas as pd# 에러날 경우 !pip install pandas구분 Excel Pandas 자동화와 프로그래밍 기능 다양한 라이브러리를 사용하여 데이터를 불러오고 변환하며 분석할 수 있음반복적이고 복잡한 작업을 자동화할 수 있음시각적 사용자 인터페이스를 통해 데이터를 다루는 스프레드시트 프로그램으로 작업은 주로 수동으로 수행되며, 고급 기능을 프로그래밍적으로 확장하기 어려움 대용..

[TIL] Python 베이직 - 1회차

1. 변수의 주소, 타입, 메모리 확인하기 모든 변수는 메모리를 할당받고, 주소값을 갖게 된다. 파이썬에서 기본 자료형(int, float, str 등)은 불변 객체이기 때문에 직접적으로 메모리 주소를 공유하게 할 수는 없다. int 형식은 유동적으로 변하고 float는 고정이다. str 형식은 49바이트를 할당받고 시작한다.import sys# 변수 선언int_var = 1float_var = 3.14str_var = "Hello"# 변수의 자료형 출력print(f"Type of int_var: {type(int_var)}")print(f"Type of float_var: {type(float_var)}")print(f"Type of str_var: {type(str_var)}")# 변수의 메모리 주소..

[라이브세션] 파이썬 기초 3회차

문제 1 전자 상거래 플랫폼에서 고객의 평균 주문을 계산해야 합니다. 이를 위해 숫자 리스트의 평균을 계산하는 방법을 연습합니다. 주어진 숫자 리스트의 평균을 계산하는 함수를 작성하세요.# 예시 데이터numbers = [10, 20, 30, 40, 50]def calculate_avg(numbers): total_avg = sum(numbers)/len(numbers) return total_avgtotal_avg = calculate_avg(numbers)print("숫자들의 평균:", total_avg) 문제 2 기상청에서는 하루 동안의, 가장 높았던 기온과 가장 낮았던 기온을 확인하고 일교차를 보고하고자 합니다. 하루 동안 기록된 기온 목록을 받아, 가장 낮은 기온과 가장 높은 기..

[TIL] 데이터 분석 파이썬 종합반 - 5주차(2)

6. glob 사용하기 glob함수는 파일 시스템에서 파일을 찾을 때 사용되는 유용한 도구이다. 이 함수는 파일 이름의 패턴 매칭을 통해 파일을 검색하고, 일치하는 파일들의 리스트를 반환한다. 주로 파일 이름이나 확장자에 따라 파일을 필터링하는 데 사용된다.import glob# 현재 경로의 모든 파일을 찾기file_list1 = glob.glob('*')-----------------------------------------------------------------------------------------------# 단일 파일 패턴으로 파일을 찾기file_list2 = glob.glob('drive')-----------------------------------------------------..

[TIL] 데이터 분석 파이썬 종합반 - 5주차(1)

1. 파일 불러오기 및 저장하기- 파일 확장자 및 파일 불러오기파일 확장자파일 불러오기CSV 파일import pandas as pd df = pd.read_csv('파일 경로')Excel 파일import pandas as pd df = pd.read_excel('파일 경로')JSON 파일import pandas as pd df = pd.read_json('파일 경로')텍스트 파일import pandas as pd df = pd.read_csv('파일 경로', delimiter='\t') # 만약 탭으로 구분되어 있다면 delimiter='\t'를 사용합니다. - 파일 저장하기import pandas as pddata = { 'Name': ['John', 'Emily', 'Michael'], '..

[TIL] 데이터 분석 파이썬 종합반 - 4주차

1. 함수 함수란 입력을 받아 원하는 처리를 한 후 출력을 내보내는 일련의 작업을 수행하는 코드 블록이다. 프로그램 내에서 특정한 기능을 수행하기 위해 코드를 논리적으로 그룹화하여 재사용 가능한 형태로 정의한다. 함수는 코드 재사용, 모듈화, 유지 보수 용이성, 가독성 향상과 같은 이유로 필요하다.# 함수 구조def 함수이름(매개변수1, 매개변수2, ...): # 함수 내부에서 수행할 작업 return 결과값 # (선택적) 함수의 결과를 반환-----------------------------------------------------------------------------------------------# 함수 정의def greet(name): message = "Hello, " ..

[TIL] 데이터 분석 파이썬 종합반 - 3주차

1. 조건문 조건문이란 프로그램의 흐름을 제어하는 중요한 요소 중 하나로 특정 조건이 참(True)인 경우에만 특정 코드 블록을 실행하도록 한다. 파이썬에서 조건문은 if, elif, else 키워드를 사용하여 구성된다. 조건문에서는 들여 쓰기 및 띄어쓰기가 매우 중요하다. 파이썬은 들여 쓰기를 통해 블록을 식별하기 때문에 들여 쓰기가 제대로 이루어지지 않으면 오류가 발생한다. 조건문은 중첩해서 사용할 수 있다.x = 10if x > 0: print("양수입니다.") # 조건이 참일 때 실행될 코드elif x 5: print("x는 5보다 큽니다.") if x  2. 반복문 - for문 파이썬은 리스트, 튜플, 문자열 등과 같은 반복 가능한 데이터 타입을 반복문으로 만들 수 있다. 이 작업은..

[TIL] 데이터 분석 파이썬 종합반 - 2주차

1. 리스트 리스트란 파이썬에서 가장 자주 사용되는 데이터 구조 중 하나이다. 대괄호 [ ]를 사용해 만들 수 있다. 여러 값을 순서대로 담을 수 있고 각 값은 쉼표로 구분된다.my_list = [1, 2, 3, 4, 5]print(my_list) # 출력: [1, 2, 3, 4, 5]-----------------------------------------------------------------------------------------------# 첫 번째 요소에 접근하기first_number = numbers[0]print("First number:", first_number)------------------------------------------------------------------..

[TIL] 데이터 분석 파이썬 종합반 - 1주차

1. print 함수 파이썬의 출력문 중 가장 많이 사용하는 함수로 화면에 값을 출력하는 데 사용한다. print() 괄호 안에 출력하고자 하는 값을 넣어주면 되고 여러 값을 출력하고 싶으면 쉼표(,)로 구분하여 값을 넣어주면 된다.print("Hello, World!") # 문자를 파이썬에서 사용할 땐 “”(따옴표) 사이에 문자를 작성-----------------------------------------------------------------------------------------------x = 10 # 변수란, 무언가를 담고 있는 바구니print(x)-----------------------------------------------------------------------------..

[TIL] Python 정리

1. 계산 함수 - solution 값을 입력받아 값을 반환하는 함수로 주어진 제한 사항 내에서 정확하게 작동한다.def solution(num1, num2): return num1 // num2 # 몫 구하기는 //활용-----------------------------------------------------------------------------------------------# 예시 1print(solution(10, 3)) # 출력: 7# 예시 2print(solution(-50000, 50000)) # 출력: -100000# 예시 3print(solution(12345, 12345)) # 출력: 0 - rnage 특정 구간의 숫자 범위를 만들어주는 함수이다.def solutio..

[TIL] 파이썬 문법 기초 - 1주차 심화

1. 튜플, 집합- 튜플(tuple)  리스트와 비슷하지만 불변인 자료형이다. 순서가 존재.a = (1,2,3)print(a[0])-----------------------------------------------------------------------------------------------# 아래와 같은 작업은 불가능합니다!a = (1,2,3)a[0] = 99-----------------------------------------------------------------------------------------------a_dict = [('bob','24'),('john','29'),('smith','30')] - 집합(set) 중복 제거 가능.a = [1,2,3,4,5,3,4,2,1,..