Today I Learned (TIL)/Python

[TIL] Python 베이직 - 5회차

신짜린 2024. 7. 30. 17:39

Python 베이직 5회차 타이타닉 실습.html
0.58MB

1. Series 란?

 1차원 배열을 말한다.. 리스트를 시리즈로 정의해서 불러오면 숫자 인덱스를 생성해서 보여준다.

s = pd.Series(['부장', '차장', '대리', '사원', '인턴'])
-----------------------------------------------------------------------------------------------
s = pd.Series([91, 2.5, '스포츠', 4, 5.16])

 

2. DataFrame 란?

 2차원 데이터 구조로 Excel과 같다. 딕셔너리를 이용해서 DataFrame를 만들면 key값이 column이 되어 나타난다.

pd.DataFrame([[1, 2, 3], 
              [4, 5, 6], 
              [7, 8, 9]], columns=['가', '나', '다'])
-----------------------------------------------------------------------------------------------
data = {
    'name': ['Kim', 'Lee', 'Park'], 
    'age': [24, 27, 34], 
    'children': [2, 1, 3]
}
pd.DataFrame(data)

 

3. DataFrame 속성 및 메서드 다루기

 DataFrame 속성이란 데이터를 담고 있는 변수나 데이터의 상태를 확인하는 것으로 뒤에 ()가 붙지 않는다.

 DataFrame 메서드란 데이터프레임 객체에서 호출할 수 있는 함수들을 의미한다. 이러한 메서드들은 데이터프레임의 데이터를 조회, 수정, 조작, 분석 등 다양한 작업을 수행하기 위해 설계되었다. 

구분 메서드 종류
조회 및 탐색 head(), tail(), describe(), info()
데이터 선택 및 필터링 loc[], iloc[], query(), filter()
데이터 조작 및 변형 append(), drop(), rename(), melt(), pivot()
정렬 및 그룹화 sort_values(), sort_index(), groupby()
결합 및 병합 concat(), merge(), join()
결측치 처리 isnull(), notnull(), fillna(), dropna()
통계 및 계산 mean(), median(), sum(), std(), corr()
변형 및 재구성 pivot(), pivot_table(), stack(), unstack()
시계열 데티어 처리 resample(), asfreq(), rolling()