Python 베이직 5회차 타이타닉 실습.html
0.58MB
1. Series 란?
1차원 배열을 말한다.. 리스트를 시리즈로 정의해서 불러오면 숫자 인덱스를 생성해서 보여준다.
s = pd.Series(['부장', '차장', '대리', '사원', '인턴'])
-----------------------------------------------------------------------------------------------
s = pd.Series([91, 2.5, '스포츠', 4, 5.16])
2. DataFrame 란?
2차원 데이터 구조로 Excel과 같다. 딕셔너리를 이용해서 DataFrame를 만들면 key값이 column이 되어 나타난다.
pd.DataFrame([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]], columns=['가', '나', '다'])
-----------------------------------------------------------------------------------------------
data = {
'name': ['Kim', 'Lee', 'Park'],
'age': [24, 27, 34],
'children': [2, 1, 3]
}
pd.DataFrame(data)
3. DataFrame 속성 및 메서드 다루기
DataFrame 속성이란 데이터를 담고 있는 변수나 데이터의 상태를 확인하는 것으로 뒤에 ()가 붙지 않는다.
DataFrame 메서드란 데이터프레임 객체에서 호출할 수 있는 함수들을 의미한다. 이러한 메서드들은 데이터프레임의 데이터를 조회, 수정, 조작, 분석 등 다양한 작업을 수행하기 위해 설계되었다.
구분 | 메서드 종류 |
조회 및 탐색 | head(), tail(), describe(), info() |
데이터 선택 및 필터링 | loc[], iloc[], query(), filter() |
데이터 조작 및 변형 | append(), drop(), rename(), melt(), pivot() |
정렬 및 그룹화 | sort_values(), sort_index(), groupby() |
결합 및 병합 | concat(), merge(), join() |
결측치 처리 | isnull(), notnull(), fillna(), dropna() |
통계 및 계산 | mean(), median(), sum(), std(), corr() |
변형 및 재구성 | pivot(), pivot_table(), stack(), unstack() |
시계열 데티어 처리 | resample(), asfreq(), rolling() |
'Today I Learned (TIL) > Python' 카테고리의 다른 글
[TIL] 통계학 기초 - 2주차(1) (1) | 2024.08.01 |
---|---|
[TIL] 통계학 기초 - 1주차 (0) | 2024.08.01 |
[TIL] Python 베이직 - 4회차 (0) | 2024.07.25 |
[TIL] Python 베이직 - 3회차 (0) | 2024.07.23 |
[TIL] 데이터 시각화 - Matplotlib (4) | 2024.07.22 |