1. 실무 데이터 분석의 종류
- Ad-hoc 분석 (일회성 분석)
1) 엑셀 시트 레포트
2) 시각화
3) 단순 지표 추출 쿼리
4) 기술 통계량(평균값, 중앙값, 최소 최대값 등)
유형 | 종류 |
설명적 분석 | Ad-hoc 분석, KPI 지표 정의 |
진단적 분석 | self-service 분석, 시각화, A/B 테스트 도입 |
예측적 분석 | 예측 모델링, A/B 테스트 대시보드 자동화 |
처방적 분석 | 최적화, ML/DL 플랫폼, 자체 플랫폼 자동화 |
- Daily Scrum: 지표 확인 및 지표 증감 원인 파악
1) Overview 대시보드: 현재 서비스 상황 및 주요 지표 확인
2) By Dimension(시간별, 유저별, 세그먼트별 등) 대시보드: 지표 증감 원인 파악
3) 대시보드를 통해 원인 파악이 어렵거나 데이터를 더 깊게 봐야하는 경우 SQL, Python을 활용
- 데이터 분석 프로젝트: 주요 데이터 분석 방법론
1) 실험: A/B 테스트, 인과추론
2) 모델링: 수요 예측, 이탈 예측 모델링 등
3) 고객 세그먼트: RFM, 클러스터링 등
4) 시계열 분석
2. 데이터 모델링
- 데이터 인프라: 데이터 레이크 → 데이터 웨어하우스 → 데이터 마트 → BI 툴
1) 데이터 레이크: 모든 Raw data(정형 데이터, 로그 데이터, 테이블 등) 저장할 수 있는 스토리지
2) 데이터 웨어하우스: 데이터를 장기적인 보존용으로 통합, 정제, 분석하여 정리한 저장소(AWS Redshift, Snowflake, Google Bigquery etc..)
3) 데이터 마트: 부서별, 목적별 분석용으로 만든 데이터 웨어하우스의 데이터 일부분, 대시보드와 시각화 레포트가 생성되기 전에 수집 및 정리되어있는 공간
- Fact Table: 측정값(metric)
Star 스키마와 Snowflake 스키마의 중심에 있는 집계가 가능한 테이블로 수치를 가지고 있는 측정값(매출 등)을 말한다.
- Dimension Table: 차원(dimension)
Star 스키마와 Snowflake 스키마의 가장 자리에 있는 테이블로 Fact Table에 대한 상세 정보를 제공하는 테이블(고객, 제품, 주문 테이블 등)을 말한다.
- Star 스키마와 Snowflake 스키마 차이점
1) Start 스키마는 DB 설계가 단순하고 Snowflake 스키마는 DB 설계가 복잡
2) Star 스키마는 비즈니스 요구사항에 더 적합하며 간단하고 빠르게 쿼리를 수행할 수 있음
3) Star 스키마는 정규화된 데이터 모델보다는 덜 정규화된 형태를 가짐
4) Snowflake 스키마는 차원 테이블의 정규화를 강조하며, 데이터의 중복을 줄여 저장 공간을 절약함
5) Star 스키마는 일대다 관계를 허용하지 않지만 Snowflake 스키마는 허용
'Today I Learned (TIL) > Tableau' 카테고리의 다른 글
[TIL] 지표 특강 - 3회차 (7) | 2024.09.09 |
---|---|
[TIL] 지표 특강 - 2회차 (0) | 2024.09.06 |
[TIL] 실습으로 배우는 태블로 - 4주차(3) (5) | 2024.09.04 |
[TIL] 실습으로 배우는 태블로 - 4주차(2) (4) | 2024.09.04 |
[TIL] 실습으로 배우는 태블로 - 4주차(1) (0) | 2024.09.03 |