Today I Learned (TIL)/Tableau

[TIL] 지표 특강 - 1회차

신짜린 2024. 9. 6. 15:07

1. 실무 데이터 분석의 종류

- Ad-hoc 분석 (일회성 분석)

 1) 엑셀 시트 레포트

 2) 시각화

 3) 단순 지표 추출 쿼리

 4) 기술 통계량(평균값, 중앙값, 최소 최대값 등)

유형 종류
설명적 분석 Ad-hoc 분석, KPI 지표 정의
진단적 분석 self-service 분석, 시각화, A/B 테스트 도입
예측적 분석 예측 모델링, A/B 테스트 대시보드 자동화
처방적 분석 최적화, ML/DL 플랫폼, 자체 플랫폼 자동화

 

- Daily Scrum: 지표 확인 및 지표 증감 원인 파악

 1) Overview 대시보드: 현재 서비스 상황 및 주요 지표 확인

 2) By Dimension(시간별, 유저별, 세그먼트별 등) 대시보드: 지표 증감 원인 파악

 3) 대시보드를 통해 원인 파악이 어렵거나 데이터를 더 깊게 봐야하는 경우 SQL, Python을 활용

- 데이터 분석 프로젝트: 주요 데이터 분석 방법론

 1) 실험: A/B 테스트, 인과추론

 2) 모델링: 수요 예측, 이탈 예측 모델링 등

 3) 고객 세그먼트: RFM, 클러스터링 등

 4) 시계열 분석

 

2. 데이터 모델링

- 데이터 인프라: 데이터 레이크 → 데이터 웨어하우스 → 데이터 마트 → BI 툴

 1) 데이터 레이크: 모든 Raw data(정형 데이터, 로그 데이터, 테이블 등) 저장할 수 있는 스토리지

 2) 데이터 웨어하우스: 데이터를 장기적인 보존용으로 통합, 정제, 분석하여 정리한 저장소(AWS Redshift, Snowflake, Google Bigquery etc..)

 3) 데이터 마트: 부서별, 목적별 분석용으로 만든 데이터 웨어하우스의 데이터 일부분, 대시보드와 시각화 레포트가 생성되기 전에 수집 및 정리되어있는 공간

- Fact Table: 측정값(metric)

 Star 스키마와 Snowflake 스키마의 중심에 있는 집계가 가능한 테이블로 수치를 가지고 있는 측정값(매출 등)을 말한다.

- Dimension Table: 차원(dimension)

 Star 스키마와 Snowflake 스키마의 가장 자리에 있는 테이블로 Fact Table에 대한 상세 정보를 제공하는 테이블(고객, 제품, 주문 테이블 등)을 말한다.

- Star 스키마와 Snowflake 스키마 차이점

 1) Start 스키마는 DB 설계가 단순하고 Snowflake 스키마는 DB 설계가 복잡

 2) Star 스키마는 비즈니스 요구사항에 더 적합하며 간단하고 빠르게 쿼리를 수행할 수 있음

 3) Star 스키마는 정규화된 데이터 모델보다는 덜 정규화된 형태를 가짐

 4) Snowflake 스키마는 차원 테이블의 정규화를 강조하며, 데이터의 중복을 줄여 저장 공간을 절약함

 5) Star 스키마는 일대다 관계를 허용하지 않지만 Snowflake 스키마는 허용