1. 데이터 리터러시
- 데이터 리터러시의 정의
데이터를 올바르게 읽고 이해하여 이를 통해 비판적으로 분석하여 결과를 의사소통에 활용할 수 있는 능력을 말한다.
데이터 리터러시는 올바른 질문을 던질 수 있도록 만들어 준다.
- 데이터 분석에 대한 착각
1) 데이터 분석 학습에 대한 일반적인 접근
데이터 분석을 배우기 위해 SQL, Python, Tableau 등을 학습하지만 실전에서 사용하려고 하면 잘 되지 않음
2) 데이터 분석에 대한 착각
▷ 데이터를 잘 분석하면 문제, 목적, 결론이 나올 것이라고 생각
▷ 데이터를 잘 가공하면 유용한 정보를 얻을 수 있다고 생각
▷ 분석에 실패하면 방법론, 스킬이 부족한 것이라고 생각
- 데이터 리터러시가 필요한 이유
데이터 분석 접근법은 크게 '문제 및 가설정의(생각)' → '데이터 분석(작업)' → '결과 해석 및 액션 도출(생각)' 3단계로 구분된다. 데이터 분석이 목적이 되지 않도록 '왜(why)?'를 항상 생각해야 한다.
2. 문제 정의
분석하려는 것에 대한 상황이나 현상을 명확하고 구체적으로 파악하여 프로젝트의 목표를 설정하고 분석 방향을 설정해야 더 나아지기 위한 새로운 액션 플랜을 수립할 수 있다.
- 문제 정의 방법론
1) MECE (Mutually Exclusive, Collectively Exhaustive)
▷ 문제 해결과 분석에서 널리 사용되는 접근 방식
▷ 문제를 상호 배타적(mutually exclusive)이면서, 전체적으로 포괄적(collectively exhaustive)인 구성요소로 나누는 것
▷ 복잡한 문제를 체계적으로 분해하고, 구조화된 방식으로 분석할 수 있음
2) 로직 트리(Logic Tree)
▷ MECE 원칙을 기반으로 복잡한 문제를 더 작고 관리하기 쉬운 하위 문제로 분해하는 데 사용
▷ 상위 문제로부터 시작하여 하위 문제로 계층적 접근
▷ 일반적으로 도표 형식으로 표현되어 쉽게 파악할 수 있음
▷ 로직 트리는 정해진 답이 없으며, 사용자가 어떤 기준으로 나누냐에 따라 그 깊이와 넓이가 달라짐
▷ 중복되지 않고, 누락이 없도록 해야 함
- 문제 정의 핵심
1) So What?
▷ 수집한 정보와 소재에서 ‘결국 어떻다는 것인지’를 알아내는 작업
▷ 그래서, 따라서, 이렇듯 앞에 오는 정보나 소재에서 과제의 답변에 맞는 중요한 핵심을 추출하는 작업
▷ 나타난 현상을 바탕으로 과제에 비추어 말할 수 있는 내용의 핵심을 추출하는 작업
2) Why So?
▷ 왜 그렇게 말할 수 있는지
▷ 구체적으로 무슨 뜻인지를 검증하고 확인하는 작업
▷ So what?한 요소의 타당성을 자료 전체 혹은 그룹핑한 요소로 증명할 수 있다는 사실을 검증하는 작업
- 문제 정의 팁
▷ 결과를 공유하고자 하는 사람이 누구인지 정의하기
▷ 결과를 통해 원하는 변화를 생각하기
▷ 회사 소속이라면, 경영자의 입장에서 보려고 노력
▷ 많은 사람들과 의견을 나눠보는 것도 방법
▷ 반드시 혼자서 오래 고민해 보는 시간을 가질 것
3. 데이터의 유형
데이터의 유형으로는 정성적 데이터와 정량적 데이터 두 가지로 구분 가능하다. 비즈니스 목표를 위해서 두 가지 데이터를 적절하게 활용하는 것이 필요하다.
구분 | 정성적 데이터 | 정량적 데이터 |
유형 | 비정형 데이터 | 정형 데이터, 반정형 데이터 |
특징 및 관점 | 객체 하나가 함축된 의미 내포 주로 주관적 내용 | 여러 요소의 결합으로 의미 부여 주로 객관적 내용 |
구성 및 형태 | 문자나 언어 웹 로그, 텍스트 파일 |
수치나 기호 데이터베이스, 스프레드 시트 |
위치 | 웹사이트, 모바일 플랫폼 등 외부 | DBMS, 로컬 시스템 등 내부 |
분석 | 통계 분석 시 어려움 | 통계 분석 시 용이 |
'Today I Learned (TIL) > 기타' 카테고리의 다른 글
[TIL] 데이터 리터러시 - 1주차(2) (1) | 2024.07.04 |
---|