오늘부터 태블로 오프라인 강의가 진행되었다.
강사님은 실제 회사에서 Data Analyst로 일하시다가 현재는 강사로 전환을 하셨다. 그래서 실무에 대해서 많은 것들을 알려주셨다. Data Analyst의 현실을 알게 되어서 가장 유익했던 시간이 아니었나 싶다!
1. 실무에서의 Data Analyst
✅ Data Analyst가 실무에서 하는 업무
데이터 추출 (70%) → 데이터 분석 (10%) → 대시보드 시각화 (15%) → 기획 및 제안 (5%)
생각보다 데이터를 분석하는 업무는 적은 비중을 차지한다. 그 대신 데이터 추출의 비중이 높은 편이며, 대시보드를 시각화하는 것도 분석에 비해 높다.
그리고 여기에서 가장 중요한 것은 '기획 및 제안' 역량이다. 툴을 활용하는 역량은 기본으로 필요하며, 회사에서 원하는 Data Analyst가 되기 위해서는 기획 및 제안 역량이 반드시 있어야 한다!
2. 대시보드
1) 대시보드로 시각화할 때 중요한 포인트
- 간단하게 만들기
- 빨리 만들기
- 대시보드 자동화 (DB가 매일 업데이트 되기 때문에 필요함) ⭐
- 인수인계를 제대로 할 수 있는 대시보드
→ 남들이 알 수 있는 수식 작성
→ 계산된 필드 함수를 트래킹하여 계산된 필드를 작성할 수 있는 능력을 만들어야 함
2) 대시보드 작성 팁
- 타겟의 입장이 되어 대시보드 작성 (본질을 잊으면 안됨)
- 공백 많게, 숫자 크게, 그래프 적게
- 비교하는 데이터 반드시 넣어주기
- 레이아웃 피드백 잘 받아두었다가 이후에 반영하기
- 협업을 하면서 혹시 모를 실수를 서로 체크하기 (코드, 필드 함수 등) + 한 눈에 보기 편한지 물어보기
3) 좋은 대시보드란?
- 숫자가 눈에 잘 띄는 단순한 대시보드
- 필터, 매개변수로 조정이 쉬우며 렉이 안 걸리는 대시보드
→ 데이터를 가져올 때 작야야 함 (데이터 정제 필수)
→ 필터, 매개변수로 조정이 쉬어야 함
- 타겟을 정확히 이해하고 자동화된 대시보드
→ ex. 동료, 임원, 공개 등
→ 어떻게 만들어야 하는지 등 육하원칙으로 요청하거나 육하원칙으로 요청건에 대한 확인 받기
(누구에게, 언제 릴리즈되어야 하며, 간단한 레이아웃 캡쳐를 보내서 요청건 확인한 후 대시보드 만들기)
3. 대시보드 작성 시 순서
① 데이터 원본 > 시트 확인하기
- 데이터 컬럼의 유형을 확인하기
- 지역명 : 지도를 안 만들거면 문자열로 다 변경해주기
- 측정값 : 초록색 #으로 되어있음 (자체연산 가능)
- 연결 > 추출 : 데이터를 다 빼서 컴퓨터에 저장 / 많은 데이터일 때 사용 / 어차피 퍼블리쉬할 때 모든 데이터가 추출되어 있어야 함
단, 추출을 저장해야 함 (이름을 저장할 때 자세하게 쓰기 → 230313_샘플스토어추출)
② 시트 > 필드 확인하기
- 파란색 차원에 있어야 할 것들이 있는지 확인
- 계층 만들기 : 드래그해서 원하는 필드에 드랍
→ 모아서 보기 좋으며 [+]로 계층을 세분화할 수 있다.
- 초록색 측정값에 있어야 할 것들이 있는지 확인
③ 대시보드 설정하기
- 개체 : 텍스트, 빈 페이지, 탐색 메뉴가 가장 많이 쓰임
- 레이아웃을 짤 때는 ‘바둑판식’을 사용해야 함
- ‘부동’은 마지막에 디자인할 때 사용해야 함
- [TIP] 텍스트 여러 개를 드래그&드랍 → 레이아웃을 먼저 정해줌
+) ex. 막대그래프-매출/순이익-이중축 사용 과 같이 들어갈 데이터, 시각화를 미리 기록해놓기 (습관화하면 좋음)
- [TIP] 서식 - 통합문서 - 글꼴에서 미리 글꼴&크기 설정하기
- 크기 : 핸드폰, 패드로 보는 사람이 있기 때문에 맞춰서 설정 필요하며 대시보드 크기에 따라서 크기 확인해보기
④ VLOD (세분화)
- LOD : Level of Detail 차원이 얼마나 세분화되어 있는지
- VLOD : View Level of Detail 이 순간 차원의 세분화
→ VLOD 변경할 수 있는 것은 차원만 할 수 있음 (측정값은 불가함)
- 마크를 변동할 수 있는 것은 차원이다.
4. 팀 별 과제
1) 청사진 같은 대시보드 1개
2) 완성하고 난 뒤의 대시보드 1개 (못 만드는 것은 텍스트로라도 쳐서 넣기)
📢 ❓ 임원 왈 : 우리 얼마나 하고 있는지 알아오세요
① 육하원칙 제안
② KPI 대시보드 작성
③ 왜 이렇게 작성했는지 이유를 워드나 메모장에 작성하기
→ 타겟 : 임원 (시간 없음, 숫자 바로 봐야 함)
💡 생각하기! 어떤 데이터를 넣어야 할까 고민하기
4.1 대시보드 시각화
1) 청사진 그리기
어떤 식으로 대시보드를 구성할지 청사진을 그려본 후에 시각화를 하면 어떤 데이터를 시각화해야 할지 정하고 할 수 있다.
그래서 텍스트를 활용하여 1차적으로 대시보드 구성안을 작성한다.
(왜 이렇게 대시보드를 구성했는지는 아래에서 자세하게 설명할 예정)
2) 대시보드 완성
우리 조의 완성된 대시보드이다.
임원진은 매우 바쁜 분들이기 때문에 딱 필요한 정보만 넣었으며, 총 매출, 순이익, 주문량등은 수치로 넣고 추가적으로 지역 별로 매출이 높은 TOP 5 카테고리, 주를 시각화하였다.
🔎 참고 대시보드
Superstore KPIs
Superstore KPIs
public.tableau.com
4.2 대시보드 구성 이유
✅ 육하원칙 제안
- 누가 (Who) : 영업 관련 임원
- 언제 (When) : 21년, 22년 분기별 (4개씩 총 8개)
- 어디서 (Where) : 미국 Region (4개)
- 무엇을 (What) : 매출, 수익, 판매량 → 수치로 기재
- 어떻게 (How) : 지역 별, 카테고리 별 매출액 → 막대 차트로 보여주기
- 왜 (Why) : 우리 기업의 현 매출 현황을 알기 위해서
✅ 그래프 구성 이유
2022년 연말 전년과 비교하여 올해 실적을 확인하기 위해 SuperStore 임원진이 자사의 실적 현황을 알 수 있는 대시보드를 요청하였을 경우를 가정하였다.
SuperStore의 전체 매출, 이익, 주문량을 한 눈에 볼 수 있도록 구성하였으며, 지역 별로 매출이 좋은 상위 5개의 카테고리, 주를 확인할 수 있도록 구성하였다.
1) 전체 매출, 이익, 주문량
- 임원진에게 가장 중요하다고 생각되는 2022년 기준 전체 매출, 순이익, 판매량을 상단에 한 눈에 보기 쉽게 시각화함
- 전년(2021년), 올해(2022년) 월 별 수치를 그래프로 시각화하여 한 해의 수치 추이 변화를 비교함
- YoY (%) : 전년 동기 대비 증감율을 추가하여 전년의 수치와 비교함
2) 지역 별 카테고리, 주의 매출 상위 5개 시각화
- 지도를 통해 지역 (East, West, Central, South) 별 매출 현황을 색상으로 비교할 수 있다.
- 그리고 지도에서 지역을 지정하여 지역 별로 매출 상위 5개의 제품 카테고리를 확인할 수 있다.
- 또한 지역 내의 매출 상위 5개 주를 확인할 수 있다.
- 이를 통해서 각 지역 별로 어떤 제품 카테고리의 수요가 많은지 알 수 있으며, 해당 제품 카테고리와 관련된 판매 전략을 세울 수 있다.
- 지역 중 매출이 높은 주를 확인할 수 있으며, 주 별로 판매 전략을 세울 수 있다.
✅ 구현 실패 기능
- YoY를 실제로 구해서 매출, 수익, 수량 옆에 표시하려고 했으나 구하는 것에 어려움이 있어서 가상의 수치로 대체하였다.
- 필터링 기능을 활용하여 상위 5개의 제품과 주를 도출하고, 지역 별로 선택 시 각각의 변화를 구현하려고 했으나 필터링을 거는 과정에서 상위 5개가 먼저 필터링되고 그 후에 지역이 적용되는 바람에 지역 별 상위 5개의 목록이 제대로 작동하지 않는다.
💡 회고
태블로 오프라인 교육 첫 날이라서 오전에 강사님께서 실무에 관련된 이야기를 많이 해주셨다.
이런 이야기들은 어디가서도 들을 수 없는 것들이라 관심있게 잘 듣고 새겼다.
사실 회사를 다니면 내가 생각했던 이상과 매우 다른 것을 나는 이미 느꼈지만, 여전히 데이터 분석가에 대한 이상은 계속 가지고 있다. 실무를 하게 되면 언젠가 이상이 깨지겠지만 이미 한 번 경험해봐서 그런가 큰 타격감은 없을 듯하다.
그리고 태블로 대시보드 만들기를 팀 별 활동을 통해서 했다. 우선, 과제가 생각보다 어려웠으며 팀 활동이라서 어떻게 진행해야 할지 다소 고민이 되었다.
우리 조원들은 대부분 서로의 의견을 많이 들으려고 하고 함께 고민해주었지만, 역할을 나누는 것에는 어려움이 있었다.
어떤 식으로 조원 별로 역할을 담당할지는 조금 더 팀 별 활동을 해보고 하나씩 맞춰가야겠다는 생각이 들었다.
그래도 원하는 바가 비슷해서 그런가, 의견 조율이 빠르게 되고 시각화를 해나가서 만족스러운 결과가 나왔다. 내일 강사님께 피드백을 받으면, 또 이를 반영해서 내일 더 나은 과제 결과를 만들어야 겠다 :)
1조 화이팅💪💪💗
'웅진X유데미 STARTERS > TIL (Today I Learned)' 카테고리의 다른 글
[스타터스 TIL] 27일차.태블로 실전 트레이닝 (3) - 다양한 종류의 차트 시각화 (0) | 2023.03.15 |
---|---|
[스타터스 TIL] 26일차.태블로 실전 트레이닝 (2) - 매개변수, 필터, 동작 (0) | 2023.03.15 |
[스타터스 TIL] 24일차.시계열 데이터 분석 with 파이썬 (3) - 일반 예측 모델 (0) | 2023.03.12 |
[스타터스 TIL] 23일차.시계열 데이터 분석 with 파이썬 (2) - Pandas를 사용한 시계열, Statsmodels 활용 시계열 분석 (0) | 2023.03.09 |
[스타터스 TIL] 22일차.시계열 데이터 분석 with 파이썬 (1) - Numpy, Pandas, Pandas 기반 시각화 (0) | 2023.03.08 |