1. 활용 데이터
Tableau Course: Download Practice Datasets | Page | Art of Visualization
Download the top first file if you are using Windows and download the second file if you are using Mac. Remember, to import CSV files into Tableau, select the “Text File” option (not Excel).
www.artofvisualization.com
위의 사이트에 있는 데이터를 활용하여 태블로 강의가 진행된다.
2. 막대그래프 & 태블로 기본 기능
2.1 데이터
📌 P1-OfficeSupplies.csv
2.2 문제 정의
각 3개 지역에서 사업 중인 상점에서 최고 실적을 낸 각 1명의 직원들만 보너스를 받을 자격이 있습니다.
올해의 보너스를 받을 자격이 있는 3명의 직원이 누구인지 찾아보세요.
실적은 총 판매량을 통해 결정됩니다.
2.3 계산된 필드 만들기
데이터를 보면 판매한 아이템의 갯수 (Units), 각 아이템 별 가격 (Unit Price) 컬럼이 있다.
그러나 총 판매 금액은 나와있지 않기 때문에 이 컬럼을 추가로 만들고자 한다.
▶ 데이터에 우측 클릭 > 계산된 필드 만들기 > 창에서 원하는 계산 입력
2.4 색상 추가하기
데이터에 있는 컬럼을 ‘색상’으로 드래그해도 되지만, 컬럼의 수가 많을 경우에 원하는 컬럼을 찾기가 어렵다.
그래서 현재 내가 사용하고 있는 컬럼 (열, 행에 있는)을 사용한다면 편리하다.
색상을 추가하고 싶다면 Ctrl 키를 누르고 ‘색상’ 아이콘으로 드래그하면 된다.
✅ 합계(TotalSales) 별로 색상 추가하기
→ 이미 막대그래프의 크기로 가장 매출액이 높은 사람을 알 수 있으므로 큰 의미는 없음
✅ 지역 별로 색상 추가하기
→ 지역 별로 색상이 다르게 지정됨을 확인할 수 있다.
2.5 레이블 추가 및 서식 지정
색상과 동일하게 레이블 추가도 Ctrl 키를 누른 후 ‘레이블’ 아이콘으로 드래그하면 된다.
✅ 데이터 내 레이블 수정
레이블 지정 컬럼 우클릭 > 서식 > 좌측 패널 메뉴에서 레이블 수정
→ 기본값의 숫자에서 달러로 변경, 소숫점 변경, 글꼴 변경 진행
✅ 데이터 축 수정
데이터 내 축 우클릭 > 서식 > 좌측 패널 메뉴에서 수정
→ 기본값의 숫자에서 달러로 변경, 소숫점 변경, 글꼴 변경 진행
3. 시계열 데이터
3.1 데이터
📌 P1-Long-Term-Unemployment-Statistics.xlsx
3.2 문제 정의
실업자 수(Unemployed)가 시간대(Period)에 따라 어떻게 변하는지 확인
3.3 시계열 다루기
💡 ‘시계열 데이터’를 다룰 때, 본인이 가지고 있는 시간 데이터를 ‘치수(Dimention)’나 ‘값(Measure)’ 또는 카테고리 중 무엇으로 만들고 싶은지 정확하게 알아야 함
✅ 시간 데이터를 값(Measure)으로 표현
빨간색 부분의 년/분기/월 등으로 설정하면 시간 데이터를 ‘값(Measure)’으로 표현하여 세밀하게 데이터가 표현됨
→ 년+월 단위
(주황색 부분의 년/분기/월 등으로 설정하면 시간 데이터를 ‘치수(Dimention)’으로 표현하여 단순한 데이터로 표현됨)
3.4 집합(Aggregation), 세분화(Granularity)
✅ 집합(Aggregation)
태블로는 자동으로 집합을 하여 데이터를 시각화해준다.
분석 > 측정값 집계 해제하면 집합 기능을 끌 수 있다.
✅ 세분화(Granularity)
집합 기능을 꺼버리는 대신, ‘치수(Dimention)’을 사용해보자. ‘치수’는 정보의 세분화를 결정짓기에 정보를 집합하는데도 영향을 미친다.
치수(성별 컬럼)를 추가하니 세분화되고 mark의 수가 2배(122 → 244개)로 늘어난 것을 확인할 수 있다.
✅ 세부정보 옵션 활용
Age 컬럼을 모양 아이콘에 드래그하였더니, Age 별 모양이 달리하여 그래프에 표시된다.
3.5 하이라이트 기능, 영역 차트
✅ 하이라이트 기능
범례에서 특정 데이터만 표시하고 싶으면 더블클릭하면 된다.
✅ 영역차트
스타일을 영역차트로 설정하면 영역차트를 그릴 수 있다.
각 Age 별로 영역을 나타내었고, 위의 그래프와 다르게 y축의 범위가 다른 것을 확인할 수 있다.
영역차트의 경우, 누적으로 쌓인 것이기 때문에 y축의 범위가 누적합임을 알 수 있다.
영역차트를 통해서 각 범위가 얼마만큼을 차지하는지 시각적으로 확인할 수 있다.
3.6 필터
컬럼을 필터 박스에 드래그하면 필터를 설정할 수 있다.
그리고 컬럼 우클릭하여 필터 추가를 하면 아래와 같이 원하는 컬럼을 설정할 수 있다.
필터의 종류도 따로 설정할 수 있다. (단일값, 다중값)
Age 컬럼을 ‘단일 값(목록)’으로 설정하여, 특정 1개의 값만을 확인할 수 있다. (전체 데이터도 확인할 수 있음)
4. 지도, 산점도
4.1 데이터
📌 P1-AmazingMartEU2.xlsx 의 ListOfOrders 시트, OrerBreakdown 시트
4.2 문제 정의
유럽 내 특정 상점의 판매량을 지도를 통해 분석해서 얼마나 많은 수익을 올렸는지 확인해보고 산점도를 이용해 소비자 분석을 해보자.
4.3 조인
시트를 우측 빈 공간에 드래그한 후 더블클릭하고 조인할 시트를 드래그하면 조인이 된다.
조인의 종류는 INNER, LEFT, RIGHT, OUTER 조인이 있으며 원하는대로 설정할 수 있다.
4.4 지도 그리기, 계층(Hierarchy)
계층이 필요한 이유는 데이터에 지리적인 정보가 있을때 태블로에게 어떻게 돌아가는 것인지 알려주어 작업할 수 있도록 하기 위함이다.
각 지방마다 얼마나 많은 매출을 올렸는지 알아보자.
1) 지역적 특징을 가진 컬럼인 Country, State, City를 Geography라는 계층 구조로 만든다.
2) 연도별 각 지역의 수익을 확인하기 위해 년(Order Date)를 필터에 추가한다.
3) 수익 합계를 매출 합계로 나누어 순이익 컬럼을 만든다.
4) 매출 합계는 원의 크기로 나타내고, 순이익 집계는 색상으로 나타낸다.
4.5 산점도
해당 그래프를 통해 고객이 누군지, 수익이 얼마인지, 매출은 얼마인지 확인할 수 있다.
또한 고객이 주문한 상품에 문제가 있는지 확인하는 등 여러 조치를 취할 수 있다.
매출이 가장 높은 고객을 확인하고 단골 고객들을 위한 특별 서비스를 계획할 수도 있다.
각 고객에 따른 순이익을 시각화해보자.
고객 이름을 기준으로 산점도를 그렸으며, 순이익에 따라 색깔을 추가하였다.
[+] 추가로 설정한 필터를 다른 워크시트에도 적용할 수 있는 방법은 다음과 같다.
이렇게 설정하면 다른 워크시트에도 자동으로 적용된다.
4.6 대시보드 만들기
대시보드는 우리가 만든 워크시트를 원하는 위치에 원하는 크기로 시각화할 수 있다.
워크시트의 사이즈는 워크시트 내에서 수정을 하면 대스보드에서도 사이즈가 수정된다.
4.7 대화형 작업 추가하기
사용자가 특정 부분을 클릭할 때, 대시보드에서 특정 동작이 이루어지도록 해보자. (상호작용)
✅ 필터
대시보드 > 동작에서 원하는 필터 상호작용을 설정할 수 있다.
선택을 했을 때 필터 동작이 실행이 되며, 선택을 해제하게 되면 모든 데이터가 보이도록 설정하였다.
지도에서 데이터를 선택하면 그에 맞춰 필터링된 데이터가 산점도에서 보여준다.
데이터는 한 개 이상 선택이 가능하다.
✅ 하이라이트
하이라이트 기능은 필터 기능과 다르게 데이터 셋 자체는 걸러지지 않는다.
데이터셋 내의 관련 없는 정보들을 전부 제외시키는 방식이 아니라, 특정 지역과 관련있는 고객들의 정보를 띄움과 동시에 하이라이트 시켜서 사용자들에게 보여준다.
그러나 문제는 한 고객이 다양한 나라에서 주문한 이력이 있는 경우가 있기 떄문에, 특정 나라에서 주문한 고객들만 하이라이트하려고 했을 때 되지 않는다는 것이다.
이럴 경우에는, 우리가 직접 워크시트를 수정하여 세분화를 조정해주면 된다.
→ State 컬럼을 추가하여 세분화하였다.
이후 다시 대시보드에서 하이라이트가 적용된 것을 확인할 수 있다.
💡 회고
오늘부터 Udemy 강의인 '태블로 Tableau 완벽 실전 교육! 커리어 업그레이드 하기'를 수강하였다.
작년에 아이펠 사람들과 SQL 스터디하고 SQL 끝난 후 Tableau 스터디를 진행하였을 때 사알짝 태블로 맛보기를 해보았다.
그러나 유데미 강의를 들으니 책으로 공부한 것보다 훨씬 많은 기능들을 알았고 큰 도움이 되었다. 특히, 이 강의가 유익했던 점은 다양한 실제 데이터를 활용하고 데이터 속 문제를 정의하고 그에 따라 시각화하는 점이다.
영어 강의라 혹시나 더 어렵게 느껴지면 어떡하지라는 걱정을 하였지만, 다행히도 이해가 되지 않는 부분은 없었다. 아직까지는!
유데미 강의 이후에 오프라인으로 태블로 오프라인 강의를 진행하기 때문에 우선은 모르는 부분은 체크해두고 그 때 물어봐야겠다.
▼ 내 Tableau Public ▼
송아람 - Profile | Tableau Public
송아람's Tableau Public profile. View interactive data visualizations published by this author.
public.tableau.com
'웅진X유데미 STARTERS > TIL (Today I Learned)' 카테고리의 다른 글
[스타터스 TIL] 19일차.Tableau 완벽 실전 교육 (3) - 데이터 준비, 클러스터링, 크로스 데이터셋 조인, pdf, 공간파일 연결 (0) | 2023.03.03 |
---|---|
[스타터스 TIL] 18일차.Tableau 완벽 실전 교육 (2) - 데이터 블렌딩, 대시보드, 스토리 (1) | 2023.03.02 |
[스타터스 TIL] 16일차.데이터 드리븐 디자인씽킹 (3) (1) | 2023.02.27 |
[스타터스 TIL] 15일차.데이터 드리븐 디자인씽킹 (2) (0) | 2023.02.24 |
[스타터스 TIL] 14일차.데이터 드리븐 디자인씽킹 (1) (0) | 2023.02.24 |