반응형

전체 글 184

[스타터스 TIL] 44일차.태블로 실전 트레이닝 (20) - 태블로 자격증 공부 (Test 1, Test 2)

1. Test 1 1. In order to avoid any confusions, what should you do after creating a Dual-axis chart? → Synchronise the axis 혼란을 피하기 위해 이중 축을 만든 후에는 반드시 '축 동기화'를 해주어야 한다. 2. Data granularity refers to the level of detail for a piece of data, wherever you are looking. 데이터 세분성은 데이터에 대한 세부 수준을 나타낸다. 3. You have cleaned a data source properly, created some calculated fields and renamed some columns. Y..

[스타터스 TIL] 43일차.태블로 실전 트레이닝 (19) - 태블로 자격증 공부 (Test 4, Test 5)

1. Test 4 1. Which of the following is not a Trend Line Model? ✔ 태블로 추세선 종류 1. Linear Trend Line (선형) 2. Logarithmic Trend Line (로그) 3. Exponential Trend Line (지수) 4. Polynomial Trend Line (다항식) 5. Power Model (거듭제곱) 2. It is possible to change the Geographic Role of a dimension - 차원의 지리적 역할로 변경이 가능하다. - 지리적 역할은 필드의 각 값을 위도 및 경도 값과 연결한다. 3. Tableau can create worksheet-specific filters - 워크시트에 필..

[스타터스 TIL] 42일차.태블로 실전 트레이닝 (18) - 태블로 자격증 공부 (Test 3)

1. Test 3 (✅ 표시는 틀린 문제...🥴) 1. Creating a scatter plot requires a minimum of how many measures? → 2 Scatter plot을 만들 때 최소 2개의 measure(측정값)이 필요하다. 2. Which one of the following is a dimension? → Measure Names - Dimension : Measure Names - Measure : Number of records, Longitude, Latitude 3. Which of the following options best describe measures? → They are numeric, quantitavtive Measure : numerical..

[스타터스 TIL] 41일차.태블로 실전 트레이닝 (17) - 팀 프로젝트 발표, 태블로 자격증 공부

1. 팀 프로젝트 피드백 1.1 다른 조 - 데이터 클리닝은 70%를 차지하기 때문에 매우 중요함!!!!!!!!!!!! - 모든 대시보드가 동일한 것이 실무에서는 많이 사용되긴 하지만 여기서는 대시보드를 다양하게 만드는 것이 좋음 - LOD 식을 간단하게 피피티에 넣기 + 식을 하나씩 짚어주며 발표하기 - ex. 어떤 차원을 고정하여 어떠한 식으로 고정하였습니다. - 표준화 정의 가장 중요함! - 왜 내가 이것을 기준으로 삼았는지, 왜 이 숫자가 대시보드에 있는지 설명 필요 - 카테고리 전체는 넣는 것이 좋음 - Score를 산정한다면 Score Model을 꼭 말해줘야 함! - 워터폴 차트 잘 쓴 듯함 - 이중축은 최대한 지양하기 - 타임라인 형식이면 써도 되지만 카테고리 형식이면 안 쓰는 것이 좋음 ..

[스타터스 TIL] 40일차.태블로 실전 트레이닝 (16) - 팀 프로젝트

1. 팀 프로젝트 대시보드 준비 1.1 앱 리스트 구성 App Rank Category/Genres Ratings Reviews Day_diff 최종 Score 1.2 업데이트 경과일 현 시점에서 최근 업데이트 날짜를 뺀 기간을 나타내었다. 1) 기준 날짜 설정 - 대시보드를 만든 시점의 날짜 설정 : 2018-10-01 → 2018년 8월이 데이터의 마지막 날이므로 해당 날짜 이후의 날짜로 설정함 2) 기준 날짜 필드 만들기 그 전에 Last Updated 필드의 타입을 ‘날짜’로 변경하기 // 기준 Date DATE('2018-10-01') 3) 경과일 구하기 (days) 현 시점 (기준 날짜, 2018-10-01)을 기준으로 최근 업데이트한 날짜까지의 기간을 확인 // Day_diff DATEDIF..

[유데미 스타터스 취업 부트캠프 4기] 데이터분석/시각화(태블로) - 8주차 학습 일지

8주차 교육에 대한 회고 (4L) 이번 주에는 디자인적으로 예쁘고 적절히 활용되기도 하고, 활용되지 않는 다양한 그래프를 구현하는 것에 대해 배웠다. 태블로가 제공하는 기본 그래프 이외에도 다양한 그래프를 태블로 퍼블릭에서 많이 볼 수 있었는데, 그런 그래프들을 배울 수 있어서 좋았다. 그리고 수요일부터는 해커톤 전 연습 겸 미니 해커톤을 진행하였다. 주제가 자유주제이다보니 데이터를 기반으로 주제를 정하는 것이 너무나도 어려웠다...😂😂 주제를 정할 때, 내가 너무 어렵게 정하는 것은 아닌지에 대한 고민이 들기 시작했다. 이 부분을 스스로 개선을 하고 싶은데, 어떻게 해야 할 지 고민을 해봐야겠다...!!!! (이런 고민을 실무에 들어가기 전 지금 고민할 수 있는 게 좋은 듯하다!) 또 이번 주는 새로운..

[스타터스 TIL] 39일차.태블로 실전 트레이닝 (15) - 팀 프로젝트

팀 프로젝트를 하루종일 진행하였다. 오늘은 데이터를 정제하고, 레이아웃을 정하니 하루가 금방 지나갔다..!😂 1. 데이터 전처리 1.1 ⛑ Troubleshooting 1. MySQL로 import했을 때 8717개 데이터만 나오는 현상 발견 2. NaN값 모두 제거되고 $를 인식하지 못해 Paid 데이터도 모두 제거되어서 발생함 3. [해결방안] json 파일로 변환하여 import하기 1.2 MySQL로 전처리 - googleplaystore.csv : 10,841개 - MySQL에 import한 전체 데이터 : 10,778개 (-63) → Category = ‘1.9’ 데이터 자동 삭제됨 → 그 외의 자동 삭제된 데이터가 있지만 일일이 확인이 어려움 ㅠㅠ ✅ 전처리할 사항 1. 빈 값 제거 (imp..

[스타터스 TIL] 38일차.태블로 실전 트레이닝 (14) - 레이아웃, 테이블, 워드 클라우드

1. 레이아웃 1.1 레이아웃 시트 만들기 1. 마크 빈 부분에 더블 클릭 2. ‘’ 기재 → 텍스트로 드래그앤드랍 3. 표준 → 전체 보기로 변경 4. 시트 우클릭 > 주석 추가 > 영역 > 확인 5. 우클릭 > 서식 > 테두리, 모서리 변경 6. 대시보드에서 만든 시트 드래그앤드랍 7. 컨테이너 박스를 만들어서 레이아웃에 맞춰서 넣어주기 1.2 컨테이너 박스 만들기 1. 부동 - 가로 컨테이너 박스를 대시보드에 가져오기 2. 대시보드에 맞춰 크기 설정하기 3. 바둑판식으로 변경 후 컨테이너 박스 안에 넣을 시트를 드래그앤드랍 4. 시트 배경을 흰색이 아닌 투명색으로 하면 깔끔하게 그래프가 들어감 5. 컨테이너 박스 높이 고정하기 2. 테이블 - 해당 테이블 차트는 인사팀에서 사용하기 좋음 - 레이아웃..

[스타터스 TIL] 37일차.태블로 실전 트레이닝 (13) - 폭포 차트, 막대 게이지 차트, 벤다이어그램, 불릿차트, 캘린더 시각화

1. 심화 그래프 만들기 1.1 Waterfall Chart (폭포 차트, 간트 차트) 연속적으로 누적해가면서 증가하거나 감소하는 것을 한 눈에 표현하기 위한 목적으로 사용한다. ⭐ 간트차트는 원래 선으로 표시됨 Sales를 선 기준으로 마이너스 누계를 하여 그래프 표현한다. 1) waterfall 함수 만들기 → profit은 마이너스 값이 있기 때문에 주의할 것! // waterfall - [Sales] 2) Region, Sales 열과 행에 드래그 3) 마크 > Gantt 차트로 변경 4) 합계(Sales) > 퀵테이블 계산 → 누계 5) waterfall 함수를 크기에 드래그 6) 레이블 추가 7) 분석 > 행 총합계 표시 ✅ 그래프 (전체 화면) ✅ 폭포차트 (간트차트) 1.2 막대 게이지 차..

[스타터스 TIL] 36일차.태블로 실전 트레이닝 (12) - LOD Fixed 날짜, 게이지 차트, 와플차트, Jitter bar 차트

1. LOD Fixed 날짜 - 날짜 함수 : 자동화 (매번 데이터가 변해도 식을 변경하지 않아도 됨) - 전년동월 등 구할 때 사용함 (자동화 할 때 사용) 그러나 굳이 Fixed를 사용하지 않아도 됨 // recent year {MAX(YEAR([Order Date]))} // last year [recent year] - 1 2. 심화 그래프 2.1 게이지 차트 - 어디서든 쓰일 수 있기 때문에 아래의 식을 복붙해도 모든 데이터셋에서 사용할 수 있음 - 식을 잘 만들어 놓으면 데이터가 자동화되어도 깨지지 않음 1) 비율 지표 만들기 `WINDOW_SUM` 을 이용해 누적 합계에서 sales의 비율을 구하는 식 // sales(%) SUM([Sales])/WINDOW_SUM(SUM([Sales])) ..

반응형