웅진X유데미 STARTERS 69

[스타터스 TIL] 23일차.시계열 데이터 분석 with 파이썬 (2) - Pandas를 사용한 시계열, Statsmodels 활용 시계열 분석

4. Pandas를 사용한 시계열 4.1 Datetime Index 1) Numpy Datetime Array - numpy의 데이터 유형 : datetime64 - Python에 내장된 datetime 객체와는 구별된다. - 3개의 날짜 형태의 문자열을 입력한 후, dtype='datetime64' 추가하면 datetime 형식으로 지정된다. - 'datetime64[D]' : D는 day(일)을 나타낸다. → 이를 통해 기본적으로 numpy가 일 수준의 날짜 정밀도를 적용했음을 알 수 있다. - 만약, 다른 수준의 날짜 정밀도를 적용하려면 [h], [Y]를 같이 입력하면 된다. np.array(['2016-03-15', '2017-05-24', '2018-08-09'], dtype='datetime6..

[스타터스 TIL] 22일차.시계열 데이터 분석 with 파이썬 (1) - Numpy, Pandas, Pandas 기반 시각화

1. Numpy 배열로 저장된 대용량 데이터를 효율적으로 처리할 수 있는 수치 처리 라이브러리 1.1 numpy 내장 메소드 1) np.arange(start, stop, step size) - 마지막 값은 포함하지 않는다. - 출력 값은 정수(Integer)이다. import numpy as np np.arange(0, 11, 2) # [out] array([ 0, 2, 4, 6, 8, 10]) 2) np.zeros() / np.ones() - 단일 숫자나 튜플을 입력할 수 있다. - 이 메소드가 효과적인 이유는 numpy를 통해 배열에서 모든 단일 숫자로 연산할 수 있기 때문이다. ## 1. np.zeros() # 1차원 배열 출력 np.zeros(3) [out] array([0., 0., 0.]) ..

[스타터스 TIL] 21일차.Tableau 고수되기 (2) - 애니메이션, 세부 수준 계산 (LOD), 고급 매핑 기술

5. 애니메이션 5.1 과제 개요 📢 지난 50년동안 전 세계 국가의 인구가 어떻게 발전해왔는지 보여주는 애니메이션 대시보드를 제공해라. 특히 이 과제의 이해관계자는 출산율, 기대 수명 및 인구의 전반적인 추세를 확인하는 데에 관심이 있다. 전반적인 추세 이외에도 개별 국가로 볼 수 있기를 원한다. 5.2 데이터 조인은 하지 않고 혼합 (blending)할 예정이다. 혼합을 하기 위해서는 데이터 간의 관계를 설정해주어야 한다. → 데이터 > 혼합관계 편집 애니메이션을 위해서는 연도가 필요한데, 메타데이터에는 연도가 없기 때문에 우리는 메타데이터를 사용하지 않을 것이다. Country Code , Year 컬럼만 관계로 설정한다. (Country Name , Indicator Code, Name 은 동일한..

[스타터스 TIL] 20일차.Tableau 고수되기 (1) -그룹, 집합, 테이블 계산, 데이터 소스 필터

1. 활용 데이터 Advanced Tableau Course: Download Practice Datasets | Page | Art of Visualization You can download here all the Advanced Tableau course Practice Datasets files. www.artofvisualization.com 위의 사이트에 있는 데이터를 활용하여 태블로 강의가 진행된다. 2. 그룹, 집합 2.1 과제 개요 📢 벤처 캐피탈 펀드의 이사회는 현재 잠재적으로 흥미로운 1000개의 스타트업을 검토하고 그들이 투자할 스타트업을 결정하고 있다. 이 펀드에 대한 투자를 선택하는 기준은 높은 수익, 낮은 비용, 최고 성장이며, 모두 2015년 기준이다. (최고 성장이 전체에서..

[유데미 스타터스 취업 부트캠프 4기] 데이터분석/시각화(태블로) - 4주차 학습 일지

4주차 교육에 대한 회고 (4L) 벌써 4주차라니... 시간이 정말 빠르다. 이번주는 월요일에 데이터 드리븐 디자인 씽킹 마지막 수업을 진행하였으며, 나머지 3일 동안은 유데미로 태블로 강의를 들었다. 데이터 드리븐 디자인 씽킹 수업에서 진행한 조별 디자인 씽킹에서 우리 조가 1등을 했다!🎉🎉 주제 선정, 문제 정의, 문제 해결 등 다양한 부분에서 조원들의 능력이 하나씩 합쳐져서 이렇게 빛나는 성과가 만들어지지 않았나 싶다! (1등 선물은 올리브영 상품권! 오예! 이번주 올영세일 때 질렀따!..ㅎㅎ) 화요일부터는 태블로 강의를 들었다. 태블로를 본격적으로 배우는 것이 처음이라서 그런가, 강의를 보고 따라하며 정리하는 데에 많은 시간이 걸렸다. 그래서 이틀 안에 끝내야 하는 강의를 3일 안에 끝내서 하루치..

[스타터스 TIL] 19일차.Tableau 완벽 실전 교육 (3) - 데이터 준비, 클러스터링, 크로스 데이터셋 조인, pdf, 공간파일 연결

7. 데이터 준비 심화 7.1 피벗 사람이 보기 편하게 작성해놓은 데이터는 컴퓨터가 이해하기 어렵다. 그래서 태블로에 '데이터 해석기 사용' 이라는 기능이 있으며, 이 기능을 사용하면 태블로 스스로가 파악하여 어느정도 데이터를 정리하여 불러온다. 하지만 태블로가 완벽히 정리할 수는 없으므로 간단하게 정리해보자. → Regions 열 추가 & 합계 행, 빈 행 제거 여전히 사람이 보기 편한 데이터로 컴퓨터가 인식하기 편한 데이터의 형식이 되려면 컬럼명인 연도가 열로 와야한다. 이를 해결하기 위해서는 피벗 기능을 사용하면 된다. → 피벗을 원하는 열을 드래그하여 선택 후 우클릭 > 피벗 7.2 메타데이터 그리드 메타데이터 그리드는 모든 열을 분리해서 보고 정보를 얻을 수 있게 해준다. 또한 열의 이름이나 열..

[스타터스 TIL] 18일차.Tableau 완벽 실전 교육 (2) - 데이터 블렌딩, 대시보드, 스토리

5. 조인, 블렌딩 5.1 데이터 블렌딩 ✅ 조인 - 행(row) 수준에서 데이터를 조합할 때 사용 ✅ 블렌딩 - 데이터 소스가 다른 세분화 수준을 가졌을 때 사용 → 이 상황에서 만약 조인을 하게 된다면 데이터 손실이 발생함 - 데이터 소스가 다른 시스템(ex. 엑셀, sql 등)에서 올 때 사용 → 데이터 블렌딩을 하려면, 기존 데이터에서 블렌딩할 데이터를 메인 화면에서 불러오면 된다. → 박스처리된 사슬 모양은 태블로가 이 데이터셋 사이에 Left Join을 수행하였다는 의미다. (Airline1과 Airline2의 데이터셋에서 Region 필드로 조인되었으며, 조인된 이유는 이름이 같기 때문이다.) Left Join 시 동일한 컬럼명 (Region)이 있으므로 Region이 공통 컬럼이 되어 Ai..

[스타터스 TIL] 17일차.Tableau 완벽 실전 교육 (1) - 막대그래프, 시계열 데이터, 지도, 산점도

1. 활용 데이터 Tableau Course: Download Practice Datasets | Page | Art of Visualization Download the top first file if you are using Windows and download the second file if you are using Mac. Remember, to import CSV files into Tableau, select the “Text File” option (not Excel). www.artofvisualization.com 위의 사이트에 있는 데이터를 활용하여 태블로 강의가 진행된다. 2. 막대그래프 & 태블로 기본 기능 2.1 데이터 📌 P1-OfficeSupplies.csv 2.2 문제 정의..

[스타터스 TIL] 16일차.데이터 드리븐 디자인씽킹 (3)

1. DDDT 활동 ① 공감 → ② 문제 정의 → ③ 아이데이션 (아이디어 발산) → ④ 프로토타입 → ⑤ 피드백 & 개선 1) 아이데이션 (아이디어 발산) 지난주까지 이틀동안 우리는 ① 공감 → ② 문제 정의 단계까지 진행하였다. 그리고 특정 문제에 대한 여러가지 유사단어, 연관단어를 찾아 상관 분석을 진행하거나, 데이터를 확인하며 나의 추론도 중간중간에 해보면서 아이디어를 생각해보는 ③ 아이데이션 (아이디어 발산) 단계를 진행하였다. 📌 아이템 : 일회용컵이 많이 소비되며, 다회용컵의 사용을 유도하고 있으나 실효성에 대한 문제가 제기된다. 📌 페르소나 : 대중교통을 이용하고 하루에 2잔의 커피를 마시며 텀블러를 가지고 있는 직장인 (일회용컵을 사용하고 싶지는 않고, 그렇다고 텀블러를 들고 다니기에는 ..

[유데미 스타터스 취업 부트캠프 4기] 데이터분석/시각화(태블로) - 3주차 학습 일지

3주차 교육에 대한 회고 (4L) 이번주에는 R에 대해 배우고 데이터 드리븐 디자인 씽킹 교육을 진행했다. R을 처음 배우는 거라 3일 만에 배우는데 생각보다 큰 어려움이 있었다. 파이썬이랑 비슷하지만 그래서 더 헷갈리기도 했다. R도 다양한 실습을 통해서 문법을 익혀야겠다. 그리고 강사님께서 직접 오셔서 데이터 드리븐 디자인 씽킹 교육을 진행했는데, 온라인 강의만 듣다가 오프라인 강의를 진행해서 그런지 또 색달랐다. 공부할 때와는 또 다른 머리를 써야해서 그런가, 재밌긴 한데 오히려 더 머리가 아팠다...! 다양한 머리를 써야 함을 다시 한번 더 깨달았다..!🤯 1. 이번주 수업에서 좋았던 점은? (Liked) 2. 이번주에 새롭게 배운 점은? (Learned) 3. 배운 것에 관해서 내가 부족했던 부..