반응형

데이터분석 69

[스타터스 TIL] 6일차.파이썬 데이터 시각화 (3) - seaborn, 실습

1. 새롭게 알게된 내용 1.1 seaborn 그래프 지난주에는 matplotlib 패키지를 활용한 그래프 그리기 위주로 공부했다면, 오늘은 seaborn 패키지를 활용하는 것을 배웠다. 그래서 titanic 데이터를 seaborn의 다양한 그래프로 그려보았다. GitHub - aramssong/Udemy_STARTERS Contribute to aramssong/Udemy_STARTERS development by creating an account on GitHub. github.com ✅ sns.countplot() - x축에 사용될 컬럼만 지정해주면 해당 컬럼의 갯수를 count 해주어 그래프로 표현 - y를 그룹핑할 컬럼을 'hue = '로 지정 plt.figure(figsize = (10, 5..

[유데미 스타터스 취업 부트캠프 4기] 데이터분석/시각화(태블로) - 1주차 학습 일지

웅진 X 유데미 STARTERS 합격 :) 그토록 간절히 원하던 STARTERS에 합격했다. 취준을 하면서 너무나 많은 서류 광탈과 면접 불합격을 하면서, 내가 괜히 직무 전환을 했는가에 대한 회의감이 사알짝 들 때, STARTERS 서류 합격 연락을 받았다. 너무나 행복했다. 코테와 면접이 있지만 그래도 서류라도 붙은 것만으로도 좋았다. ✔ 코딩테스트 SQL로 코딩테스트를 봤다. 코딩 테스트 전 3~4일동안 열심히 코테 문제를 풀었다. 프로그래머스 문제는 물론이며, 더 난이도가 있는 리트코드 문제도 풀면서 SQL을 익혀갔다. 그리고 코딩테스트를 나름 수월히 끝낼 수 있었다! ✔ 면접 면접을 보면서 '이 사람이 얼마나 데이터 분석에 관심이 많으며, 어떻게 노력하고 있는지'를 많이 보시는 것 같았다. 그렇..

[스타터스 TIL] 5일차.파이썬 데이터 시각화 (2) - 그래프 종류

1. 새롭게 알게된 내용 팀원 분 중 한 분이 TIL을 쓸 때, 단순히 배웠던 부분을 정리하기 보다는 이것을 실제 데이터셋에 스스로 적용해보며 공부하고 TIL을 쓰는 것이 효과적이라고 하셨다. 그래서 오늘 강의를 다 듣고 데이터셋에 다양한 시각화를 그려보기 위해 시도를 하였고, 이것을 바탕으로 TIL을 작성하고자 한다. 1.1 막대그래프, 히스토그램, 히트맵 (Titanic 데이터 셋) GitHub - aramssong/Udemy_STARTERS Contribute to aramssong/Udemy_STARTERS development by creating an account on GitHub. github.com 📌 공통 스타일 지정하기 plt.rcParams를 활용하여 폰트, 제목, 그리드 등 다양한..

[스타터스 TIL] 4일차.파이썬 데이터 시각화 (1) - 기본 그래프

1. 새롭게 알게된 내용 1.1 기본 그래프 그리기 📌 y축 데이터로 그리기 - y축 : 1차원 리스트, 튜플, 시리즈 데이터 - x축 : 데이터의 인덱스로 자동 지정됨 data = [1, 5, 3, 9, 7] plt.plot(data) plt.show() 📌 x축, y축 데이터로 그리기 - x축과 y축 데이터의 길이가 같아야 함 x = [1,5,6,9,10] y = [1,5,3,9,7] plt.plot(x, y) plt.show() 1.2 그래프의 종류 1.2.1 시간의 시각화 📌 선 그래프 → plt.plot() age = [7,8,9,10,11,12,13,14,15] height = [122.1, 127.9, 133.4, 138.8, 142.7, 151.4, 155.6, 165.0, 169.2] p..

[스타터스 TIL] 4일차.파이썬 데이터 분석 (4) - 분석 실습, value_counts, groupby

1. 새롭게 알게된 내용 이제까지 배웠던 파이썬 문법들을 활용해서 데이터 분석 실습을 하는 방향으로 강의가 진행되었다. 혼자서 실습을 다시 해보면 좋을 것 같아서 실습 프로젝트를 혼자서 하나씩 해보면서 정리 중이다. (일단 우선은 서울시 코로나19 현황부터!) 그리고 오전에 조원들과 공부한 내용을 이야기한 시간에서도 나온 문제인데, 바로 value_counts()와 groupby()의 차이다. groupby()도 쓸 수 있을 것 같은데, 강사님께서 주로 value_counts()를 쓰는 이유는 무엇일까 궁금해서 찾아보고 정리하고자 한다. 1.1 value_counts() vs groupby() 📌 value_counts() - 컬럼의 값에 대한 횟수를 반환함 - 출력 시, 횟수가 많은 것부터 정렬됨 (내..

[스타터스 TIL] 3일차.파이썬 데이터 분석 (3) - 판다스, 데이터프레임

1. 새롭게 알게된 내용 1.1 데이터프레임(DataFrame) 1) 랜덤 보기 - df.sample(n) : 랜덤 n개의 데이터 보기 (n을 생략하면 1개의 샘플 출력) - df.sample(frac = ) : 랜덤 샘플 비율로 보기 (지정한 비율의 샘플을 출력) 2) 높은 순, 낮은 순 보기 - df.nlargest(갯수, 컬럼명) : 컬럼명에서 높은 순으로 n개의 데이터 출력 - df.nsmallest(갯수, 컬럼명) : 컬럼명에서 낮은 순으로 n개의 데이터 출력 3) 데이터 요약 보기 - df.shape : 행,열의 크기 보기 - df.columns : 컬럼명 보기 - df.index : 인덱스 보기 - df.dtypes : 데이터의 자료형 보기 - df.info() : 데이터프레임의 정보보기 -..

[스타터스 TIL] 2일차.파이썬 데이터 분석 (2) - 딕셔너리, 함수, 클래스

1. 새롭게 알게된 것 오늘은 내가 약했던 부분인 딕셔너리, 함수, 클래스에 대해 공부했다. 역시나 새롭게 다가오는 부분이 많아서 정리가 필요하다. ▶ 딕셔너리, 함수, 전역변수vs지역변수, 람다표현식, map함수, 클래스, 파이썬 내장모듈 1.1 딕셔너리 - 딕셔너리의 value에는 모든 자료형을 혼합하여 사용할 수 있다. - 딕셔너리의 key에는 숫자, 문자열, 부울형, 튜플을 사용할 수 있다. - 중복된 key를 사용하여 딕셔너리를 만들면, 중복된 항목 중 하나만 출력된다. 1.1.1 딕셔너리 만들기 총 4가지의 방법이 있으며, 내가 편한 방식대로 사용하면 될 듯하다. ## 1. 딕셔너리명 = dict(키1=값1, ...) # 키에 따옴표를 쓰지 않음! menu1 = dict(김밥 = 2000, 떡..

[스타터스 TIL] 1일차.파이썬 데이터 분석 (1) - 자료형, 리스트, 튜플

1. TIL(Today I Learned)란? 매일 내가 공부한 것을 정리하는 것이다. 내가 공부한 것들 중에 내가 몰랐던 것을 배운 것 위주로 정리할 예정이다! 2. 새롭게 알게된 것 1일차에는 자료형, 반복문, 리스트, 튜플 등 파이썬의 기본이 되는 내용을 배웠다. 그 중에서도 리스트를 다룰 때 사용하는 메서드들을 정확하게 인지하고자 오늘의 TIL에 정리한다. 2.1 구분자, 끝문자 지정 - 구분자 : sep = ' ' - 끝문자 : end = ' ' # 구분자 print('hello', 'python', sep = ',') [out] hello,python # 끝문자 print('안녕하세요', end = '!!') print('반갑습니다', end = '!!') [out] 안녕하세요!!반갑습니다!!..

[MODE] Understanding Search Functional 리뷰 - 1

Understanding Search Functionality | SQL Analytics Training - Mode In this lesson we'll cover: Before starting, be sure to read the overview to learn a bit about Yammer as a company. The product team is determining priorities for the next development cycle and they are considering improving the site's search functionality mode.com 우리 다음 분기에 검색 기능 개선을 하려고 하는데, 지금 사람들이 어떻게 쓰고 있는지, 어떻게 개선되면 좋을지 데이터..

Data Analysis 2022.11.11
반응형