반응형

전체 글 184

[스타터스 TIL] 11일차.기초부터 익히는 R (1) - R 자료 구조, 변수, 함수, 패키지

1. R 이란? - 전산통계학을 위한 프로그래밍 언어 - 데이터 통계처리 및 시각화에 특화되어 있음 1.1 R의 장단점 ✅ 장점 언어적 측면 - 통계 계산용 패키지 매우 우수 → dplyr, tidyr, stringr, lubridate - 강력한 시각화 패키지 제공 → ggplot2, rgl, htmlwidgets - 뛰어난 확장성 → 웹기반 분석결과 리포팅 (ggvis, shiny), 인공지능 연구(lme4/nlme, randomForest, caret, deepnet) 사용자 측면 - 유저 커뮤니티 활성화 → 대부분의 유저들이 유사한 목표를 가짐, 디버깅 용이 - 상대적으로 학습 난이도 낮음 - 다양한 os 지원 - 무료 ✅ 단점 - 느린 속도 : 범용 프로그래밍 언어보다 처리 속도 느림 - 한정된..

[유데미 스타터스 취업 부트캠프 4기] 데이터분석/시각화(태블로) - 2주차 학습 일지

2주차 교육에 대한 회고 (4L) 벌써 2주차가 끝나간다. 길면 길었고 짧으면 또 짧은 듯하다.이번 주는 동일한 사람들과 자리를 앉아서 5일 내내 같이 점심 먹고 같이 이야기를 했다. 그래서인지 확실히 지난 주보다 더 가까워지고 편해졌다.다음 주는 또 조원들이 바뀌는데, 새로운 사람들과 이야기해볼 수 있는 기회가 생겨서 좋다 :) 이번 주는 파이썬과 SQL 모두 끝이 났다.특히 파이썬에서 시각화에 대해 많이 부족했는데, 이번 교육을 통해서 파이썬으로 시각화를 하는 것에 대해 자세하게 배워서 매우 만족스럽다. 1. 이번주 수업에서 좋았던 점은? (Liked) 2. 이번주에 새롭게 배운 점은? (Learned) 3. 배운 것에 관해서 내가 부족했던 부분은? (Lacked) 4. 앞으로 뭘 더 하면 좋을까? ..

[스타터스 TIL] 10일차.SQL을 통한 데이터활용과 분석 (3) - 집계함수, 순위함수, 실습

1. 새롭게 알게된 내용 1.1 수치형 집계함수 ✅ ABS(숫자) : 숫자 절대값 출력 SELECT ABS(-10); -- [OUT] 10 ✅ 소수점 올림 / 내림 - CEILING(숫자) : 올림 - FLOOR(숫자) : 내림 -- 소수점 올림 SELECT CEILING(30.75); -- [OUT] 31 SELECT CEILING(40.25); -- [OUT] 41 -- 소수점 내림 SELECT FLOOR(30.75); -- [OUT] 30 SELECT FLOOR(40.25); -- [OUT] 40 ✅ ROUND(숫자, 자릿수) : 소수점 반올림 SELECT ROUND(30.75, 1); -- [OUT] 30.8 SELECT ROUND(100.925, 2); -- [OUT] 100.93 ✅ 큰 수, ..

[스타터스 TIL] 9일차.SQL을 통한 데이터활용과 분석 (2) - 기본 문법

1. 새롭게 알게된 내용 1.1 단일조건 if vs 다중조건 case when ✅ 단일조건 if - IF (조건, 참일 때 값, 거짓일 때 값) SELECT IF (100 > 300, '크다', '작다'); ✅ 다중조건 case when - CASE WHEN 조건1 THEN 반환값1 WHEN 조건2 THEN 반환값2 ELSE 충족되는 조건이 없을 때 반환값 END SELECT custid , SUM(saleprice) AS '총구매액' , (CASE WHEN (SUM(saleprice) >= 60000) THEN '최우수고객' WHEN (SUM(saleprice) >= 45000) THEN '우수고객' WHEN (SUM(saleprice) >= 30000 ) THEN '일반고객' ELSE '유령고객' E..

[스타터스 TIL] 8일차.SQL을 통한 데이터활용과 분석 (1) - DDL, DML, WHERE절

1. 새롭게 알게된 내용 1.1 SQL 명령어 DML (Data Manipulation Language) - 데이터 조작어로 검색 및 수정 기능 제공 - SELECT, INSERT, UPDATE, DELETE, MERGE DDL (Data Definition Language) - 데이터 구조를 생성, 변경, 삭제 등의 기능을 제공 - CREATE, ALTER, DROP, RENAME DCL (Data Control Language) - 데이터에 대한 권한 관리 및 트랜잭션 제어 - GRANT, REVOKE 1.2 SHOW 명령어 -- 환경변수 확인 SHOW VARIABLES; -- char로 시작하는 환경변수 확인 SHOW VARIABLES LIKE 'char_%'; -- 데이터베이스 확인 SHOW DA..

[스타터스 TIL] 8일차.파이썬 데이터 시각화 (5) - 시각화 실습

1. 새롭게 알게된 내용 1.1 다중 막대그래프 ## 1. x축을 숫자로 표현하기 위해 index 리스트를 만들기 import numpy as np x_index = np.arange(1, len(df_84_price)+1) # [out] array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17]) ## 2. figure 크기 설정 plt.rcParams['figure.figsize'] = (15, 5) ## 3. 각 그래프의 위치를 조정하기 위해 위에서 만든 index 리스트 활용 # x축을 숫자로 해야 위치 조정이 가능함 # 각 그래프의 너비를 0.2로 설정 (width) plt.bar(x_index - 0.3, df_84_price['최대..

[스타터스 TIL] 7일차.파이썬 데이터 시각화 (4) - 시각화 실습

1. 새롭게 알게된 내용 ✅ 그래프 중 특정 데이터 표시 + 텍스트 추가하기 # 서울시에서 폭염이 가장 심했던 날 best10 df_seoul_hotestday = df_seoul_hotday.nlargest(10, '최고기온(°C)') df_seoul_hotestday → 빨간색 박스처리한 데이터를 특정 그래프로 표현 - 추가로 표시할 부분은 plt.plot()을 추가하면 됨 - 특정 데이터의 위치(x, y)는 iloc로 데이터프레임의 인덱스로 접근 ## 1. plot 기본 설정 plt.plot(df_seoul_hotday['일시'], df_seoul_hotday['최고기온(°C)'], 'r.') # x, y축 라벨 표시 plt.xlabel('일시') plt.ylabel('최고기온(°C)') # 제목 ..

[스타터스 TIL] 6일차.파이썬 데이터 시각화 (3) - seaborn, 실습

1. 새롭게 알게된 내용 1.1 seaborn 그래프 지난주에는 matplotlib 패키지를 활용한 그래프 그리기 위주로 공부했다면, 오늘은 seaborn 패키지를 활용하는 것을 배웠다. 그래서 titanic 데이터를 seaborn의 다양한 그래프로 그려보았다. GitHub - aramssong/Udemy_STARTERS Contribute to aramssong/Udemy_STARTERS development by creating an account on GitHub. github.com ✅ sns.countplot() - x축에 사용될 컬럼만 지정해주면 해당 컬럼의 갯수를 count 해주어 그래프로 표현 - y를 그룹핑할 컬럼을 'hue = '로 지정 plt.figure(figsize = (10, 5..

[유데미 스타터스 취업 부트캠프 4기] 데이터분석/시각화(태블로) - 1주차 학습 일지

웅진 X 유데미 STARTERS 합격 :) 그토록 간절히 원하던 STARTERS에 합격했다. 취준을 하면서 너무나 많은 서류 광탈과 면접 불합격을 하면서, 내가 괜히 직무 전환을 했는가에 대한 회의감이 사알짝 들 때, STARTERS 서류 합격 연락을 받았다. 너무나 행복했다. 코테와 면접이 있지만 그래도 서류라도 붙은 것만으로도 좋았다. ✔ 코딩테스트 SQL로 코딩테스트를 봤다. 코딩 테스트 전 3~4일동안 열심히 코테 문제를 풀었다. 프로그래머스 문제는 물론이며, 더 난이도가 있는 리트코드 문제도 풀면서 SQL을 익혀갔다. 그리고 코딩테스트를 나름 수월히 끝낼 수 있었다! ✔ 면접 면접을 보면서 '이 사람이 얼마나 데이터 분석에 관심이 많으며, 어떻게 노력하고 있는지'를 많이 보시는 것 같았다. 그렇..

[스타터스 TIL] 5일차.파이썬 데이터 시각화 (2) - 그래프 종류

1. 새롭게 알게된 내용 팀원 분 중 한 분이 TIL을 쓸 때, 단순히 배웠던 부분을 정리하기 보다는 이것을 실제 데이터셋에 스스로 적용해보며 공부하고 TIL을 쓰는 것이 효과적이라고 하셨다. 그래서 오늘 강의를 다 듣고 데이터셋에 다양한 시각화를 그려보기 위해 시도를 하였고, 이것을 바탕으로 TIL을 작성하고자 한다. 1.1 막대그래프, 히스토그램, 히트맵 (Titanic 데이터 셋) GitHub - aramssong/Udemy_STARTERS Contribute to aramssong/Udemy_STARTERS development by creating an account on GitHub. github.com 📌 공통 스타일 지정하기 plt.rcParams를 활용하여 폰트, 제목, 그리드 등 다양한..

반응형