3주차 교육에 대한 회고 (4L)
이번주에는 R에 대해 배우고 데이터 드리븐 디자인 씽킹 교육을 진행했다.
R을 처음 배우는 거라 3일 만에 배우는데 생각보다 큰 어려움이 있었다. 파이썬이랑 비슷하지만 그래서 더 헷갈리기도 했다. R도 다양한 실습을 통해서 문법을 익혀야겠다.
그리고 강사님께서 직접 오셔서 데이터 드리븐 디자인 씽킹 교육을 진행했는데, 온라인 강의만 듣다가 오프라인 강의를 진행해서 그런지 또 색달랐다. 공부할 때와는 또 다른 머리를 써야해서 그런가, 재밌긴 한데 오히려 더 머리가 아팠다...!
다양한 머리를 써야 함을 다시 한번 더 깨달았다..!🤯
1. 이번주 수업에서 좋았던 점은? (Liked)
2. 이번주에 새롭게 배운 점은? (Learned)
3. 배운 것에 관해서 내가 부족했던 부분은? (Lacked)
4. 앞으로 뭘 더 하면 좋을까? (Longed for)
1. 이번주 수업에서 좋았던 점은? (Liked)
✔ 데이터 드리븐 디자인 씽킹 강의
데이터 분석 분야로 직무 전환을 준비하면서 주로 프로그래밍 언어를 습득하는 것 위주로 진행하였다.
그래서인지 데이터 드리븐 디자인 씽킹 강의를 들으면서 특정 물체, 문제를 깊게 관찰하고 생각해보는 시간을 가지게 되었다. 평소에 이렇게 문제에 대해 관찰하고 생각해본 적이 거의 없어서 생각보다 힘들었다. 생각하는 힘이 얼마나 필요한지 다시 한번 더 절실히 깨닫게 되는 경험이어서 좋았다.
2. 이번주에 새롭게 배운 점은? (Learned)
✔ 생각하는 힘
위에서도 말했듯이, 문제에 대해 이렇게 고민하고 생각해본 적이 없다. 그래서 DDDT 강의가 재밌기도 했지만 나에겐 버겁고 꽤나 힘들었다. 그럼에도 꼭 필요한 훈련이었기 때문에 수업에 열심히 응했다.
데이터 분석 분야 중에서도 나는 데이터 수집, 전처리, 가공 쪽보다는 데이터를 요리조리 분석하면서 문제를 해결할 수 있도록 인사이트까지 제시하는 업무를 하고 싶다.
그렇기에 무엇보다도 이 문제를 어떻게 접근하고, 어떻게 관찰하고, 어떻게 공감하는지에 대한 훈련을 할 수 있어서 이 수업이 나에겐 큰 도움이 되었고, 앞으로도 많은 도움이 될 듯하다.
3. 배운 것에 관해서 내가 부족했던 부분은? (Lacked)
✔ 아직은 부족한 '문제에 공감하기'
보행자 사고 데이터를 보고 문제를 정의하기 활동, 인터뷰를 통해 의뢰인의 니즈에 맞게 부엌 인테리어하기 활동을 통해서 생각보다 내가 1차원적으로 생각하고 있다는 것을 깨달았다.
너무 있는 그대로 문제를 바라보고, 내가 가지고 있는 경험, 생각 속에서만 문제를 풀려고 하는 것이 보였다. 그래서인지 앞만 보고 달리는 경주마와 같은 결과물이 나왔다. 이러한 경험을 통해, 다양한 방식으로 생각하려고 여러 훈련을 해야겠다는 생각이 들었다.
다양한 경험, 책 읽기 등을 통해서 보완하려고 노력해야겠다.
4. 앞으로 뭘 더 하면 좋을까? (Longed for)
✔ 다양한 사례 공부, 책 읽기
다양한 시각으로 문제를 바라보지 못하는 약점을 다양한 문제해결, 데이터 분석 사례를 공부하고 책을 읽음으로써 보완하고자 한다.
예전에 사두고 읽지 않은 책 '린 분석'을 읽어서 다양한 관점에서 생각을 하는 힘을 길러야 겠다.
3주차 교육 내용 - 23.02.20 ~ 23.02.24
📌데이터 처리 과정에서 R의 역할
- R은 통계학자가 만든 프로그램으로, 통계분석에 용이하다.
- 기능은 파이썬과 유사하며, 시각화 기능도 가지고 있다.
📌 데이터 시각화
1) ggplot 라이브러리 활용
ggplot(data, aes(x = Day, y = Temp))+ # x축 : Day, y축 : Temp
geom_line()+ # 선 그래프
facet_wrap(~Month, # 월 별 서브 그래프 그리기
labeller = label_both, # 라벨 추가
nrow = 3, ncol = 2)+ # 3행 2열로 서브 그래프 그리기
stat_smooth(level = 0.95)+ # 회귀선 추가 (신뢰구간 : 0.95)
ggtitle('월별 기온') # 제목 작성
2) 워드 클라우드 시각화
wordcloud(words = df_word$word,
freq = round(sqrt(df_word$freq)), # 빈도 (sqrt 함수 사용하여 차이 줄임)
min.freq = 5, # 최소 단어 빈도
max.words = 200, # 표현 단어수
random.order = F, # 고빈도 단어 중앙 배치
rot.per = .1, # 회전 단어 비율
scale = c(4, 0.5), # 단어 크기 범위
colors = pal) # 색상 목록
3) 단계 구분도
ggChoropleth(data = crime,
aes(fill = Murder, map_id = state),
map = states_map)
# interactive = T : 사용자의 마우스를 따라서 추가적인 데이터 정보 제공
ggChoropleth(data = crime,
aes(fill = Murder, map_id = state),
map = states_map,
interactive = T)
4) 시계열 데이터
ggplot(data = data_real, aes(x = date))+
geom_line(aes(y = pred_close, col = 'red'))+
geom_line(aes(y = close))+
scale_x_date(breaks = datebreaks)+
theme(axis.text.x = element_text(angle = 30, hjust = 1))
📌 통계 분석
1) Z-검정 (z.test 함수 사용)
# z.test 함수 사용
install.packages('BSDA')
library('BSDA')
z.test(x = women$height,
alternative = 'two.sided', # 양측검정
mu = 63, # 모집단 평균
sigma.x = 3, # 모집단 표준편차
conf.level = 0.95) # 신뢰수준
▶ p-value(0.009)이 유의수준(0.05)보다 작으므로 귀무가설을 기각함
→ 귀무가설 기각. 여자 평균 키는 63인치가 아니다.
2) T-검정 (t.test 함수 사용)
# t.test 함수 사용
t.test(x = women$height,
alternative = 'two.sided', # 양측검정
mu = 63, # 모집단 평균
conf.level = 0.95) # 신뢰수준
▶ p-value(0.10)이 유의수준(0.05)보다 크므로 귀무가설을 채택함
→ 귀무가설 채택. 여자 평균 키는 63인치다.
📌 데이터 드리븐 디자인 씽킹
1) 데이터 기반 문제 정의하기
보행사망자가 우리나라가 특히 많고, 65세 이상이 많으며, 18시 이상에 많은 것이 왜 문제인가?
→ 요즘, 65세 이상의 사람들도 일을 하는 세대인데 65세 이상의 보행 사망자가 많아지면 일을 하는 사람들이 줄어들어 국가 경제에 영향을 미칠 수 있다. 또는 국민보험료가 올라가게 되어 청년층의 부담이 커진다. 등 다양한 이유를 추측해볼 수 있다.
누가 문제인지(who)에서는 사고가 많이 발생하는 시간대를 고려해서 자동차 운전자와 65세 이상 보행자가 문제라고 생각을 했다.
2) 인터뷰를 통해 의뢰인의 니즈를 만족시키는 부엌 인테리어하기
가족의 특이사항 (이사를 오게 된 이유 등), 아내와 남편 중 집안일을 더 많이 하는 사람은 누구인지 등 이러한 질문을 하지 않았기 때문에 가장 중요한 사실을 알아채지 못했다.
이를 통해서 인터뷰에서 질문의 방향에 따라 결과가 완전히 달라질 수 있음을 배웠다. 단순한 취향보다는 이 사람의 실제 니즈를 파악하는 것이 중요하다는 것도 깨닫게 되었다.
우리가 알아 낸 의뢰인의 정보 | 우리가 생각한 인테리어 |
- 남편, 아내, 3살 아이, 임신 중 - 남편 180cm, 아내 165cm - 아내의 인테리어 취향은 화이트, 모던 스타일 - 예산은 1000만원 이하 - 요리는 자주하지 않기에 부엌이 크지 않아도 됨 - 결혼한지는 5년이 되었으며, 이번에 이사를 했는데 이사한 집이 5년정도 됨 - 부엌이 트여있으면 좋겠다. |
- 화이트 모던 스타일 - 키가 큰 임산부이기에 숙이기 어려우므로 상부장 위주로 수납공간 형성 - 개방감 있는 주방 - 아기 관련 가전제품을 둘 수 있는 아일랜드 식탁과 아기 의자 - 주방이 크지 않아도 됨 - 최신 식기세척기, 음식물 처리기, 인덕션 - 4인 가족이 앉을 수 있는 식탁 - 밝은 흰색 조명 |
3) 문제 해결 디자인 씽킹
✅ 아이템 선정
일회용컵이 많이 소비되며, 다회용컵의 사용을 유도하고 있으나 실효성에 대한 문제가 제기된다.
✅ 페르소나 선정
문제를 가지고 있는 타겟층을 명확하게 하기 위해 페르소나를 선정
페르소나를 대중교통을 이용하고 하루에 2잔의 커피를 마시며 텀블러를 가지고 있는 직장인으로 잡았다. 그리고 이 사람은 환경 문제에 관심이 많아 적극적으로 행동을 하는 사람이 아니며 일반 사람들처럼 쌓여져있는 일회용컵을 보며 양심의 가책을 느껴 가끔 텀블러를 사용하는 정도의 소극적인 행동을 하는 사람이다. 그러다보니 일회용컵을 사용하고 싶지는 않고, 그렇다고 텀블러를 들고 다니기에는 너무 번거로움이 많다는 문제가 있다.
✅ 고객 여정 지도 만들기
✅ 관점 서술문 (Point of View)
▶ 김스벅은 일회용품 사용 시 죄책감을 줄일 수 있는 방법이 필요하다. 왜냐하면 하루에 너무 많은 일회용품을 사용하는 것을 눈으로 확인하기 때문이다.
▶ 김스벅은 텀블러와 일회용컵 없이도 커피를 자유롭게 마실 방법이 필요하다. 왜냐하면 일회용컵을 사용하면 죄책감이 들고, 텀블러를 사용하기에는 번거롭기 때문이다.
배운 내용 적용한 코드 (깃허브)
GitHub - aramssong/Udemy_STARTERS
Contribute to aramssong/Udemy_STARTERS development by creating an account on GitHub.
github.com
이번주에 작성한 TIL
[스타터스 TIL] 11일차.기초부터 익히는 R (1) - R 자료 구조, 변수, 함수, 패키지
[스타터스 TIL] 12일차.기초부터 익히는 R (2) - R 연산자, 조건문, 반복문, 함수, 시각화
[스타터스 TIL] 13일차.기초부터 익히는 R (3) - ggplot2, 텍스트 마이닝, 단계 구분도, 통계분석
[스타터스 TIL] 14일차.데이터 드리븐 디자인씽킹 (1)
[스타터스 TIL] 15일차.데이터 드리븐 디자인씽킹 (2)
* 유데미 큐레이션 바로가기 : https://bit.ly/3HRWeVL
* STARTERS 취업 부트캠프 공식 블로그 : https://blog.naver.com/udemy-wjtb
본 후기는 유데미-웅진씽크빅 취업 부트캠프 4기 데이터분석/시각화 학습 일지 리뷰로 작성되었습니다.
'웅진X유데미 STARTERS > 주간 학습일지' 카테고리의 다른 글
[유데미 스타터스 취업 부트캠프 4기] 데이터분석/시각화(태블로) - 6주차 학습 일지 (0) | 2023.03.19 |
---|---|
[유데미 스타터스 취업 부트캠프 4기] 데이터분석/시각화(태블로) - 5주차 학습 일지 (1) | 2023.03.12 |
[유데미 스타터스 취업 부트캠프 4기] 데이터분석/시각화(태블로) - 4주차 학습 일지 (1) | 2023.03.05 |
[유데미 스타터스 취업 부트캠프 4기] 데이터분석/시각화(태블로) - 2주차 학습 일지 (0) | 2023.02.19 |
[유데미 스타터스 취업 부트캠프 4기] 데이터분석/시각화(태블로) - 1주차 학습 일지 (0) | 2023.02.12 |