반응형

AIFFEL 15

[Going Deeper(NLP)] 1. 텍스트 데이터 다루기

해당 포스팅은 AIFFEL에서 제공한 학습자료를 통해 공부한 것을 정리한 것임을 밝힙니다. 학습목표 분산 표현에 대한 직관적 이해를 얻는다. 문장 데이터를 정제하는 방법을 배운다. 토큰화의 여러 가지 기법들을 배운다. 단어 Embedding을 구축하는 방법에 대해 가볍게 맛본다. 1. 들어가며 자연어(Natural Language)는 일상에서 자연히 발생하여 쓰이는 언어를 뜻한다. 자연어와 반대되는 언어 중 하나는 프로그래밍 언어라고 할 수 있다. 이 두 개의 언어의 본질적인 차이는 자연어는 '문맥 의존 문법(Context-sensitive Grammar), 프로그래밍 언어는 '문맥 자유 문법(Context-free Grammar)'이라는 각 문법을 따른다는 것이다. 기계적으로 언어를 해석하는 파서를 만..

[E-15] 문자를 읽을 수 있는 딥러닝 (OCR)

해당 포스팅은 AIFFEL에서 제공한 학습자료를 통해 공부한 것을 정리한 것임을 밝힙니다. 실습목표 OCR의 과정을 이해합니다. 문자인식 결과의 표현방식을 이해합니다. 파이썬을 통해 OCR을 사용할 수 있습니다. 1. OCR이란? OCR은 Optical Character Recognition으로 광학 문자 인식이라고 한다. 구글의 클라우드 기반 OCR API로 손십게 딥러닝 기반의 최신 OCR을 테스트해볼 수 있다. 구글 OCR API 구글 API에서는 문자의 영역을 사각형으로 표현하고 우측에 'Block'과 'Paragraph'로 구분해서 인식 결과를 나타낸다. 구글 API가 이미지에 박스를 친 다음 박스 별 텍스트의 내용을 알려준 것처럼 문자 모델은 보통 2단계로 이루어진다. 1) Text Detec..

AIFFEL/Exploration 2022.02.25

[E-14] 아이유팬이 좋아할 만한 다른 아티스트 찾기(추천 시스템)

해당 포스팅은 AIFFEL에서 제공한 학습자료를 통해 공부한 것을 정리한 것임을 밝힙니다. 학습 목표 추천 시스템의 개념과 목적을 이해한다. Implicit 라이브러리를 활용하여 Matrix Factorization(이하 MF) 기반의 추천 모델을 만들어 본다. 음악 감상 기록을 활용하여 비슷한 아티스트를 찾고 아티스트를 추천해 본다. 추천 시스템에서 자주 사용되는 데이터 구조인 CSR Matrix을 익힌다 유저의 행위 데이터 중 Explicit data와 Implicit data의 차이점을 익힌다. 새로운 데이터셋으로 직접 추천 모델을 만들어 본다. 1. 추천 시스템이란? 온라인 콘텐츠 서비스에서 데이터 분석과 AI 기술을 접목한 추천 시스템의 활용은 이제 필수가 되고 있다. 음원 서비스, 스트리밍 서..

AIFFEL/Exploration 2022.02.24

[풀잎스쿨/cs231n] Lecture 10.Recurrent Neural Networks (RNN)

이 포스팅은 cs231n 강의와 활용된 자료를 바탕으로 한 포스팅입니다. 처음 공부하였을 때 정리한 포스팅이라 내용이 많이 부족합니다. 1. Recurrent Neural Networks 1.1 RNN : Process Sequence RNN은 네트워크가 다양한 입력, 출력을 다룰 수 있게 해준다. 그리고 가변 길이의 데이터를 다루기 위해 필요한 일반적인 방법(paradigm)이다. * one to many 모델 : 입력은 단일 입력이지만 출력은 가변 출력이다. (ex. Image Captioning / 이미지를 그를 설명하는 던어들을 만들어 낼 때) * many to one 모델 : 입력은 가변 입력이며 출력은 단일 출력이다. (ex. Sentiment Classification / 입력은 문장이 될 ..

AIFFEL/cs231n 2022.02.20

[풀잎스쿨/cs231n] Lecture 2. Image Classification pipeline

이 포스팅은 cs231n 강의와 활용된 자료를 바탕으로 한 포스팅입니다. 처음 공부하였을 때 정리한 포스팅이라 내용이 많이 부족합니다. Image Classification 컴퓨터가 보는 고양이 사진은 여러 픽셀값으로 구성되어 있다. 사진의 부분을 옮길 때마다 픽셀값은 변한다. 사진을 분류할 때 어려운 점? Illumination : 영상의 밝기 Deformation : 다양한 자세 Occlusion : 물체의 일부만 보임 Background Clutter : 물체가 배경과 유사함 Intra-class variation : 다양한 종이 있으며 종에 따라 특징이 다름 1. Data-Driven Approach 1.1 Nearest Neighbor 모든 데이터와 라벨들을 학습 가장 유사한 학습 이미지의 라벨..

AIFFEL/cs231n 2022.02.19
반응형