Data Analysis

지식그래프/그래프DB 서베이 정리

알밤바 2023. 12. 19. 22:40
728x90
반응형

1. 워드넷 (WordNet)

- Thesaurus 방법의 일종
- 영어 어휘 데이터베이스
- python NLTK 라이브러리를 활용
- 단어가 동의어 별로 그룹지어져 있기 때문에 단어 사이의 유사도를 계산할 수 있음
    - 유사도는 0~1까지의 값을 가짐
    - 유사도의 값이 높을수록 의미가 비슷한 단어

 

[참고] 시소러스(Thesaurus)

- 단어의 의미에 따라 분류, 배열한 일종의 유의어 사전
- 문제점
    - 시대 변화에 대응하기 어려움
    - 사람을 쓰는 비용이 큼
    - 단어의 미묘한 차이를 표현할 수 없음

 

 

시소러스를 활용한 단어 의미 파악 - Natural Language Processing with PyTorch

그림을 보면 'bank'라는 단어에 대해 명사noun일 때의 의미 10개, 동사verb일 때의 의미 8개를 정의했습니다. 명사 'bank#2'의 경우에는 여러 다른 표현(depository finaancial institution#1, banking concern#1)들도 같

kh-kim.gitbook.io

 

 

자연어와 단어의 분산 표현

자연어와 단어의 분산 표현NLP (Natural Language Processing, 자연어처리)는 텍스트에서 의미있는 정보를 분석, 추출하고 이해하는 일련의 기술집합입니다.이러한 NLP를 활용항기 위하여 컴퓨터에게 단

wjddyd66.github.io

 

 

 

4. 자연어 처리 - Word Embedding(WordNet)

Word Sense 한글 단어들은 동음이의어가 참 많다. '차' 를 예로 들어보자. 잎이나 뿌리 등을 우려 마시는 것 바퀴가 달린 운송수단 짐을 실어 그 분량을 세는 단위 장기 말 중 '車' 빼기의 다른 말 몇

junsik-hwang.tistory.com

 

2. 지식그래프

- 사람의 기억으로 생성되는 지식 정보를 더 많은 양으로 정확하게 탐색하기 위한 기법
- 많은 양의 데이터와 데이터의 관계를 알아보기 쉽게 해주는 포맷
- 관계에 대한 분석이 가능하기에 앞뒤 단어의 관계를 확인하여 단순한 키워드의 조합이 아닌 문맥의 흐름을 이해할 수 있음
- [사용 사례] 구글 검색엔진, 인공지능 스피커, 직무 데이터 API
- 지식 그래프를 구현하기 위해 ‘그래프 데이터베이스’가 필요함
    - 그래프 DB를 이용하면 데이터 뿐만 아니라 데이터 간의 관계 정보를 형태 그대로 저장하고 저장된 정보를 꺼내어 쓸 수 있음
    - 그래프 DB에 저장된 정보는 패턴 분석이 가능하고 예외의 패턴까지 이해하기 때문에 시맨틱 검색도 가능함

 

[알쓸IT잡] 지식 그래프(Knowledge Graph)란?

함께 만들어 나가는 IT 용어사전, 알쓸IT잡! IT 분야의 모든 궁금증을 해결해 드립니다. 오직 알쓸IT잡에서만! 지식 그래프(Knowledge Graph) 란? “사람의 기억으로 생성되는 지식 정보를 좀 더 많은 양

bitnine.tistory.com

 

 

3. 그래프DB

- 특정 조건에 맞게 저장된 정형 데이터 위주의 처리만 가능했던 관계형 DB를 보완하기 위해 등장한 NoSQL(Not only SQL) 계열
- 수학적 그래프 이론 토대
- 개별 객체의 데이터를 나타내는 점 (Node / Vertex)
- 성질이 비슷한 객체들의 묶음 (Label)
- 객체 간의 관계를 표시하는 선 (Edge)
- 데이터를 실시간으로 저장, 운영 및 처리하여 최선의 데이터 운영 환경을 마련하는 기술을 구현한 솔루션
- 데이터를 저장하기 위한 저장소, 그래프 데이터를 실시간 처리하기 위한 그래프 프로세싱 엔진, 그래프 데이터를 효율적으로 저장하기 위해 지원되는 질의 언어로 구성
- 데이터 간의 관계 중심의 표현 및 처리가 주요한 모든 업무에 적용이 가능

 

 

[알쓸IT잡] 그래프 데이터베이스란? (Graph Database) - Part.1

함께 만들어 나가는 IT 용어사전, 알쓸IT잡! IT 분야의 모든 궁금증을 해결해 드립니다. 오직 알쓸IT잡에서만! 빅데이터,지식그래프,AI… 이게 다 무슨 말이야? 이제 ‘알쓸IT잡’에서 개념잡고 에

bitnine.tistory.com

 

- 테이블과 테이블을 조인하는 관계형 DB의 대안으로 등장
- 네트워크를 점과 선으로 연결한 그래프 모습으로 저장
- 관계를 저장해두는 DB
- 추천시스템 구현에 용이함 → 최근의 추천시스템은 관계를 분석하는 방식을 사용
    - ex. 넷플릭스는 추천 시스템 구축에 그래프 DB를 활용함

[참고] https://byline.network/2021/06/22-129/

 

4. 시맨틱 네트워크 (의미망)

- 지식 표현의 한 형태로, 개념을 나타내는 노드와 개념 간의 의미 상의 관계를 나타내는 선으로 구성되는 방향성 그래프
- 기계사전(machine-readable dictionaries)의 일반적 형태
- [대표적인 예] WordNet (영어단어 데이터베이스)
- 방향 그래프를 활용하여 개념 간의 관계를 표현
- 노드 : 객체, 개념, 사건 등을 표현
- 링크 : 노드 간의 관계 묘사
- [장점] 매우 복잡한 개념과 인과관계 표현에 용이함, 표현이 쉬움
- [단점] 지식량이 커지면 복잡해짐 → 조작이 어려움

https://lordofkangs.tistory.com/219

 

 

Ⅲ. 지식과 추론 – 2. 의미망과 추론이란 무엇인가요? – AI4School

처음 본 의미망보다 복잡해 보이지만 지식을 표현하는 방법은 같습니다. 노드들은 무엇이 있나요? 동물, 포유류, 토끼, 동그란 꼬리, 깡충 뛰기, 감각 기관, 호흡, 이동 등이 있습니다. 지식 사이

ai4school.org

 

 

지식표현 - 논리, 의미망, 프레임, 규칙

- 지식은 인공지능에서의 핵심!- 지식표현 연구는 지식을 체계적으로 조직, 저장, 효율적으로 이용하도록 하는 방법의 연구- 문제 영역이나 문제해결의 효율성을 위해 -> 적절한 지식 표현 방법

it-hhhj2.tistory.com

 

5. 온톨로지

- 사람들이 세상에 대하여 보고 듣고 느끼고 생각하는 것에 대하여 서로 간의 토론을 통하여 합의를 이룬 바를, 개념적이고 컴퓨터에서 다룰 수 있는 형태로 표현한 모델로, 개념의 타입이나 사용 상의 제약조건들을 명시적으로 정의한 기술
- 일종의 지식표현 (knowledge representation)
- 컴퓨터는 온톨로지로 표현된 개념을 이해하고 지식처리를 할 수 있게 됨
- 목적 : 정보 시스템의 대상이 되는 자원의 개념을 명확하게 정의하고 상세하게 기술하여 보다 정확한 정보를 찾을 수 있도록 함
- 시맨틱 웹을 구현할 수 있는 도구  / 지식 개념을 의미적으로 연결할 수 있는 도구
    → RDF, OWL, SWRL 등의 언어를 이용해 표현
    
- 합의된 지식을 나타내므로 어느 개인에게 국한되는 것이 아니라 그룹 구성원이 모두 동의하는 개념
- 프로그램이 이해할 수 있어야 하므로 여러 가지 정형화가 존재
    - formal : 사람의 개입 없이 기계가 읽을 수 있는 언어로 작성되어야 함
    - explicit : 여러가지 뜻을 가진 단어를 상황에 맞는 뜻으로 해석할 수 있어야 함
    - shared : 모든 사람 혹인 사물들에게 공유되어야 함
    - conceptualization : 표현하고자 하는 대상 세계의 개념들을 특정 모델로 추상화해야 함
    - domain : 표현하고자 하는 특정 영역이 존재

 

특정 영역이나 세계를 개념과 개념 간의 관계로 표현한 것이고, 이 표현은 사람이 아닌 컴퓨터가 이해하도록 구현되어야 한다. 또한 이러한 관계는 컴퓨터가 이해하고 추론을 하기 위하여는 애매하지 않고 명백하게 정의해 주어야 한다. 마지막으로 이와 같은 절차를 통하여 온톨로지가 구성되어도 이들이 반드시 가져야 하는 속성은 공유이다.

 

- 온톨로지 구성 요소
    - 클래스(class) : 일반적으로 우리가 사물이나 개념 등에 붙이는 이름 (ex. 키보드, 모니터, 사랑)
    - 인스턴스(instance)
        - 사물이나 개념의 구체물이나 사건 등의 실질적인 형태로 나타난 그 자체를 의미
        - ex. LG전자 ST-500 울트라슬림 키보드, 삼성 싱크마스터 Wide LCD 모니터, 로미오와 줄리엣의 사랑
        - 같은 표현의 개체가 어떠한 경우에는 클래스가 되었다가 인스턴스가 될 수 있음
    - 속성(property)
        - 클래스나 인스턴스의 특정한 성질, 성향 등을 나타내기 위하여 클래스나 인스턴스를 특정한 값(value)와 연결시킨 것
        - ex. 삼성 싱크마스터 Wide LCD 모니터는 XX인치이다. → has Size와 같은 속성을 정의할 수 있음
    - 관계(relation)
        - 클래스, 인스턴스 간에 존재하는 관계
        - taxonomic relation
            - 클래스, 인스턴스들의 개념 분류를 위하여 보다 폭넓은 개념과 구체적인 개념들로 구분하여 계층적으로 표현하는 관계
            - ex. ‘사람은 동물이다’와 같은 개념 간 포함관계 → ‘isA’ 관계
        - Non-taxonomic relation
            - ex. ‘운동으로 인해 건강해진다’ → ‘cause’ 관계 (인과관계)를 이용하여 표현

 

 

[Ontology] 온톨로지란? 시맨틱 웹의 기초

온톨로지(Ontology)란? 온톨로지(Ontology)란 사람들이 세상에 대하여 보고 듣고 느끼고 생각하는 것에 대하여 서로 간의 토론을 통하여 합의를 이룬 바를, 개념적이고 컴퓨터에서 다룰 수 있는 형태

narup.tistory.com

http://home.skku.edu/~ymko/proceedings/metadataandontology.pdf

 

6. OWL (웹 온톨로지 언어)

- Web Ontology Language / OWL
- 온톨로지를 만들기 위한 지식 표현 언어의 한 계열

 

https://www.koreascience.or.kr/article/CFKO200812651516236.pdf

 

WebVOWL을 이용하여 웹 기반 온톨로지 가시화 하기

WebVOWL을 이용하여 웹 기반 온톨로지 가시화 하기 1. 다운로드 및 설치 다음 사이트에서 WebV...

blog.naver.com

 

 

온톨로지 언어 간략하게 알아보기!

온톨로지(Ontology)를 사용한 모델링은 실세계에 있는 데이터를 기계가 이해할 수 있을 정도로 개념화하여 만든 모델을 만드는 기술을 의미하는데요. 이런 온톨로지 모델링에서 사용하는 언어가

seoit.tistory.com

 

 

온톨로지/LOD

각 도메인 별 온톨로지 구축 정보, 각 도메인 별 온톨로지의 클래스 트리 정보 및 구축된 온톨로지 데이터의 검색, SPARQL 쿼리 엔드포인트, 온톨로지 데이터의 세부 내역, 온톨로지 데이터의 OWL

www.frotoma.com

 

7. Neo4j

Neo4j사가 개발한 그래프 데이터베이스 관리 시스템

 

[Neo4j] 그래프를 다루는 데이터베이스 - 도입

P1. 기존 데이터 이식 P2. 데이터베이스 언어 (Cypher) P3. Graph Apps - Neo4j Bloom (가시화), NeoDash (Feature 트래킹) P4. graph data science - 알고리즘 (ex: pagerank, community detection) P5. Gephi와 연동, Large network 가시화

mons1220.tistory.com

 

 

neo4j 소개

요즘 그래프데이터베이스를 지겨보고 있다. AWS 넵튠(Neptune)와 Neo4j를 주로 살펴보고 있는데, 오랜 역사와 전통을 자랑하는 Neo4j를 우선 살펴볼 생각이다.그래프 데이터베이스(GDB)는 노드(node)와

www.joinc.co.kr

 

 

8. AttnlO 지식그래프

 

지식그래프에서 경로를 탐색하는 모델 AttnIO를 소개합니다

시작하며 이상형에 관한 설문조사를 보면 상위권에 오르는 유형 중 하나가 바로 '대화가 통하는 사람'입니다. 끊임없이 말을 주고받는 시간이 즐거워서 또 만나서 이야기를 나누고 싶다는 감정

tech.kakaoenterprise.com

 

 

지식 그래프에서 경로를 탐색하는 모델 ‘AttnIO’ [AI 이야기]

지식 그래프에서 경로를 탐색하는 모델 ‘AttnIO’ [AI 이야기], 김민주 기자, AI테크

magazine.hankyung.com

 

728x90
반응형

'Data Analysis' 카테고리의 다른 글

[MODE] Understanding Search Functional 리뷰 - 1  (0) 2022.11.11