
요즘 많은 기업들이 데이터의 중요성을 깨닫고 방대한 양의 데이터를 쌓고 있지만,
"데이터가 많은데 믿을 수 없다"는 이야기들이 곳곳에서 나온다.
나 또한 데이터 분석가로 일하면서 느낀 가장 큰 문제는 데이터가 있어도 제대로 활용할 수 없다는 점이었다.
결국 문제는 '데이터의 양'이 아니라 '데이터의 질'이었다.
이제는 단순히 데이터를 많이 수집하는 것이 아니라, 신뢰할 수 있는 데이터를 수집하고 관리하는 것에 초점이 맞춰지고 있다.
그래서 토스, 카카오 등 여러 기업에서는 조직 구성원이 데이터를 신뢰할 수 있도록 설계·관리하는 DataOps Manager 직무가 생겨나고 있다.
데이터의 양만큼 '질'이 중요해진 지금, 데이터를 일관되고 명확하게 정의하기 위한 이벤트 택소노미(Event Taxonomy) 구축이 필요하다.
목차
1. 신뢰할 수 없는 데이터
2. 발생하는 문제점
3. 이벤트 택소노미의 기대효과
1. 신뢰할 수 없는 데이터
데이터를 신뢰할 수 없는 이유는 일관되지 않거나 명확하지 않기 때문이다.
Amplitude에서는 이것을 데이터 명확성 (Data Clarity), 데이터 무결성 (Data Integrity), 데이터 가변성 (Data Mutability) 문제로 설명하고 있다.
[1] 데이터 명확성 (Data Clarity)
- 동일한 행동을 서로 다른 이벤트 명으로 정의
(ex. '결제 완료'를 A팀은 'purchase_completed', B팀은 'payment_done' 등으로 정의하여 같은 행동을 다른 데이터로 해석)
- 적재되고 있는 이벤트가 무엇을 의미하는지 조직 내에서 아는 사람이 없음
(ex. 이벤트 명세서가 없어서 신규 분석가가 어떤 이벤트가 무엇을 의미하는지 파악하는데 오래 걸림)
[2] 데이터 무결성 (Data Integrity)
- 중복 또는 누락된 이벤트 수집
- 관리자가 실제 수집 데이터를 정확히 파악하지 못함
[3] 데이터 가변성 (Data Mutability)
- 적재 중에 이벤트명이나 속성이 변경되면 BI 툴에서 다른 이벤트로 인식되어 이전 데이터와 연속성이 끊김

위와 같은 경우가 지속되면 데이터를 신뢰할 수 없게 된다.
그렇다면 데이터를 신뢰하지 않을 때, 발생하게 되는 문제점은 무엇일지 살펴보자.
2. 발생하는 문제점
1) 분석 관점 : 동일한 지표임에도 이벤트가 상이하여 다르게 계산되어 분석의 정확도가 떨어짐
2) 협업 관점 : 팀마다 이벤트/지표의 기준이 달라 커뮤니케이션 하는데에 어려움
3) 운영/거버넌스 관점 : 데이터 수집 범위를 확장할수록 데이터의 품질 유지가 어려움
다양한 관점에서 문제점이 발생하게 되며, 이러한 문제점들이 결국 서비스 전반은 물론이며 사용자 경험에도 부정적인 영향을 미칠 수 있다.
또한, 서비스를 개선하기 위해 다양한 실험을 진행하지만, 데이터의 정합성이 떨어진다면 분석 결과를 신뢰하기 어렵고 이로 인해 의사결정이 왜곡되거나 실행 자체가 흔들릴 수 있다.
이러한 문제점이 발생하지 않으려면, 이벤트 택소노미를 구축하여 동일하고 일관된 형태로 데이터를 수집하며 품질 관리하는 것이 중요하다.
그렇다면 이벤트 택소노미를 구축하였을 때의 이점, 기대효과는 어떤 것이 있을까?
3. 이벤트 택소노미의 기대효과
1) 일관된 조직 (Consistent Organization)
- 데이터를 분류하고 라벨링할 수 있는 단 하나의 프레임워크를 보유할 수 있음
- 이를 통해 데이터의 의미가 명확해지며 부서 간의 커뮤니케이션이 쉬워져, 혼란을 줄일 수 있음
▶ 조직 구성원 모두 동일한 데이터 언어를 사용하게 된다.
2) 더 나은 접근성 (Better Data Access)
- 데이터 사용자는 계층 구조를 탐색하며 필요한 특정 데이터를 쉽게 찾을 수 있어 시간과 리소스 단축
- 또한 데이터의 위치를 알고 있기에 새로운 정보를 빠르게 발견하고 활용 가능
▶ 조직 구성원이 필요한 데이터를 스스로 찾고 활용할 수 있다.
3) 향상된 데이터 품질 (Improved Data Quality)
- 일관된 데이터의 명명 규칙을 사용하면 오류와 이상 징후를 빠르게 발견할 수 있음
- 데이터의 신뢰성 향상
▶ 데이터 오류를 빠르게 감지 및 대응하여 품질을 유지할 수 있다.
4) 효율적인 데이터 분석 및 보고 (Efficient Data Analysis and Reporting)
- 데이터를 유의미한 것끼리 분류하면, 데이터 사용자가 특정 카테고리를 더 잘 분석하고 이해할 수 있음
- 이를 활용하여 데이터 기반의 인사이트를 도출하고 의사결정을 내릴 수 있음
▶ 복잡한 데이터도 일관된 규칙 아래 빠르게 분석되어, 인사이트 도출이 가능하다.
5) 데이터 거버넌스 및 규정 준수 (Data Governance and Compliance)
- 명확한 명명규칙, 표준화 등을 통해 기업은 데이터 규제, 정책, 품질 관리를 쉽게 따를 수 있음
- 또한 데이터를 일관되게 관리할 수 있으며, 최소한의 데이터 권장 사항을 준수하고 필요한 경우 민감한 데이터를 빠르게 삭제할 수 있음
▶ 데이터를 공통 기준으로 관리할 수 있는 체계가 구축되어 확장성과 운영 효율성이 높아진다.
결국은 데이터를 잘 활용하고 이를 통해 데이터 기반 의사결정의 정확도와 속도를 끌어올리기 위해 이벤트 택소노미가 필요하다.
다시 정리해보면, 신뢰할 수 있는 데이터란 조직 구성원 모두가 동일한 의미로 이해하고 같은 기준으로 수집하고 관리된 데이터이다.
이벤트 택소노미 (Event Taxonomy)는 그 기준 체계를 구축해 나가는 일이다.
이번 포스팅을 통해 이벤트 택소노미가 왜 중요한지, 필요한 이유에 대해 살펴보았다.
다음 포스팅은 실제 툴 (Amplitude)에서 로그 설계를 어떻게 하는지에 대해 정리해볼 예정이다.
개인적으로 공부하고 정리하기 위해 작성한 포스팅으로 잘못된 부분이 있으면 댓글 주시면 감사하겠습니다 :)!
참고 자료
The Foundation for Great Analytics is a Great Taxonomy | Amplitude
Behind every great piece of is a great event taxonomy – the collection of events and properties you use to define actions your users can take within your product. Think of the event taxonomy as the foundation for all future analysis you’ll do with your
amplitude.com
What is Data Taxonomy? Examples Included | Amplitude
Adopting a data taxonomy gives businesses a structured and standardized approach to managing their information. It is the foundation for , integration, and analysis and has many benefits. Consistent organization With a data taxonomy, companies have a singl
amplitude.com
데이터를 진짜 쓰이게 만드는 사람들, DataOps Manager
DOM은 유저 행동 로그 하나를 설계하는 일부터, 분석의 기반이 되는 데이터의 품질을 보장하고, 전사적으로 효율적인 데이터 소비 환경을 만들어가는 일까지 데이터의 전 생애주기 전체를 설계
toss.im
'Data Analysis > 이벤트 택소노미' 카테고리의 다른 글
| [데이터 로그 설계] 4. 실제 서비스 이벤트 로그 설계 예시 (올리브영) (0) | 2025.12.10 |
|---|---|
| [데이터 로그 설계] 3. 이벤트 택소노미 기반 로그 설계 방법 (With. Amplitude) (1) | 2025.12.08 |
| [데이터 로그 설계] 1. 이벤트 택소노미 (Event Taxonomy) 구조 이해하기 (0) | 2025.10.25 |
| 2. xAPI Statements (0) | 2024.04.10 |
| 1. 표준 데이터 xAPI란? (0) | 2024.04.10 |