관리 메뉴

개발자비행일지

cardinality 란 본문

▶Theory

cardinality 란

Cyber0946 2021. 3. 31. 14:29

cardinality 란 사전적 의미로는 집합원의 갯수라고 한다. (원소의 개수)

카디널리티에 대해 공부하다가 개념이 너무 어렵게 설명되어있어서,

핵심적인 내용만 (최대한) 쉽게 정리해보고자 한다.

 

우선 결론부터 말하자면,

중복도가 ‘낮으면’ 카디널리티가 ‘높다’고 표현한다.

중복도가 ‘높으면’ 카디널리티가 ‘낮다’고 표현한다.

카디널리티는 전체 행에 대한 특정 컬럼의 중복 수치를 나타내는 지표이다.

 

이정도만 설명해도 말이 너무 어려운 것 같다.

하지만 최소한 내가 이해한 바로, 카디널리티는 그렇게 어려운 개념이 아니다.

처음 카디널리티의 개념이 헷갈렸던 이유는,

카디널리티가 ‘상대적인 개념’이라는 것을 이해하지 못했기 때문이었다.

 

예를들어,

주민등록번호 같은 경우는 중복되는 값이 없으므로 카디널리티가 높다고 할 수 있다.

이에 비해 이름같은 경우는 ‘주민등록번호에 비해’ 중복되는 값이 많으므로,

이름은 ‘주민등록번호에 비해’ 카디널리티가 낮다고 할 수 있다.

‘주민등록번호에 비해’라는 부분을 강조한 이유는, 카디널리티는 상대적인 개념으로 이해해야하기 때문이다.