[Database] 관계 데이터 모델의 개념, 릴레이션 스키마와 인스턴스

관계 데이터 모델

관계 데이터 모델은 수학의 집합이론에 근거하고 있어 튼튼한 이론적인 토대를 갖고 있다. 또한 관계 데이터 모델이 적용된 SQL 언어는 비절차적인 언어로 원하는 데이터를 쉽게 표현하는 장점이 있다.



릴레이션(relation)

관계 데이터 모델을 이해하기 위해서는 우선 가장 중요한 용어인 릴레이션에 대한 이해가 필요하다. 릴레이션은 행과 열로 구성된 테이블을 말한다. 릴레이션은 번역하면 친척, 관계라고 하지만 relationship도 관계여서 충돌을 피하기 위해 릴레이션이라고 그대로 부르고 있다. 그러나 relational data model, relational database 등은 관계 데이터 모델, 관계 데이터베이스라고 한다.


릴레이션 스키마와 인스턴스

릴레이션은 스키마와 인스턴스로 이루어진다. 스키마는 관계 데이터베이스의 릴레이션이 어떻게 구성되는지 어떤 정보를 담고 있는지에 대한 기본적인 구조를 정의한다. 테이블에서 스키마는 테이블의 첫 행인 헤더에 나타나며 각 데이터의 특징을 나타내는 속성, 자료타입 등의 정보를 담고 있다. 인스턴스는 정의된 스키마에 따라 테이블에 실제로 저장되는 데이터의 집합을 의미한다.


릴레이션 스키마

릴레이션 스키마는 릴레이션에 어떤 정보가 담길지를 정의한다. 도서 릴레이션은 도서번호, 도서이름, 출판사, 가격이라는 정보를 정의하고 있는데, 각 열을 속성(attribute)이라고 한다. 속성에는 각각의 이름이 있으며 우리는 그 이름을 보고 어떤 정보가 담기는 알 수 있다. 하지만 컴퓨터는 속성만으로 어떤 타입의 데이터인지 알 수 없다. 따라서 각 속성들이 어떤 값을 가질 수 있는지를 도메인(domain)이라는 용어를 사용하여 정의한다. 또한 릴레이션이 몇 개의 속성을 가지는가를 나타내기 위해 차수(degree)라는 용어를 사용한다.

  • 속성(attribute) : 릴레이션 스키마의 열
  • 도메인(domain) : 속성이 가질 수 있는 값의 집합
  • 차수(degree) : 속성의 개수

릴레이션 인스턴스
릴레이션 인스턴스는 릴레이션 스키마에 실제로 저장된 데이터의 집합이다. 도서 릴레이션을 보면 도서번호가 1부터 5까지 총 다섯 권의 데이터가 저장된 것을 알 수 있다. 릴레이션에서 행을 투플(tuple)이라고 한다. 투플은 릴레이션 인스턴스의 각각의 행을 나타낸다. 각 투플의 속성 값은 스키마에서 정의한 도메인 값으로 구성되며 투플이 가지는 속성의 개수는 스키마의 차수와 동일하다. 또한 릴레이션 내의 모든 투플들은 서로 중복되지 않아야 한다. 릴레이션에 저장된 투플의 수를 카디날리티라고 한다. 카디날리티는 투플의 삽입, 삭제, 수정 등에 따라 수시로 변한다.
  • 투플(tuple) : 릴레이션의 행
  • 카디날리티(cardinality) : 투플의 수


릴레이션의 특징

  • 속성은 단일 값을 가진다 : 각 속성의 값은 도메인에 정의된 값만을 가지며 그 값은 모두 단일 값이어야 한다.
  • 속성은 서로 다른 이름을 가진다.
  • 한 속성의 값은 모두 같은 도메인 값을 가진다.
  • 속성의 순서는 상관없다.
  • 릴레이션 내의 중복된 투플은 허용하지 않는다.
  • 투플의 순서는 상관없다.


댓글

Designed by JB FACTORY