데이터베이스 설계

  • 개념적 데이터베이스 설계와 물리적 데이터베이스 설계로 구분한다.
  • 개념적 데이터베이스 설계 : 실제로 데이터베이스를 구현하는 방법과는 독립적으로 정보 사용의 모델을 개발하는 과정
  • 물리적 데이터베이스 설계 : 물리적인 저장 장치(Disk)와 접근 방식(인덱스의 생성)을 다룬다.
  • 개념적 데이터베이스 설계 과정에서 조직체(실세계)의 엔티티, 관계, 프로세스, 무결성 제약조건 등을 나타내는 추상화 모델(ER 모델)을 구축한다.
  • 엔티티 : 서로 구분이 되면서 조직체에서 데이터베이스에 나타내려는 객체(사람, 장소, 사물 등)을 의미한다.
  • 관계 : 두 개 이상의 엔티티들 간의 연관을 나타낸다.
  • 프로세스 : 관련된 활동들을 나타낸다.
  • 무결성 제약조건 : 데이터의 정확성과 비즈니스 규칙을 의미한다.


  개념적 수준의 모델

  • 특정 데이터 모델과 독립적으로 응용 세계를 모델링할 수 있도록 한다.
  • 데이터베이스 구조나 스키마를 하향식으로 개발할 수 있기 위한 틀(framework)을 제공한다.
  • 인기 있는 개념적 수준의 모델은 엔티티-관계(Entity-Relationship, ER) 모델
  • ER 모델과 같은 개념적 데이터 모델이 사상될 수 있는 다수의 구현 데이터 모델(implementation data model)이 존재한다.
  • 구현 단계에서 사용되는 세 가지 데이터 모델

- 관계 데이터 모델

- 계층 데이터 모델

- 네트워크 데이터 모델

  • 개념적 DB 설계 : 실세계 정보->ER모델
  • 논리적 DB 설계 : 개념적 데이터 모델(ER모델)->구현적 데이터 모델(릴레이션)
  • 프로세스 모델링 : 어떤 프로세스가 어떤 릴레이션에 접근하는가를 모델링한 것


  데이터베이스 설계의 개요

  • 한 조직체의 운영과 목적을 지원하기 위해 데이터베이스를 생성하는 과정
  • 목적 : 모든 주요 응용과 사용자들이 요구하는 데이터, 데이터 간의 관계를 표현하는 것
  • 데이터베이스 개발은 일반적인 프로젝트 라이프 사이클 과정을 따른다.
  • 훌륭한 데이터베이스 설계 : 시간의 흐름에 따른 데이터의 모든 측면을 나타내고, 데이터 항목의 중복을 최소화하고, 데이터베이스에 대한 효율적인 접근을 제공하고, 데이터베이스의 무결성을 제공하고, 이해하기 쉬워야 한다.


  데이터베이스 설계의 주요 단계

  • 요구사항 수집과 분석 개념적 설계 DBMS 선정 논리적 설계 스키마 정제(정규화) 물리적 설계( 트랜잭션 설계) 보안 설계 구현 단계(DB 구축 및 튜닝)
  • 일반적으로 데이터베이스 설계의 완성도를 높이기 위해서 위의 과정에서 앞뒤로 왔다갔다할 필요가 있다.
  • 요구사항 수집과 분석

- 흔히 기존의 문서를 조사하고, 인터뷰(가장 흔함)나 설문 조사 등이 시행된다.

- 설문 조사는 자유롭게 의견을 적어내도록 하는 방식과 주어진 질문에 대해서만 답을 하는 방식으로 구분된다.

- 요구사항에 관한 지식을 기반으로 관련 있는 엔티티들과 이들의 애트리뷰트들이 무엇인가, 엔티티들 간의 관계가 무엇인가 등을 파악한다.

- 데이터 처리에 관한 요구사항에 대하여 전형적인 연산들은 무엇인가, 연산들의 의미, 접근하는 데이터의 양 등을 분석한다.

- 결과물 : 데이터베이스 요구사항

  • 개념적 설계

- 모든 물리적인 사항과 독립적으로, 한 조직체에서 사용되는 정보의 모델을 구축하는 과정

- 사용자들의 요구사항 명세로부터 개념적 스키마가 만들어진다.

- 높은 추상화 수준의 데이터 모델을 기반으로 정형적인 언어로 데이터 구조를 명시한다.

- 대표적인 데이터 모델 : ER모델

- 개념적 설계의 단계에서는 엔티티 타입, 관계 타입, 애트리뷰트들을 식별하고, 애트리뷰트들의 도메인을 결정하고, 후보 키와 기본 키 애트리뷰트들을 결정한다.

- 완성된 개념적 스키마(ER 스키마)ER다이어그램으로 표현된다.

- 결과물 : 개념적 스키마(ER 스키마)

  • DBMS 선정

- 여러 가지 요인들을 검토한 후 DBMS를 선정한다.

- 기술적 요인 : DBMS가 제공하는 데이터 모델, 저장 구조, 인터페이스, 질의어, 도구, 제공되는 서비스 등

- 정치적 요인 : 고수준의 전략적인 결정 등

- 경제적 요인 : DBMS 구입 비용, 하드웨어 구입 비용, 유지 보수(서비스) 비용, 기존의 시스템을 새로운 DBMS에 맞게 변환하는데 소요되는 비용, 인건비, 교육비 등

  • 논리적 설계

- 데이터베이스 관리를 위해 선택한 DBMS의 데이터 모델을 사용하여 논리적 스키마(외부 스키마 포함)를 생성한다.

- 개념적 스키마에 알고리즘(ER 다이얼그램)을 적용하여 논리적 스키마(릴레이션)를 생성한다.

- 논리적 스키마를 나타내기 위해 관계 데이터 모델을 사용하는 경우에는 ER 모델로 표현된 개념적 스키마를 관계 데이터베이스 스키마로 사상한다.

- 관계 데이터베이스 스키마를 향상시키기 위해 정규화 과정을 적용한다.

- 데이터베이스 설계자가 요구사항 수집과 분석 후에 바로 논리적 설계 단계로 가는 경우 흔히 좋은 관계 데이터베이스 스키마가 생성되지 않는다.

- 결과물 : 논리적 스키마(관계 데이터베이스 스키마)

  • 물리적 설계

- 처리 요구사항들을 만족시키기 위해 저장 구조 접근 경로 등을 결정한다.

- 성능상의 주요 기준은 응답 시간, 트랜잭션 처리율, 보고서 생성 시간으로 구분할 수 있다.

- 응답 시간 : 질의와 갱신이 평균적으로 또는 피크 시간 때 얼마나 오래 걸릴 것인가

트랜잭션 처리율(Transactions Per Seconds, TPS) : 1초당 얼마나 많은 트랜잭션들이 평균적으로 또는 피크 시간 때 처리될 수 있는가

전체 데이터베이스에 대한 보고서를 생성하는데 얼마나 오래 걸릴 것인가

  • 트랜잭션 설계

- 요구사항 수집과 분석 후에 데이터베이스 설계 과정과 별도로 트랜잭션 설계를 진행할 수 있다.

- 트랜잭션 : 완성될 데이터베이스에서 동작할 응용 프로그램

- 데이터베이스 스키마는 트랜잭션에서 요구하는 모든 정보를 포함해야 한다.

- 검색, 갱신, 혼합 등 세 가지 유형으로 구분하여 입력과 출력, 동작 등을 식별한다.



  ER 모델

  • 데이터베이스 설계를 용이하게 하기 위해 P.P Chen1976년에 제안한 개념적 데이터 모델
  • 현재는 EER(Enhanced Entity Relationship) 모델이 데이터베이스 설계 과정에 널리 사용되고 있다.
  • 개념적 설계를 위한 인기 있는 모델로서, 많은 Computer Aided Software Engineering (CASE)도구들에서 지원된다.
  • 실세계를 엔티티, 애트리뷰트, 엔티티들 간의 관계로 표현한다.
  • 쉽게 관계 데이터 모델로 사상된다.
  • 기본적인 용어로는 엔티티, 관계, 애트리뷰트가 있고, 기타 용어로는 카디날리티 비율(관계 비율), 참여 제약조건 등이 있다.
  • 적은 노력으로 쉽게 배울 수 있고, 전문가가 아니어도 이해하기 쉬우며, 자연어보다는 좀더 정형적이고, 구현에 독립적이어서 데이터베이스 설계자들이 최종 사용자들과 의사 소통을 하는데 적합하다.
  • ER 모델을 기반으로 만들어진 다수의 CASE 도구들이 존재한다.
  • CASE 도구들은 ER 설계를 자동적으로 SQL Server, 오라클 등의 DBMS에서 제공하는 데이터 정의어로 변환하고, 어떤 도구는 XML로 변환한다.
  • 현재는 데이터베이스 설계를 위한 다소 구형 그래픽 표기법을 사용한다.
  • 엔티티(Entity)

- 하나의 엔티티는 사람, 장소, 사물, 사건 등과 같이 독립적으로 존재하면서 고유하게 식별이 가능한 실세계의 객체이다. - 릴레이션의 레코드(투플)과 유사한 개념.

- 사물처럼 실체가 있는 것도 있지만 생각이나 개념과 같이 추상적인 것도 존재한다.



  엔티티 타입

  • 엔티티들은 엔티티 타입(또는 엔티티 집합)들로 분류된다.
  • 포함관계 : 엔티티  엔티티 집합
  • 엔티티 타입 : 동일한 애트리뷰트들을 가진 엔티티들의 틀(내포)
  • 엔티티 집합 : 동일한 애트리뷰트들을 가진 엔티티들의 모임(외연)
  • 하나의 엔티티는 한 개 이상의 엔티티 집합에 속할 수 있다.
  • 엔티티 집합과 엔티티 타입을 엄격하게 구분할 필요는 없다.
  • ER 다이어그램에서 엔티티 타입은 직사각형으로 나타낸다.

  • 강한 엔티티 타입(정규 엔티티 타입)

- 독자적으로 존재한다.

- 엔티티 타입 내에서 자신의 키 애트리뷰트를 사용하여 고유하게 엔티티들을 식별할 수 있는 엔티티 타입

  • 약한 엔티티 타입

- 키를 형성하기에 충분한 애트리뷰트를 갖지 못한 엔티티 타입

- 이 엔티티 타입이 존재하려면 소유 엔티티 타입(Owner Entity Type)이 있어야 한다.

소유 엔티티 타입 또는 식변 엔티티 타입(Identifying Entity Type) : 약한 엔티티 타입에게 키 애트리뷰트를 제공하는 엔티티 타입

소유 엔티티 타입의 키 애트리뷰트를 결합해야만 고유하게 약한 엔티티들을 식별할 수 있다.

소유 엔티티 타입의 기본 키가 되는 애트리뷰트는 약한 엔티티 타입에서 외래 키이면서 동시에 기본 키의 구성요소가 된다.

- ER 다이어그램에서 경계가 이중선 직사각형으로 표현한다.

- ER 다이어 그램에서 약한 엔티티 타입의 부분 키는 점선 밑줄을 그어 표시한다.

부분 키(partial key) : 부양 가족의 이름처럼 한 사원에 속한 부양가족 내에서는 서로 다르지만 회사 전체 사원들의 부양가족들 전체에서는 같은 경우가 생길 수 있는 애트리뷰트. , 부분적(사원 하나)으로는 식별역할을 하나, 전체(사원 전체)로 봤을 때 식별 역할을 못하는 키

- ER 다이어그램에서 약한 엔티티 타입과 소유 엔티티 타입의 관계는 이중실선 다이아몬드로 표현된다.



  애트리뷰트(Attribute)

  • 하나의 엔티티는 연관된 애트리뷰트들의 집합
  • 한 애트리뷰트의 도메인은 그 애트리뷰트가 가질 수 있는 모든 가능한 값들의 집합
  • 여러 애트리뷰트가 동일한 도메인을 공유할 수 있다. ex) 네 자리 정수
  • 키 애트리뷰트는 한 애트리뷰트 또는 애트리뷰트들의 모임으로서 한 엔티티 타입 내에서 각 엔티티를 고유하게 식별한다.
  • ER 다이어그램에서 기본 키에 속하는 애트리뷰트는 밑줄을 그어 표시한다.
  • 요구사항 명세에서 명사형용사로 표현된다.
  • 엔티티는 독립적인 의미를 갖는 반면, 애트리뷰트는 독립적인 의미를 갖지 않는다.
  • ER 다이어그램에서 타원형으로 나타낸다.
  • ER 다이어그램에서 애트리뷰트와 엔티티 타입은 실선으로 연결한다.
  • 단순 애트리뷰트(Simple Attribute)

- 더 이상 다른 애트리뷰트로 나눌 수 없는 애트리뷰트

- ER 다이어그램에서 실선 타원으로 표현된다.

- ER 다이어그램에서 대부분의 애트리뷰트는 단순 애트리뷰트이다.

  • 복합 애트리뷰트(Composite Attribute)

- 두 개 이상의 애트리뷰트로 이루어진 애트리뷰트

- 동일한 엔티티 타입이나 관계 타입에 속하는 애트리뷰트들 중에서 밀접하게 연관된 것을 모아놓은 것

  • 단일 값 애트리뷰트(Single-Valued Attribute)

- 각 엔티티마다 정확하게 하나의 값을 갖는 애트리뷰트

- ER 다이어그램에서 단순 애트리뷰트와 동일하게 표현된다.

- ER 다이어그램에서 대부분의 애트리뷰트는 단일 값 애트리뷰트

- Ex. 사원의 사원번호 애트리뷰트는 어떤 사원도 두 개 이상의 사원번호를 갖지 않으므로 단일 값 애트리뷰트

  • 다치 애트리뷰트(Multi-Valued Attribute)

- 각 엔티티마다 여러 개의 값을 가질 수 있는 애트리뷰트

- ER 다이어그램에서 이중선 타원으로 표현한다.

ER 모델에서만 허용되는 개념으로, 관계 데이터 모델(구현 데이터 모델의 유형)에서는 알고리즘을 통해 이 문제를 해결한다.

  • 저장된 애트리뷰트(Stored Attribute)

- 다른 애트리뷰트와 독립적으로 존재하는 애트리뷰트

- ER 다이어그램에서 단순 애트리뷰트와 동일하게 표현된다.

- ER 다이어그램에서 대부분의 애트리뷰트는 저장된 애트리뷰트

- Ex. 사원 엔티티 타입에서 사원이름, 급여는 다른 애트리뷰트와 독립적으로 존재한다.

  • 유도된 애트리뷰트(Derived Attribute)

- 다른 애트리뷰트의 값으로부터 얻어진 애트리뷰트

- 관계 데이터베이스에서 릴레이션의 애트리뷰트로 포함시키지 않는 것이 좋다. 계속 다른 컬럼으로부터 연산하여 값을 얻을 수 있기 때문에 포함시키면 매우 비효율적이다.

- ER 다이어그램에서 점선 타원으로 표현한다.



  관계와 관계 타입

  • 관계는 엔티티들 사이에 존재하는 연관이나 연결로서 두 개 이상의 엔티티 타입들 사이의 사상으로 생각할 수 있다.
  • 관계 집합은 동질(성질이 같음)의 관계들의 집합
  • 관계 타입은 동질의 관계들의 틀
  • 관계 집합과 관계 타입을 엄격하게 구분할 필요는 없다.
  • 요구사항 명세에서 흔히 동사ER 다이어그램에서 관계로 표현된다.
  • ER 다이어그램에서 관계 타입은 다이아몬드로 표현된다.
  • ER 다이어그램에서 관계 타입과 서로 연관되는 엔티티 타입들은 관계 타입에 실선으로 연결한다.

“EMPLOYEE 의 각 엔티티와 DEPARTMENT 의 각 엔티티는 WORKS_FOR 관계에 참여한다고 표현한다.


엔티티

관계

엔티티

사원(employee)

근무한다(works for)

부서(department)

공급자(supplier)

공급한다(supplies)

부품(part)

학생(student)

수강한다(enrolls)

과목(course)

[ 엔티티와 엔티티 간의 관계의 예 ]

  • 관계의 애트리뷰트

- 관계 타입은 관계의 특징을 기술하는 애트리뷰트들을 가질 수 있다.

- 관계 타입은 키 애트리뷰트를 갖지 않는다.

- 관계의 특징이란 상황에 맞게 유동적으로 변하는 데이터를 의미한다.

- Ex. 공급자와 부품간의 Supplies 관계 타입이 생성되었을 때, 관계의 특징으로 Quantity (수량)애트리뷰트가 관계 타입에 존재한다고 가정하자. 여기서 Quantity가 공급자(Supplier) 엔티티의 애트리뷰트로 존재한다면, 공급자는 부품을 항상 고정된 수량으로 생산한다는 의미를 갖게 된다. 따라서 Quantity 애트리뷰트는 관계 타입(Supplies) 엔티티에 애트리뷰트로 있으면서 유동적인 수량값을 의미하는 것이다.

 
 

  차수(Degree)

  • 관계로 연결된 엔티티 타입들의 개수
  • 하나의 관계 타입에 몇 개의 엔티티 타입이 연관되는지를 나타낸다.
  • 실세계에서 가장 흔한 관계는 두 개의 엔티티 타입을 연결하는 2진 관계이다.
  • 유형으로 1진 관계, 2진 관계, 3진 관계, N진 관계가 있다.
  • 3(또는 N) 관계는 2(또는 3) 관계로 표현될 수 없다.



  카디날리티(Cardinality)

  • 카디날리티 비율 : 한 엔티티가 참여할 수 있는 관계의 수
  • 관계 타입에 참여하는 엔티티들의 가능한 조합을 제한한다.
  • 관계를 흔히 1:1, 1:N, M:N으로 구분한다.
  • ER 다이어그램에서 카디날리티에 관한 정보는 간선 위에 나타낸다.


(E1, E2 : 엔티티 타입)

  • 1:1 관계

- E1의 각 엔티티가 정확하게 E2의 한 엔티티와 연관되고, E2의 각 엔티티가 정확하게 E1의 한 엔티티와 연관되는 관계

- Ex. 각 사원에 대해 최대한 한 개의 PC가 있고, PC에 대해 최대한 한 명의 사원이 이용한다면 사원과 PC의 관계는 1:1 관계이다.

  • 1:N 관계 (또는 N:1 관계)

- E1의 각 엔티티가 E2의 임의의 개수의 엔티티와 연관되고, E2의 각 엔티티는 정확하게 E1의 한 엔티티와 연관되는 관계

- 실세계에서 가장 흔히 나타나는 관계 (학과:학생 1:N)

- Ex. 각 사원에 대해 최대한 한 대의 PC가 있고, PC에 대해 여러 명의 사원들이 이용한다면 사원과 PC의 관계는 N:1 관계이다.

- Ex. 각 사원에 대해 여러 대의 PC가 있고, PC에 대해 최대한 한명의 사원이 이용한다면 사원과 PC의 관계는 1:N 관계이다.

  • M:N 관계

- 한 엔티티 타입에 속하는 임의의 개수의 엔티티가 다른 엔티티 타입에 속하는 임의의 개수의 엔티티와 연관된다.

- Ex. 각 사원에 대해 여러 대의 PC가 있고, PC에 대해 여러 명의 사원들이 이용한다면 사원과 PC의 관계는 M:N 관계이다.



  카디날리티 비율의 최소값과 최대값

  • ER 다이어그램에서 관계 타입과 엔티티 타입을 연결하는 실선 위에 (min, max) 형태로 표기한다.
  • 어떤 관계 타입에 참여하는 각 엔티티 타입에 대하여 min은 이 엔티티 타입 내의 각 엔티티는 적어도 min 번 관계에 참여함을 의미한다.
  • 어떤 관계 타입에 참여하는 각 엔티티 타입에 대하여 max는 이 엔티티 타입 내의 각 엔티티는 최대 max 번 관계에 참여함을 의미한다.
  • min=0 : 어떤 엔티티가 반드시 관계에 참여해야 할 필요는 없음을 의미한다. (선택적 참여O)
  • max=* : 어떤 엔티티가 관계에 임의의 수만큼 참여할 수 있음을 의미한다. (상한이 존재X)
  • 관계에 참여하는 엔티티의 숫자가 아니라, 하나의 엔티티가 몇 번 관계에 참여하는 가를 나타낸다.



  다중 관계와 순환적 관계

  • 다중 관계 : 두 엔티티 타입 사이에 두 개 이상의 관계 타입이 존재할 수 있다.
  • 순환적 관계 : 하나의 엔티티 타입이 동일한 관계 타입에 두 번 이상 참여하는 것



  역할(Role)

  • 관계 타입의 의미를 명확하게 하기 위해 사용된다.
  • 특히 하나의 관계 타입에 하나의 엔티티 타입이 여러 번 나타나는 경우(Ex. 1진 관계)에는 반드시 역할을 표기해야 한다. (역할을 생략해선 안된다.)
  • ER 다이어그램에서 관계 타입의 간선 위에 표시한다.



  전체 참여와 부분 참여

  • 전체 참여 : 어떤 관계에 엔티티 타입 E1모든 엔티티들이 관계 타입 R에 의해서 어떤 엔티티 타입 E2의 어떤 엔티티와 연관되는 것을 의미한다.
  • 부분 참여 : 엔티티 타입의 일부 엔티티만 관계에 참여하는 것
  • 약한 엔티티 타입은 항상 관계에 전체 참여한다.
  • 카디날리티 비율과 함께 참여 제약조건은 관계에 대한 중요한 제약조건이다.
  • 두 엔티티 타입 E1, E2의 엔티티 비율이 100:10 이고, E1이 부분 참여, E2가 전체 참여일 때 부분 참여하는 E1의 엔티티 수는 최대 10이다.
  • ER 다이어그램에서 전체 참여는 이중 실선으로 표시한다.



  ER 스키마를 작성하기 위한 지침

  • 엔티티는 키 애트리뷰트 이외에 설명 정보를 추가로 가진다. 설명정보가 없으면 애트리뷰트이다.
  • 다치 애트리뷰트는 엔티티로 분류해야 한다.
  • 애트리뷰트들이 직접적으로 설명하는 엔티티에 애트리뷰트들을 붙인다.
  • 가능한 한 복합 식별자를 피해야 한다.
  • 관계는 일반적으로 독자적으로 존재할 수 없지만 엔티티 타입과 관계 타입을 절대적으로 구분하는 것은 어렵다.



  데이터베이스 설계 과정

  • 응용의 요구사항을 수집하여 기술
  • 응용과 연관이 있는 엔티티 타입들을 식별
  • 응용과 연관이 있는 관계 타입들을 식별
  • 관계의 카디날리티 비율1:1, 1:N, M:N 중에서 어느 것에 해당하는지 결정
  • 엔티티 타입과 관계 타입에 필요한 애트리뷰트들을 식별하고, 각 애트리뷰트가 가질 수 있는 값들의 집합(도메인)을 식별
  • 엔티티 타입들을 위한 기본 키를 식별
  • 응용을 위한 ER 스키마 다이어그램을 그린다.
  • ER 스키마 다이어그램이 응용에 대한 요구사항과 부합되는지 검사
  • ER 스키마 다이어그램을 DBMS에서 사용되는 데이터베이스 모델로 변환


  ER 모델의 또 다른 표기법

  • ERWin 등의 CASE 도구들에서는 새발(crow-feet) 표기법이 흔히 사용된다.
  • 새발 표기법에도 여러 가지 변형들이 존재한다.

  • 새발 표기법에서 엔티티 타입과 애트리뷰트의 표현

  • Ex. 기업에서 흔히 볼 수 있는 작은 세계에 관한 요구사항

강한 엔티티 타입 약한 엔티티 타입 애트리뷰트 다치 애트리뷰트 관계 타입

회사에는 다수의 사원들이 재직한다.

각 사원에 대해서 사원번호(고유함)이름직책급여주소를 저장주소는 으로 세분하여 나타낸다.

각 사원은 0명 이상의 부양가족을 가질 수 있다한 부양가족은 두 명 이상의 사원에게 속하지 않는다. 각 부양가족에 대해서 부양가족의 이름과 성별을 저장한다.

회사는 여러 개의 프로젝트들을 진행한다각 프로젝트에 대해서 프로젝트번호(고유함)이름예산프로젝트 진행 위치를 나타낸다한 프로젝트는 여러 위치에서 진행될 수 있다각 프로젝트마다 여러 명의 사원들이 일한다각 사원은 여러 프로젝트에서 근무할 수 있다. 각 사원이 해당 프로젝트에서 어떤 역할을 수행하고얼마 동안 근무해 왔는가를 나타낸다각 프로젝트마다 한 명의 프로젝트 관리자가 있다한 사원은 두 개 이상의 프로젝트 관리자가 될 수 는 없다. 프로젝트 관리자의 임무를 시작한 날짜를 기록한다.

각 사원은 한 부서에만 속한다. 각 부서에 대해서 부서번호(고유함)이름부서가 위치한 층을 나타낸다.

각 프로젝트에는 부품들이 필요하다한 부품이 두 개 이상의 프로젝트에서 사용될 수 있다하나의 부품은 다른 여러 개의 부품들로 이루어질 수 있다. 각 부품에 대해서 부품번호(고유함)이름가격그 부품이 다른 부품들을 포함하는 경우에는 그 부품들에 관한 정보도 나타낸다.

각 부품을 공급하는 공급자들이 있다한 명의 공급자는 여러 가지 부품들을 공급할 수 있고각 부품은 여러 공급자들로부터 공급될 수 있다. 각 공급자에 대해서 공급자번호(고유함)이름신용도를 나타낸다각 공급자에 대해서 그 공급자가 어떤 부품을 어떤 프로젝트에 얼마나 공급하는가를 나타낸다.(3진 관계)





  ER 스키마를 관계 모델의 릴레이션으로 사상

  • 논리적 설계 단계에서는 ER 스키마를 관계 데이터 모델의 릴레이션들로 사상한다.
  • ER 스키마에는 엔티티 타입과 관계 타입이 존재하지만 관계 데이터베이스에서는 엔티티 타입과 관계 타입을 구분하지 않고 릴레이션들만 있다.
  • 릴레이션으로 사상할 대상이 ER 스키마에서 엔티티 타입인지 또는 관계 타입인지, 엔티티 타입이라면 정규(강한) 엔티티 타입인지 또는 약한 엔티티 타입인지, 관계 타입이라면 2진 관계 타입인지 3진 이상의 관계 타입인지, 애트리뷰트가 단일 값 애트리뷰트인지 또는 다치 애트리뷰트인지 등에 따라 사상하는 방법이 달라진다.
  • ER 모델을 릴레이션들로 사상하는 7개의 단계로 이루어진 알고리즘

사상할 대상

알고리즘의 단계

엔티티 타입과 단일 값 애트리뷰트

1단계 : 정규 엔티티 타입

2단계 : 약한 엔티티 타입

2진 관계 타입

3단계 : 21:1 관계 타입

4단계 : 정규 21:N 관계 타입

5단계 : 2M:N 관계 타입

3진 이상의 관계 타입

6단계 : 3진 관계 타입

다치 애트리뷰트

7단계 : 다치 애트리뷰트



  ER-관계 사상 알고리즘

  • 1단계 : 정규 엔티티 타입과 단일 값 애트리뷰트

- ER 스키마의 각 정규 엔티티 타입 E에 대해 하나의 릴레이션 R을 생성한다.

- E에 있던 단순 애트리뷰트들을 릴레이션 R에 모두 포함시킨다.

- E에서 복합 애트리뷰트는 그 복합 애트리뷰트를 구성하는 단순 애트리뷰트들만 릴레이션 R에 포함시킨다. (복합 애트리뷰트 자체는 포함되지 않는다.)

- E의 기본 애트리뷰트가 릴레이션 R의 기본 키가 된다.

  • 2단계 : 약한 엔티티 타입과 단일 값 애트리뷰트

- ER 스키마에서 소유 엔티티 타입 E를 갖는 각 약한 엔티티 타입 W에 대하여 릴레이션 R을 생성한다.

- W에 있던 모든 단순 애트리뷰트들을 릴레이션 R에 포함시킨다.

- 소유 엔티티 타입에 해당하는 릴레이션의 기본 키를 약한 엔티티 타입에 해당하는 릴레이션에 외래 키로 포함시킨다.

- 약한 엔티티 타입에 해당하는 릴레이션 R의 기본 키는 약한 엔티티 타입의 부분 키와 소유 엔티티 타입에 해당하는 릴레이션을 참조하는 외래 키의 조합으로 이루어진다.

  • 3단계 : 21:1 관계 타입

- ER 스키마의 각 21:1 관계 타입 R에 대하여, R에 참여하는 엔티티 타입에 대응되는 릴레이션 ST를 찾는다.

- 관계 타입에 전체 참여하는 엔티티 타입을 릴레이션 S로 생성한다.

- 관계 타입에 부분 참여하는 엔티티 타입을 릴레이션 T로 생성한다.

- 릴레이션 T의 기본 키를 릴레이션 S의 외래 키로 포함시킨다.

- 위의 경우가 아니라면, ST 중에서 한 릴레이션을 선택하여, 만일 S를 선택했다면 T의 기본 키를 S에 외래 키로 포함시킨다.

관계 타입 R이 가지고 있는 모든 단순 애트리뷰트(복합 애트리뷰트를 갖고 있는 경우에는 복합 애트리뷰트를 구성하는 단순 애트리뷰트)들을 릴레이션 S에 포함시킨다.

두 엔티티 타입이 관계 타입 R에 전체 참여할 때는 두 엔티티 타입과 관계 타입을 하나의 릴레이션으로 합치는 방법도 가능하다.

관계 타입을 하나의 릴레이션으로 생성하여 관계에 참여하는 각 엔티티 타입의 기본 키를 외래 키로 포함시키는 방법(외래 키들은 모두 기본 키의 구성요소)도 있으나, 조인의 횟수가 많으므로 권장되지 않는다.

  • 4단계 : 정규 21:N 관계 타입

- 관계 타입 R에 참여하는 N측의 엔티티 타입에 대응되는 릴레이션 S를 찾는다.

- 관계 타입 R에 참여하는 1측의 엔티티 타입에 대응되는 릴레이션 T를 찾는다.

릴레이션 T의 기본 키를 릴레이션 S에 외래 키로 포함시킨다.

- Ex. 하나의 부서에는 다수의 사원들이 있으므로 부서:사원 -> 1:N 관계이다. 부서 릴레이션은 T, 사원 릴레이션은 S에 해당하므로, DEPARTMENT[부서]의 기본 키를 EMPLOYEE[사원]의 외래 키로 포함시킨다.

반면, N측의 릴레이션 S의 기본 키를 1측의 릴레이션 T에 외래 키로 포함시키면 애트리뷰트에 값들의 집합이 들어가거나 정보의 중복이 많이 발생한다.

- Ex. EMPLOYEE[사원]의 기본 키를 DEPARTMENT[부서]의 외래 키로 포함시키면, 부서 릴레이션에서 외래 키를 제외한 나머지 데이터들이 모두 중복된 데이터이므로 비효율적이다.

관계 타입 R이 가지고 있는 모든 단순 애트리뷰트(복합 애트리뷰트를 갖고 있는 경우에는 복합 애트리뷰트를 구성하는 단순 애트리뷰트)들을 릴레이션 S에 포함시킨다.

- ST에 대응하는 엔티티 타입이 동일할 경우(순환적 관계) 하나의 릴레이션에 기본 키를 참조하는 외래 키를 포함시킨다. (자기 참조 릴레이션 생성)

  • 5단계 : 2M:N 관계 타입

- 2M:N 관계 타입 R에 대해서는 릴레이션 R을 생성한다.

참여 엔티티 타입에 해당하는 릴레이션들의 기본 키를 릴레이션 R에 외래 키로 포함시키고, 이들의 조합은 릴레이션 R의 기본 키가 된다. (각 외래 키는 기본 키의 구성요소)

관계 타입 R이 가지고 있는 모든 단순 애트리뷰트(복합 애트리뷰트를 갖고 있는 경우에는 복합 애트리뷰트를 구성하는 단순 애트리뷰트)들을 릴레이션 R에 포함시킨다.

  • 6단계 : 3진 이상의 관계 타입

- 3진 이상의 각 관계 타입 R에 대하여 릴레이션 R을 생성한다.

- 관계 타입 R에 참여하는 모든 엔티티 타입에 대응되는 릴레이션들의 기본 키를 릴레이션 R에 외래 키로 포함시킨다.

- 관계 타입 R이 가지고 있는 모든 단순 애트리뷰트(복합 애트리뷰트를 갖고 있는 경우에는 복합 애트리뷰트를 구성하는 단순 애트리뷰트)들을 릴레이션 R에 포함시킨다.

- 일반적으로 외래 키들의 조합이 릴레이션 R의 기본 키가 된다.

- 관계 타입 R에 참여하는 엔티티 타입들의 카디날리티(하나의 엔티티가 참여하는 관계 횟수)1:N:N이면 카디날리티가 1인 릴레이션의 기본 키를 참조하는 외래 키를 제외한 나머지 외래 키들의 조합(N측의 기본키를 참조하는 외래키들)이 릴레이션 R의 기본 키가 된다.

  • 7단계 : 다치 애트리뷰트

- 각 다치 애트리뷰트(여러 값을 갖는 애트리뷰트)에 대하여 릴레이션 R을 생성한다.

- 다치 애트리뷰트에 해당하는 애트리뷰트를 릴레이션 R에 포함시키고, 다치 애트리뷰트를 소유한 엔티티 타입이나 관계 타입에 해당하는 릴레이션의 기본 키를 릴레이션 R에 외래 키로 포함시킨다.

- 다치 애트리뷰트의 값을 반복해서 단일값으로 삽입한다.

릴레이션 R의 기본 키는 다치 애트리뷰트와 외래 키의 조합이다.

- Ex. 한 사원이 여러 취미를 가지는 경우, hobby 애트리뷰트는 다치 애트리뷰트이므로 (사원번호, 취미)를 기본 키로 갖는 릴레이션으로 설계되어야 한다.

데이터베이스 설계 사례에 알고리즘 적용


1단계 : 정규 엔티티 타입과 단일 값 애트리뷰트

EMPLOYEE(Empno, Empname, Title, City, Ku, Dong, Salary)

PROJECT(Projno, Projname, Budget)

DEPARTMENT(Deptno, Deptname, Floor)

SUPPLIER(Suppno, Suppname, Credit)

PART(Partno, Partname, Price)


2단계 : 약한 엔티티 타입과 단일 값 애트리뷰트

DEPENDENT(Empno, Depname, Sex)


3단계 : 21:1 관계 타입

PROJECT(Projno, Projname, Budget, StartDate, Manager)

[ManagerEMPLOYEE의 기본 키인 Empno을 참조하는 외래 키]


4단계 : 정규 21:N 관계 타입

EMPLOYEE(Empno, Empname, Title, City, Ku, Dong, Salary, Dno)

[DnoDEPARTMENT의 기본 키인 Deptno을 참조하는 외래 키]

PART(Partno, Partname, Price, Subpartno)

[SubpartnoPART의 기본 키인 Partno을 참조하는 외래 키]


5단계 : 2M:N 관계 타입

WORKS_FOR(Empno, Projno, Duration, Responsibility)


6단계 : 3진 이상의 관계 타입

SUPPLY(Suppno, Projno, Partno, Quantity)


7단계 : 다치 애트리뷰트

PROJ_LOC(Projno, Location)






+ Recent posts