ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 데이터 모델링16 - 데이터에는 유형, 종속관계, 계층구조가 존재한다1
    Data Base/관계형 데이터 모델링 2023. 9. 22. 11:36

    데이터 유형

    업무 데이터를 유심히 살펴보면 일반적으로 데이터에는 그 성격이 유사해서 하나의 틀로 묶을 수 있는 유형 혹은 패턴이 존재함을 발견할 수 있다. 예를 들어 다음 두 사건을 놓고 생각해보자

     

    • A가 S전자의 상품 X를 2015년 10월 17일에 구매했다.
    • B가 K은행의 계좌 Y에  2015년 10월 18일 15시 27분경 100만원을 입금했다.

    구매와 입금에는 1)행위의 주체인 A와 B가 존재한다. 이 문장은 주어에 해당한다. 그리고 이들 2)행위의 대상인 상품 X와 계좌 Y도 보인다. 이는 목적어에 해당한다. 또 두문장에서  구매와 입금이라는 3)행위 자체와 4)행위가 일어난 시각도 물론 확인할 수 있다. 사실 업무데이터라 함은 업무와 관련되 사건의 기록이며, 사건의 기록은 육하원칙에 따라 정리가 가능하다. 육하원칙은 보도기사를 쓸때 사건을 명확히 전달하기 위한 기본적이면서도 필수적이 도구이며, 이는 모델링에도 그대로 적용된다.

     

    그림 9-1 업무 요건을 형상화한 데이터 모델

    [그림 9-1]은 '업무 요건을 어떻게 데이터 모델로 표현할 것인가'라는 질문에 대한 간결하고 명쾌한 답이 될 수 있다. 성격이 같은 데이터는 하나의 유형으로 통합하고(주체는 주체끼리, 대상은 대상끼리) 업무 행위(그림 중앙의 비지니스)는 관련 개체들과의 관계로 표현하는 것이 핵심이다.

     

    몇 만개가 넘는 테이블을 가진 회사의 데이터라고 거칠게 일반화시켜 보면 데이터의 성격은 대부분 [그림 9-1]의 범주에 들어온다. 물론 데이터 사이의 관계라든가 이력,상세 내역, 통합코드 등의 유형이 추가될 수 있다.

     

    더불어 데이터 사이에 종속 관계와 같은 구조적 특성도 발견된다. 이는 관계에 참여하는 개별 데이터의 성격에서 발현된다. 예를 들어 대출 상황 업무에서 상환 금액과 상환 이시 데이터는 대출이라는 행위 데이터에 종속될 수밖에 없다. 대출이라는 사건이 발생하지 않았다면 대출 상환이라는 정보는 절대 존재할 수 없기 때문이다. [그림 9-1]에서 중앙의 <비지니스> 엔티티는 주변의 '누가(who)','무엇을(what)','언제(when)','어떤유형으로(which)' 등의 데이터에 종속된다. 다시 말해 주변의 기준 정보가 존재하지 않으면 업무 해위 자체가 발생할 수 없다(부모-자식 관계). 우리는 앞으로 업무 자체보다는 업무에 근간이 되는(발생 환경), 즉 부모 역할을 하는 주변 개체들에 대해 깊이 살펴볼 것이다.

     

    앞서 게시글에서 언급했던 '데이터를 볼 줄알아야 한다' 혹은 '데이터를 읽을 줄 알아야한다'는 것이 바로 이 지점에 해당한다. 모델링을 할때는 최종 트랜잭션 데이터가 아니라, 트랜잭션의 실질적인 주체와 대상이 되는 데이터를 정확히 판별해 낼 줄알아야 한다. 일반적으로 데이터 아키텍처와 방법론에서는 이러한 데이터를 마스터 데이터 라고 하면 이런 데이터는 일관되게 관리되어야한다.

     

    💡 tip) 업무 행위와 행위의 주체/대상

    업무의 주체나 대상등 이 될 수 있는 성질의 데이터들을  표준화된 개체로 통합하고, 업무 행위는 표준화된 개체 사이의 관계로 표현하는 것이 핵심이다.

    [출처 - 프로젝트의 성패를 결정짓는 데이터 모델링 이야기 , 김상래 저]

    댓글

Designed by Tistory.