DCAT의 정의
DCAT은 Data Catalog Vocabulary의 축약으로 W3C에서 2014년 1월 16일에 권고 승인을 한 웹 표준입니다.
DCAT은 웹에 발행된 데이터 목록 간의 상호 운용성을 확보하고 활용성을 높이기 위해 설계한 RDF(Resource Description Framework)어휘이며,
여러 플랫폼 사이트 간의 데이터 분산 저장과 공유 환경을 지원할 수 있도록 설계되었습니다.
DCAT 표준은 2014년 버전 1.0 (DCAT 1.0)이 등장한 이후, 2019년 3월에 버전 2.0 (DCAT 2.0)으로 개선되었습니다.
오픈 데이터 플랫폼은 개정된 DCAT 2.0을 기반으로 메타데이터를 표준으로 데이터 등록 관리하고 효율적으로 검색할 수 있도록 구현되었습니다.
DCAT 1.0과 2.0의 차이
새로 제시된 DCAT 2.0과 기존 DCAT 1.0의 차이점 다음과 같습니다.
- Resource 클래스 신설
- Resource라는 최상위 클래스를 신설하여 Catalog, Dataset, Distribution이 공통으로 가지고 있었던
속성들을 갖고 있도록 하고 Catalog, Dataset, Distribution은 Resource로 부터 상속받아서 사용하도록 정의되었습니다.
- 이러한 변화로 인해 메타데이터를 보다 객체지향적으로 구성할 수 있게 되었습니다.
- 데이터 제공측면
- 데이터의 업로드 및 다운로드 할 수 있는 URL이나 제공포멧 등 데이터 제공과 관련된 항목들이 보강되었고
기존에 Distribution 클래스 단독으로 정보를 관리하던 것을 DataService 클래스가 추가되어 endpoint의 접속을 관리하도록 하고 있습니다.
- 이는 Distribution을 파일 배포용으로 범위로 축소하고, 데이터의 온라인접근을 별도 관리하여 보다 세밀한 메타데이터 모델링이 가능해졌습니다.
- 위처정보 관리 속성
- 데이터의 지리적 위치정보를 관리하는 속성이 강화되었습니다.
기존 버전 1.0에서는 Dataset 클래스 아래 dct:spatial
하나의 속성으로 위치 정보를 관리하였지만, 버전 2.0에서는 dct:spatial, dct:spatialResolutionInMeters으
로 조금 더 상세하게 위치 정보를 관리하게 하고 있습니다.
- 또한 Location 클래스를 서브 클래스(sub-class)로 지원하여
위치 정보를 보다 상세하게 기록하게 하고 있습니다. Location 클래스 아래에 하위 속성으로 locn:geometry,
dcat:bbox, dcat:centroid, w3cgeo:lat, w3cgeo:long, w3cgeo:alt 두어 보다 정밀한 위치 정보를 수록할 수 있도록 하고 있습니다.
DCAT의 구조
DCAT은 8개의 클래스로 구성되어 있습니다.
Meits 오픈데이터 플랫폼은 핵심 클래스 4개를 중심으로 데이터를 등록하고 4개의 클래스를 참조하여 데이터 관리체계를 구축하였습니다.
- 리소스 (Resource)
- 데이터 상품인 데이터셋과 데이터 서비스 등 정보 메타데이터를 서술하기 위한 공통 어휘 제공
- 데이터는 파일 형태의 DataSet과 온라인접근방식의 DataService 개념의 데이터 상품 구분
- 데이터셋(DataSet)
- 파일 또는 DB와 같은 데이터 상품 정보를 서술하기 위한 어휘 제공
- 데이터 서비스(DataService)
- API 같은 온라인 데이터 상품 정보를 서술하기 위한 어휘 제공
- 배포(Distribution)
- 데이터셋을 유통하기 위해 필요한 상세 정보를서술하기 위한 어휘 제공
- 분류체계(ConceptScheme)
- 주제영역-상세영역과 같이 플랫폼별 데이터 분류체계를 서술하기 위한 어휘 제공
- 카테고리(Concept)
- 플랫폼별 데이터 분류체계 관리 속성정보를 서술하기 위한 어휘 제공
- 카탈로그(Catalog)
- 사용자에게 제공되는 데이터셋 또는 데이터 서비스 관련 세부 내역을 항목으로 표현
- 기관(Agent)
- 데이터 상품을 제공하는 기관 정보를 관리
DCAT의 활용
Metis 오픈데이터 플랫폼은 DCAT에서 정의한 클래스를 활용하여 데이터상품 정보를 등록 할 수 있습니다.
또한 적용할 플랫폼의 정책에 따라 유연하게 대처할 수 있도록 설계되었습니다.
- 데이터셋
- 리소스 + 데이터셋 + 디스트리뷰션 클래스를 활용하여 데이터셋에 대한 기본 정보와 배포 정보 서술
- 데이터서비스
- 리소스 + 데이터서비스 클래스를 활용하여 데이터셋에 정보 서술
데이터셋의 메타데이터 항목
Meits 오픈데이터 플랫폼의 데이터 등록체계는 DCAT 2.0을 기반으로 하며 추가로 확장된 메타데이터로 항목을 구성하였습니다.
데이터서비스의 메타데이터 항목
서비스의 루트 위치 또는 endpoint의 접속을 관리하는 항목이 정의되어 있습니다.
디스트리뷰션 메타데이터 항목
파일 배포용 관리의 항목이며 데이터 제공 유형에 따라 관리됩니다.
Meits 오픈데이터 플랫폼에서는 스키마 정보와 DCAT에서 정의되어 있지 않은 데이터 속성을 list형태로 추가할 수 있도록 확장되었습니다.