EN-Think
2023년 공공데이터 품질관리 수준평가 대응방법!
- 작성일2023/06/01 14:38
- 조회 9,512
2023년 공공데이터 품질관리 수준평가 대응방법!
공공기관을 대상으로 수년전부터 시작되어 단계적으로 발전하고 있는 "공공데이터 품질관리 수준평가"가 2023년에는 어떻게 변화하였을까?
2023 공공데이터 품질관리 수준평가의 평가체계와 평가대상,각 지표에 대한 내용을 자세히 살펴보면 적절한 대응이 가능합니다.
엔코아 전략사업본부 정병오 이사가 "2023년 공공데이터 품질관리 수준평가" 대응 방법을 상세히 설명하였습니다.
공공기관이 보유하고 있는 데이터에 대한 품질관리는 법률에 따라 각 기관에서 필요한 조치를 취하도록 의무화하고 있으며, 품질관리 수준평가는 법령이나 지침 등에서 기관의 역할로 정하고 있는 품질관리에 대한 사항을 진단하는 것뿐 아니라 기관 담당자들이 평가를 통해 품질관리 역량을 높이고, 더 나아가서 기관차원의 품질관리 체계를 확립하도록 하자는 취지로 수행되고 있습니다.
관련하여 공공데이터 품질관리 수준평가 평가 대상은 매년 확대되고 있으며, 올해는 17개 시도교육청이 포함되어 시범 평가 기관으로 추가되었습니다. 또한 기관이 보유한 데이터베이스 전체를 평가할 수는 없더라도 적어도 보유DB의 50% 이상은 평가 대상으로 선정해서 실질적인 수준을 제고하는 것을 목적으로 진행되고 있습니다.
이에 공공데이터 품질관리 수준평가를 대응함에 있어서 필요한 전년대비 변화된 내용, 평가체계, 지표에 대한 이해를 돕고자 핵심내용을 요약하여 정리합니다.
평가체계
평가 체계는 데이터 관리 체계 40점, 데이터 값 관리에 60점을 배정했고, 총 평가 지표는 11개로 구성되어 있습니다. 그리고 품질관리 수준평가 결과는 공공데이터 제공 운영 실태평가에 반영이 되는데, 100점 만점으로 산정된 점수는 중앙행정기관, 광역/기초 자치단체 기준으로 35% 비율로 반영됩니다.
[그림 1] 공공데이터 제공 운영실태 평가와 공공데이터 품질관리 수준평가
평가 대상DB 및 실적 기간
평가대상 DB는 각 기관에서 보유하고 있는 전체 DB 중에 시스템 관련 DB를 제외한 DB 중 50%(최대 35개, 35개 이상 대상 선정 시 DB당 0.3점씩 최대 3점 가점 부여)를 금년도 진단평가 대상으로 선정하면 되고, 품질관리 계획 및 개선 등과 관련한 실적은 전년도 11월 1일부터 올해 10월 31일까지 총 12개월간의 활동내역이 반영됩니다. 그리고 올해 11월, 12월에 수행한 실적은 내년도 계획에 반영됩니다.
지표 별 수행 담당자 및 기관유형별 대상 지표
지표는 전년도 대비하여 10개에 11개로 세부지표는 18개에서 21개로 확대되었고, 기관유형별/조건별로 진단 수행 대상지표를 세분류하고 있습니다. 그리고 지표별로 기관총괄 담당자는 지표 1, 2, 3, 4, 10, 11번을 담당하고 DB별 담당자는 4, 5, 6, 7, 8, 9, 11번 지표를 담당합니다.
◎ 2022년도 품질인증을 획득한 기관은 제외 / 단, 2023년에 추가된 DB는 대상 ▣ 2022년도 진단결과 7번(데이터 품질진단), 8번(품질진단 결과조치) 지표에서 만점을 획득하고 오류율이 0.001% 미만인 DB는 제외 ◈ 진단 제외 |
[그림 2] 공공데이터 품질관리 수준평가 지표
진단 평가
기관별 자체 진단 평가가 5월부터 10월까지로 되어 있지만 자체평가를 좀 빨리 시작하면 확인 점검을 통해서 오류를 개선하는데 필요한 시간을 그만큼 확보를 할 수 있기 때문에 각 기관에서는 자체 평가를 가급적 빨리 시행하는 것이 유리합니다. 즉 확인 점검을 한번 만 요청할 수 있는 게 아니라 평가기간 중에 반복적으로 확인점검을 요청할 수 있습니다. 따라서 평가가 종료되는 시점에 임박해서 자체 평가를 제출하는 일이 발생하지 않도록 미리 준비하는 게 중요합니다.
지표 별 대응 방안
지표 1. 관리절차 준수
기관별 보유DB목록 등록 및 평가 대상 DB 선정 기한 준수가 원활하지 않아서 일정 준수를 유도하기 위한 지표로 올해 도입했습니다. 기한만 준수한다면 크게 어려움이 없는 지표로 6월 19일까지 평가 대상 DB 선정을 해야 합니다.
지표 2. 데이터 품질관리 계획 수립
품질관리를 체계적으로 수행하기 위해 기관차원의 품질관리계획을 수립하고, 이행하였는지 점검하는 지표이며, 당해연도(올해) 품질관리 계획과 전년도 품질관리 이행 성과가 포함되어 있어야 합니다. 대상기관은 올해 초에 제출된 2023년 공공데이터 시행 계획으로 충족 여부를 판단하기 때문에 별도의 증빙자료를 제출하실 필요는 없습니다.
지표 3. 예방적 품질관리 진단
기관에서 발주하는 정보화 사업 중에서 DB 구축이 포함된 사업에 대해서는 예방적 품질관리 진단 기준에 따라 진단을 수행하고, 그 진단결과를 반영하였는지 점검합니다. 점검은 예방적 품질관리 진단, 사업 발주 단계 진단결과 반영, 사업 완료 단계 진단 결과 반영으로 구성되어 있습니다. 즉 정보화 사업 시 사업 계획내용을 점검 받고, 점검결과를 RFP 등에 반영하여 발주하고, 사업을 그대로 수행하였는지 점검합니다.
[표 1] 예방적 품질관리 세부지표 별 측정 기준
예방적 품질관리 진단은 시스템 구축 추진 5단계 수행 내용과 연관이 있으며, 시스템구축 추진단계 중 계획단계는 세부지표 번호 031 예방적 품질관리진단, 발주단계는 세부지표 번호 032 사업 발주 단계 예방적 품질관리 진단결과 반영, 설계단계/개발단계/완료단계는 세부지표 번호 033 사업완료 단계 예방적 품질관리 진단 결과 반영과 연관이 있습니다.
즉 시스템구축 추진단계 5단계는 예방적 품질관리 영역이라고 보면 되며, 이를 진단하기 위하여 예방적 품질관리 진단 체계가 별도로 구성되어 있습니다.
[그림 3] 시스템 구축 추진 5단계 및 예방적 품질관리 진단 체계
지표 4. 데이터 표준확산
DB 단위로 기관표준과 범정부 표준을 포함해서 데이터 표준을 각각 정의하였는지에 대해서 평가하고, 평가대상 DB 단위로 정의된 데이터 표준을 실제 DB에 얼마나 적용했는지 점검합니다. 주의할 사항은 기관차원의 데이터 표준과 각 DB 단위로 정의한 표준정의서를 표준관리시스템에 등록해야 합니다.
표준관리시스템에 등록해야 할 표준정의서는 표준단어(전년 대비 추가된 증빙자료), 표준용어, 표준도메인, 표준코드이며, 각 표준의 관리 항목에 반드시 제정일자가 포함되어야 하고, 표준 제정일자가 확인되지 않는 경우는 DB 구축 이전에 표준이 제정된 것으로 간주해서 평가를 하게 됩니다.
공통표준은 공공기관의 데이터베이스 표준화 지침에 정의된 공공데이터 공통표준 용어를 의미하며, 가장 최근에 개정 고시된 것이 22년 7월에 고시된 5차 표준화 지침입니다.
표준 적용율은 사전에 정의된 데이터 표준을 적용해서 DB를 구축해야 되는데 전체 컬럼 중에 표준이 적용된 컬럼비율에 따라서 점수가 부여됩니다.
[그림 4] 공통표준용어, 기관표준용어, DB표준용어간 포함 관계
지표 5. 데이터 구조 안정화
DB 단위로 데이터 구조산출물을 정의하고 있는지 그리고 실제 구조산출물과 DB간 현행화 되고 있는지를 점검합니다.
먼저 진단 평가 대상 DB에 대한 데이터베이스 정의서, 테이블 정의서, 컬럼 정의서, 물리ERD 또는 관계 정의서를 정의하여 보유하고 있는지 점검하고, 테이블 정의서, 컬럼정의서 기준으로 대상DB의 테이블과 컬럼과의 현행화 율을 진단합니다. 현행화 율을 측정할 때 총 4개의 산식이 발생하는데 이중 현행화 율이 가장 낮은 산식을 택해서 점수를 부여하게 되어 있습니다.
[그림 5] 구조 현행화 율 도출 구조
지표 6. 데이터 연계관리
데이터 연계 관리 지표는 내/외부 정보 시스템 DB간의 데이터를 주고받을 때 사전에 관리해야 될 목록을 정하고 데이터를 송수신하는 시점에 데이터가 정상적으로 오고 가는지를 점검하기 위한 지표입니다. 데이터 연계는 대상DB기준으로 내부DB 또는 외부기관간 연계여부를 확인할 수 있는 시스템 구성도가 필요합니다.
필수 항목을 포함해서 연계 데이터 목록 정의서 관리 여부를 진단하고, 송수신 내역을 점검하고 오류가 발생할 경우에 조치를 수행하고, 수행결과를 공식화하는지 진단합니다.
[그림 6] 연계 시스템 구성도 및 연계 데이터 목록 예시
그리고 진단 평가 대상 DB는 공공기관의 데이터베이스 표준화 지침 제8조 제5항에 따라서 비표준 데이터 매핑 정보를 기준으로 데이터를 연계 및 활용해야 됩니다. 관련하여 공통표준 용어 기준으로 비표준 데이터 매핑 정보를 관리하고 있는지 진단하기 위하여 전년대비 추가되었습니다.
[그림 7] 비표준 매핑 관리 예시
지표 7. 데이터 품질진단
데이터 값 품질 향상을 위하여 진단 대상을 선정하고, 기준을 정하고, 품질 진단을 수행합니다. 진단 대상을 선정 시 진단 대상 DB가 대용량이거나 진단을 수행할 경우에 운영 시스템에 문제를 문제가 생길 수 있다고 판단되는 경우가 있습니다. 이때 행정안전부나 진흥원과 협의해서 사유가 타당할 경우 범위를 조정할 수 있습니다.
데이터 값에 대한 품질진단은 범정부 데이터 품질진단기준(16개)를 기준으로 수행하나 이와는 별도로 대상 DB와 관련된 업무 규정이 지침 법령 등에서 정한 내용에 위배되는지 진단하기 위해 법률/규정/규칙/지침에 근거한 업무규칙을 개발하여 진단을 수행해야 합니다.
본 지표는 업무규칙의 도출여부와 품질진단대상으로 도출된 테이블, 컬럼의 진단 수행율로 평가되며, 진단결과 측정된 오류율은 9번 지표(데이터 오류율)에서 반영되고, 오류내역은 8번 지표(품질진단 결과 조치)에서 개선 대상으로 활용됩니다.
[그림 8] 범정부 데이터 품질진단 기준
마지막으로 본 지표에서 고려해야 할 부분은 공간정보에 대한 품질 측정입니다. 공간정보는 공간자료(점,선,면 형태의 벡터 데이터, 인공위성, 항공사진 데이터 등 이미지 형태의 레스터 데이터)와 공간 메타데이터로 구분될 수 있는데, 해당 자료가 있는 경우 국토부에서 품질측정을 하며, 평가 점수는 관련된 지표에 합산 됩니다.
지표 8. 품질진단 결과 조치
앞서 설명 드린 평가 지표 4번에서 7번에 이르기까지 진단했던 결과를 바탕으로 오류 원인을 분석하고 오류정제를 위한 개선계획을 수립하였는지 여부와 개선계획에 있는 당해년도(올해) 개선 과제를 모두 수행하였는지를 기준으로 측정합니다.
개선계획 과제 건수는 전년도 개선계획에 포함된 개선 과제 중에서 개선완료 시점이 전년도 11월부터 당해연도(올해) 10월까지인 과제 그리고 당해연도(올해) 개선 계획 중 완료 시점이 10월까지의 과제 건수를 합산하여 산정합니다.
지표 9. 데이터 오류율
데이터 오류 율 지표는 7번 지표(데이터 품질진단)에서 설명한 범정부 데이터 품질진단기준(16개)와 업무규칙을 기반으로 측정하며, 7번 지표(데이터 품질진단), 8번 지표(품질진단 결과 조치)를 반복수행 후 최종 진단 결과를 증빙자료로 제출하면 됩니다.
지표 10. 오류신고사항 분석 및 개선
평가대상 기간에 데이터를 활용하는 수요자들로부터 신고 접수된 내용(IT 전반) 중 데이터 품질과 관련된 요구사항을 분석해 문제점을 발굴하고 개선하는 활동을 수행하였는지 여부를 점검합니다. 요구사항은 홈페이지를 통한 개선의견, 공공데이터 수요조사 및 이용실태파악을 위한 온라인 설문조사, 공공데이터를 직접 활용하는 기업과 간담회 등을 통하여 수집하며, 이때 반드시 회의록을 작성하여 데이터 품질 요구사항 분석 및 개선보고서 작성 시 첨부하여야 합니다.
지표 11. 개방 데이터 품질수준
공공데이터 포털에 올라와 있는 개방 데이터셋(파일, API)에 대한 품질을 진단하며, 파일은 오류율과 제공표준에 대한 현행화 율을 진단하며, API는 오픈 API 서비스 진단 기준 6개 항목에 따라 진단합니다. 진단은 행정안전부/NIA에서 수행하며, 기관은 개선 후 공공데이터 포털에 다시 올리면 됩니다. 다만 기관에서 별도로 공개한 경우 기관에서 직접 진단을 수행하고, 결과를 통보해야 합니다.
엔코아는 공공기관의 효율적인 "공공데이터 품질관리 수준평가" 위하여 전문 컨설팅과 DA#_DQ Edition과 같은 품질관리 솔루션을 제공하고 있습니다!