과기정통부, 'AI 품질 표준안' 개발
과기정통부, 'AI 품질 표준안' 개발
  • 최영아 기자
  • 승인 2020.10.05 16:00
  • 댓글 0
이 기사를 공유합니다

게티이미지
게티이미지

5일 과학기술정보통신부는 데이터댐의 핵심자원인 인공지능(AI) 데이터에 대해 품질 문제 등을 정리한 표준안을 개발했다고 밝혔다.

또 이를 한국정보통신기술협회(TTA) 단체표준으로 만들기 위해 오는 6일 협회 내 단체 표준화 기구(TTA PG 1005, 인공지능기반기술)에 공식 제안할 예정이라고 전했다.

과기정통부는 "관련 전문가 등의 의견수렴 절차를 거쳐 내년 6월에는 최종 채택될 것으로 전망한다"며 "향후 이 내용을 국립전파연구원 등을 통한 'AI 국제표준화회의'에 제안함으로써 국제표준화 성과로도 이어질 수 있게 추진할 계획"이라고 말했다.

표준안에서 'AI 데이터의 품질'은 'AI 기술(모델 및 알고리즘)에 활용되는 데이터가 다양성, 정확성, 유효성 등을 확보해 사용자에게 유용한 가치를 줄 수 있는 수준'이라는 문장으로 정의됐다. 즉 데이터의 품질은 데이터가 적정한 절차와 요구사항, 규격 등으로 처리되는지에 따라 좌우된다.

세계적으로 AI 데이터의 품질 수준은 그리 높지 않은 상황이다.

마이크로소프트(MS)나 구글 등이 4~6년 넘게 구축해온 개방 데이터셋만 해도 데이터 정확도가 43~83% 수준에 불과하다. 이는 아직 AI 데이터 품질에 대한 체계적 방법론이 정립되지 않은 것이 주요 원인으로 분석된다.

표준안에는 구체적으로 원시데이터 수집단계의 다양성·사실성 및 파일 포맷·해상도 등의 기술 적합성, 정제단계의 데이터 중복방지 및 비식별화 조치, 가공단계의 객체 분류체계 및 라벨링 규격, 품질검수·활용단계의 유효성 등의 내용이 담겼다.

과기정통부는 이번에 개발된 표준안을 이미 추가경정예산(추경) 사업 과제(10대 분야·150종 데이터)에 적용하고 있다.

아울러 과기정통부는 올해 연말까지 표준안을 바탕으로 AI 개발자, 공공기관 관계자 등이 AI 데이터 품질을 보다 체계적으로 관리할 수 있도록 'AI 데이터 품질관리 가이드'를 개발·배포할 계획이다.

 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.