“사진·영상 모자이크 어디까지”…AI 시대, 가명 처리 기준 제시

입력 2024.02.05 (06:32) 수정 2024.02.05 (07:56)

읽어주기 기능은 크롬기반의
브라우저에서만 사용하실 수 있습니다.

[앵커]

인공지능, AI의 경쟁력은 글과 그림, 영상을 직접 학습하는 이른바 '머신러닝'에 달려있습니다.

이 학습을 위해서는 방대한 양의 그림과 영상 데이터가 필요한데, 개인정보가 드러나지 않게 '가명' 처리하는 과정이 필요합니다.

하지만 숫자나 표같은 '정형데이터'와는 달리 그림과 영상 등 '비정형데이터'는 가명 처리에 대한 기준이 없었는데, 정부가 처음으로 마련했습니다.

신지수 기자가 보도합니다.

[리포트]

애플리케이션에 치아 사진을 찍어서 올리면, 치아 건강을 관리해주는 서비스입니다.

방대한 양의 치아 사진을 학습한 인공지능, AI가 치아의 건강 상태를 판단합니다.

그런데, 서비스 개발에 필요한 치아와 구강 사진 4만 5천 장은 해외에서 가져왔습니다.

개인정보 보호를 위해 사진에서 어떤 부분을 가려야할 지에 대한 특별한 기준이 없어 국내 병원들이 공개를 꺼렸기 때문입니다.

[송지은/구강건강 관리 서비스 업체 관계자 : "임의적인 잣대와 기준들을 가지고 데이터 전달을 좀 거절당하던 사례들이 있었습니다."]

더 똑똑한 AI를 만들기 위해선 학습을 위한 데이터를 더 많이 확보하는게 관건입니다.

그런데 전세계 데이터 가운데 90%는 글, 그림, 영상 같은 이른바 '비정형 데이터'입니다.

이 때문에 정부는 비정형 데이터에서 개인 정보가 드러나지 않게 가명 처리 기준을 제시했습니다.

우선, AI 학습에 꼭 필요한 정보라면 남기되, 그 외 정보는 가명 처리 수준을 높여야 합니다.

가명 처리된 사진이나 영상을 복원했을 때, 누군지 알아볼 위험성이 있어서도 안됩니다.

그럴 경우 외부 접속이 제한되는 서버에 데이터를 저장하는 등 통제 방안을 마련해야합니다.

데이터에 혹시 남아있는 개인정보가 없는지 추가 검수도 필수입니다.

[태현수/개인정보보호위원회 데이터안전정책 과장 : "안전성과 활용성을 동시에 확보하는 것이 비정형 데이터 처리의 핵심이라고 볼 수 있습니다."]

세계 각국이 다양한 AI 모델을 내놓으며 주도권 다툼을 벌이는 가운데, 합리적 개인정보 보호 장치 마련도 AI 산업의 중요한 과제로 떠오르고 있습니다.

KBS 뉴스 신지수입니다.

■ 제보하기
▷ 카카오톡 : 'KBS제보' 검색, 채널 추가
▷ 전화 : 02-781-1234, 4444
▷ 이메일 : kbs1234@kbs.co.kr
▷ 유튜브, 네이버, 카카오에서도 KBS뉴스를 구독해주세요!


  • “사진·영상 모자이크 어디까지”…AI 시대, 가명 처리 기준 제시
    • 입력 2024-02-05 06:32:41
    • 수정2024-02-05 07:56:27
    뉴스광장 1부
[앵커]

인공지능, AI의 경쟁력은 글과 그림, 영상을 직접 학습하는 이른바 '머신러닝'에 달려있습니다.

이 학습을 위해서는 방대한 양의 그림과 영상 데이터가 필요한데, 개인정보가 드러나지 않게 '가명' 처리하는 과정이 필요합니다.

하지만 숫자나 표같은 '정형데이터'와는 달리 그림과 영상 등 '비정형데이터'는 가명 처리에 대한 기준이 없었는데, 정부가 처음으로 마련했습니다.

신지수 기자가 보도합니다.

[리포트]

애플리케이션에 치아 사진을 찍어서 올리면, 치아 건강을 관리해주는 서비스입니다.

방대한 양의 치아 사진을 학습한 인공지능, AI가 치아의 건강 상태를 판단합니다.

그런데, 서비스 개발에 필요한 치아와 구강 사진 4만 5천 장은 해외에서 가져왔습니다.

개인정보 보호를 위해 사진에서 어떤 부분을 가려야할 지에 대한 특별한 기준이 없어 국내 병원들이 공개를 꺼렸기 때문입니다.

[송지은/구강건강 관리 서비스 업체 관계자 : "임의적인 잣대와 기준들을 가지고 데이터 전달을 좀 거절당하던 사례들이 있었습니다."]

더 똑똑한 AI를 만들기 위해선 학습을 위한 데이터를 더 많이 확보하는게 관건입니다.

그런데 전세계 데이터 가운데 90%는 글, 그림, 영상 같은 이른바 '비정형 데이터'입니다.

이 때문에 정부는 비정형 데이터에서 개인 정보가 드러나지 않게 가명 처리 기준을 제시했습니다.

우선, AI 학습에 꼭 필요한 정보라면 남기되, 그 외 정보는 가명 처리 수준을 높여야 합니다.

가명 처리된 사진이나 영상을 복원했을 때, 누군지 알아볼 위험성이 있어서도 안됩니다.

그럴 경우 외부 접속이 제한되는 서버에 데이터를 저장하는 등 통제 방안을 마련해야합니다.

데이터에 혹시 남아있는 개인정보가 없는지 추가 검수도 필수입니다.

[태현수/개인정보보호위원회 데이터안전정책 과장 : "안전성과 활용성을 동시에 확보하는 것이 비정형 데이터 처리의 핵심이라고 볼 수 있습니다."]

세계 각국이 다양한 AI 모델을 내놓으며 주도권 다툼을 벌이는 가운데, 합리적 개인정보 보호 장치 마련도 AI 산업의 중요한 과제로 떠오르고 있습니다.

KBS 뉴스 신지수입니다.

이 기사가 좋으셨다면

오늘의 핫 클릭

실시간 뜨거운 관심을 받고 있는 뉴스

이 기사에 대한 의견을 남겨주세요.

수신료 수신료