정부가 생성형 인공지능(AI) 개발 시 활용되는 인터넷상의 공개 데이터를 안전하게 처리할 수 있는 가이드라인을 마련했다.
개인정보보호위원회는 17일 'AI 개발·서비스를 위한 공개된 개인정보 처리 안내서'를 마련해 공개했다. 공개 데이터는 누구나 합법적으로 접근할 수 있는 데이터로 '챗GPT'를 비롯한 생성형 AI를 개발하기 위한 학습데이터의 원료로 쓰인다. AI 기업은 커먼크롤, 위키백과, 블로그, 웹사이트 등 공개 데이터를 스크래핑 등 방식으로 수집해 데이터로 활용한다.
이러한 공개 데이터에는 주소, 고유식별번호, 신용카드번호 등 개인정보가 포함될 수 있으나, 현행 개인정보보호법(이하 보호법)상 정보주체 개별 동의나 계약 등의 조항을 적용하기는 사실상 어려운 상황이다. 이에 개인정보위는 공개된 개인정보 수집·활용의 법적 기준을 명확하게 하고 AI 개발·서비스 단계에서 기업이 안전조치를 취할 수 있도록 안내서를 마련했다.
개인정보위는 보호법 제15조에 따라 '정당한 이익' 조항에 의해 공개된 개인정보를 AI 학습·서비스 개발에 활용할 수 있다고 밝혔다. 또한 '정당한 이익' 조항을 적용하기 위해서는 AI 개발 목적의 정당성, 공개된 개인정보 처리의 필요성, 구체적 이익형량이라는 세 가지 요건을 충족해야 한다. 개인정보위는 '정당한 이익' 조항의 합리적 해석기준을 마련하는 것은 유럽연합 일반 개인정보보호법(EU GDPR), AI 안전성 규범 논의 등 글로벌 스탠다드와의 상호 운용성을 높이게 되는 측면이 있다고 설명했다.
개인정보위는 안내서를 통해 AI 기업이 '정당한 이익'을 근거로 공개된 개인정보를 처리하기 위해 고려할 수 있는 기술적‧관리적 안전성 확보조치와 정보주체 권리보장 방안을 구체적으로 안내했다. AI 기업은 모든 안전조치를 의무적으로 시행해야 하는 것은 아니며, 기업의 특성에 맞게 세부적 안전조치 등을 유연하게 도입·시행할 수 있도록 했다.
또한 개인정보보호책임자(CPO)를 구심점으로 한 'AI 프라이버시 담당조직'을 자율적으로 구성해 운영하고, 안내서에 따른 기준 충족 여부를 평가해 그 근거를 작성하고 보관하도록 권고했다. AI 성능 개선 등 중대한 기술적 변경이나 개인정보 침해 발생 우려 등 위험 요인을 주기적으로 모니터링하고, 개인정보 유·노출 등 침해사고 발생 시 신속한 권리구제 방안도 마련하도록 했다.
안내서는 개인정보 관련 법령 제·개정, 인공지능(AI) 기술발전 추이, 해외 규제정비 동향 등을 고려해 지속적으로 업데이트될 예정이다.
고학수 개인정보보호위원장은 "이번 안내서를 통해 국민이 신뢰하는 AI·데이터 처리 관행을 기업 스스로 만들어 나가고 이렇게 축적된 모범사례가 안내서에 지속적으로 반영될 수 있기를 기대한다"고 말했다.