세계일보

검색

"AI 사업자, 학습데이터 상 주민번호 사전제거 부족" [오늘의 행정 이슈]

관련이슈 디지털기획 , 오늘의 행정 이슈 , 세계뉴스룸

입력 : 2024-03-28 21:00:00 수정 : 2024-03-28 18:14:37

인쇄 메일 글씨 크기 선택 가장 작은 크기 글자 한 단계 작은 크기 글자 기본 크기 글자 한 단계 큰 크기 글자 가장 큰 크기 글자

‘챗GPT’를 운영하는 오픈AI 등 6개 인공지능(AI) 모델 사업자가 학습데이터에서 주민등록번호 등 주요식별정보를 사전 제거하는 조치를 충분하게 하지 않은 것으로 확인됐다.

 

개인정보보호위원회는 AI ‘대규모 언어 모델’(LLM)을 개발‧배포하거나 기반 서비스를 제공하는 6개 사업자(오픈AI·구글·마이크로소프트·메타·네이버·뤼튼)에 대해 개인정보 보호 취약점을 보완하도록 개선권고했다고 28일 밝혔다.

 

사진=게티이미지뱅크

개인정보위에 따르면 이들 업체는 개인정보보호법상 기본 요건을 대체로 충족했으나, 일부 미흡한 사항이 발견됐다. 우선 AI 학습 과정에서 중요 개인정보가 포함될 수 있는 것으로 드러났다. AI 서비스 제공사업자는 인터넷에 공개된 데이터를 수집해 학습데이터로 사용하는데, 이 과정에서 개인정보가 노출될 수 있다는 것이다. 개인정보위는 지난해 기준 2만999개 페이지에서 주민번호, 여권번호 등 개인정보 노출이 탐지됐다고 설명했다.

 

이용자 질문과 AI의 답변 내용을 사람이 직접 열람·검토해 사생활을 침해할 수 있다는 우려도 나왔다. 사업자가 개인정보를 제거하지 않고 정보를 저장하는 일이 생길 수 있기 때문이다. AI가 복제 모델이나 오픈소스 형태로 배포될 경우 취약점이 발견돼도 즉시 개선하기 어려운 사례도 확인됐다. 

 

개인정보위 관계자는 “인터넷에 우리 국민의 개인정보가 노출된 것을 탐지한 데이터를 AI 서비스 사업자에게 제공할 방침”이라며 “부적절한 답변에 대한 신고 기능을 반드시 포함하도록 개선권고했다”고 설명했다.

 

한편 개인정보위가 이날 발표한 ‘2023년 개인정보보호 및 활용조사’에 따르면 성인의 94.3%, 아동·청소년의 91.7%가 개인정보 보호를 중요하게 생각한다고 답했다. 제공하기를 주저하는 개인정보로는 성인과 아동·청소년 모두 주민번호 등 ‘고유식별정보’(37.4%, 21.1%)와 ‘인적사항’(32.0%, 57.6%)을 가장 많이 꼽았다.


이병훈 기자 bhoon@segye.com

[ⓒ 세계일보 & Segye.com, 무단전재 및 재배포 금지]

오피니언

포토

한지민 '우아하게'
  • 한지민 '우아하게'
  • 아일릿 원희 '시크한 볼하트'
  • 뉴진스 민지 '반가운 손인사'
  • 최지우 '여신 미소'