과학

AI 기반 대규모 언어모델의 개인정보 노출 문제

페이지 정보

작성자 TISSUE 작성일 24-03-29 05:19 댓글 0

본문

 AI 기반 대규모 언어모델의 개인정보 노출 문제

 bbs_20240329051903.jpg



1. 대규모 언어모델 기반의 AI가 주민등록번호 등 개인정보를 제대로 제거하지 못하는 문제가 발견되었습니다.
2. 오픈AI와 구글, 메타 등 6개 사업자의 LLM 기반 AI 서비스에서 주요 식별정보를 미흡하게 처리함이 확인되었습니다.
3. 이용자들은 AI 학습에 개인정보가 노출될 우려와 이를 막는 기능 부재에 대해 우려를 표명했습니다.

[설명]
챗PGT와 같은 대규모 언어모델(Large Language Model, LLM)을 활용한 AI가 주민등록번호와 같은 주요 식별정보를 적절히 제거하지 못하는 문제가 발견되었습니다. 최근 개인정보보호위원회의 조사 결과에 따르면, 오픈AI, 구글, 메타 등의 LLM 기반 AI 서비스가 웹상에서 수집한 데이터에서 주요 식별정보를 제거하는데 미흡한 점이 확인되었습니다. 이에 따라 이용자들은 자신의 개인정보가 AI 학습에 활용될 우려를 표명하고, 이를 방지하기 위한 기능이 미비하다는 점에 우려를 표현했습니다. 개인정보보호를 위해 사업자들이 주요 식별정보를 적절히 관리하고 이용자에게 투명하게 공지해야 할 필요성이 제기되었습니다.

[용어 해설]
- 대규모 언어모델 (LLM) : 수많은 텍스트 데이터를 학습하고 이해하여 자연어 처리와 유추에 활용되는 인공지능 모델
- 주민등록번호 : 국가에서 발급하는 개인 식별 번호로, 개인 신상정보와 연결되어 있어 노출 시 개인정보 침해 가능성이 높음
- 개인정보보호위원회 : 개인정보 보호 정책을 수립하고 시행하는 대한민국 정부 조직

[태그]
#AI #개인정보 #언어모델 #인공지능 #개인정보보호위원회 #데이터보호 #대규모언어모델 #주민등록번호 #사생활보호 #데이터처리 #데이터유출 #사이버보안

추천0 비추천 0

댓글목록 0

등록된 댓글이 없습니다.



구글트랜드 오늘의 핫이슈

 

당신의 관심과 사랑이 사이트의 가치를 만듭니다.
Copyright © tissue.kr. All rights reserved.