본문 바로가기

정보 보안

[036] 개인정보보호 강화 기술 (PET, Privacy Enhancing Technology)이란 무엇인가?


보안 및 개인 정보 보호를 보장하면서 데이터 공유와 처리를 보장하기 위한 기술의 총칭


분야별 상세 설명
(1) 동형 암호(Homomorphic encryption)
▶ 개인정보보호를 위해 암호화된 상태에서 연산 가능한 동형 암호를 이용할 수 있음


• 클라이언트-서버 모델의 동형 암호 환경에서 클라이언트는 암호화된 데이터를 서버로 보내고 복호화 없이 암호화된 데이터에 대해 특정한 분석을 수행하며 암호화된 결과는 클라이언트에게 전송되어 클라이언트는 이를 해독하여 분석결과를 획득

(2) 차등 개인정보보호(Differential privacy)
▶ 대규모 데이터에서 개별 주체들의 개인정보 노출을 최소화하는 동시에 개인정보를 활용할 수 있는 방법으로 차등 개인정보보호를 이용할 수 있음


▶ 인공지능(AI) 학습에서 개인정보를 보호하기 위해 데이터를 계산하거나 결과를 산정하기 전에 데이터에 통계적 '노이즈'를 삽입하여 개인정보가 제3자에게 노출되지 않도록 익명성을 제공하는 기술로 차등 개인정보보호를 사용
▶ 차등 개인정보보호는 개인정보를 포함하는 대규모 데이터베이스 환경에 적합하며, 노이즈를 삽입하는 방식에 따라 글로벌(Global)과 로컬(Local) 차등 개인정보보호로 구분
• 차등 개인정보보호는 데이터베이스에 많은 개인정보가 포함되는 경우 집계 통계를 생성하여 개인정보 식별을 어렵게 할 수 있음
• 글로벌 차등 개인정보보호는 기본적으로 서버 측면의 신원에 대한 익명화와 관련되며, 반면 로컬 차등 개인정보보호는 클라이언트 기기 측면의 애플리케이션 신원에 대한 익명화나 비식별화에 중점을 둠


(3) 생성적 적대 신경망(Generative Adversarial Networks)
▶ 기존 딥러닝 기술과 다르게 적대적 학습방식을 이용하여 스스로 학습하고, 대량의 이미지와 데이터를 생성할 수 있는 생성적 적대 신경망을 개인정보보호 강화 기술로 이용할 수 있음


• 생성적 적대 신경망(GAN)은 쌍으로 알고리즘을 생성하는 데 중점을 둔 인공지능(AI)의 변형형태임
• 쌍으로 존재하는 GAN 알고리즘 중 하나는 학습에 초점을 맞추고 가짜 데이터를 생성하는 생성기(Generator) 역할을 수행하며, 다른 알고리즘은 가짜 데이터를 판별하는 판별기(discriminator) 역할을 수행
▶ 생성적 적대 신경망은 비지도(unsupervised) 머신러닝을 이용한 애플리케이션에서 주로 활용되며, 이러한 애플리케이션은 실제 데이터의 매우 효과적인 시뮬레이션을 제공하기 위해 2개의 신경망(neural networks) 간 경쟁을 포함
• 합성 데이터 세트를 개발할 때 주로 생성적 적대 네트워크를 활용

(4) 안전한 다자간 컴퓨팅(Secure Multi-Party Computation)
▶ 안전한 다자간 컴퓨팅(SMPC)은 가치를 계산할 수 있는 능력을 제공하는 분산 컴퓨팅 기술로, 개인정보를 타인에서 공개하지 않고 여러 암호화된 데이터 소스에서 입력정보를 받을 수 있음


• 안전한 다자간 컴퓨팅의 가장 일반적인 예는 비밀공유이며, 비밀공유 과정에서 당사자들에게 무작위로 암호화된 형태로 데이터의 일부분을 공유
• 무작위로 암호화하여 공유된 데이터의 일부분을 재결합하면 원하는 통계 결과를 획득

(5) 제로지식증명(Zero-knowledge proof)
▶ 제로지식증명(ZKP)은 한 당사자(Prover: 증명자)가 다른 당사자(Verifier: 검증자)에게 비밀 자체에 대한 정보를 공개하지 않고 비밀을 소유하고 있음을 증명할 때 사용


• ZKP는 인증정보를 공개하지 않으면서 신원을 증명할 수 있는 기술로 도입된 이후, 진술내용의 세부사항을 공개하지 않고 진술내용의 사실성 여부를 증명하는데 적용
• 예를 들어 ZKP는 생년월일과 같은 개인정보를 공개하지 않고 개인의 나이를 증명하는 데 도움이 될 수 있으며, 기본적으로 개인정보 최소화 등 개인정보보호를 강화
▶ ZPK는 가명처리를 위해 증명자가 검증자에게 메시지를 전송할 때 사용되어 증명자와 검증자는 메시지를 안전하게 공유할 수 있으며, 이들 당사자만 메시지에 안전하게 접근 가능하도록 할 수 있음12)
• ZPK는 완전성(Completeness), 건실성(Soundness), 영지식(Zero-Knowledge)의 특성을 지니며, 이를 통해 가명처리 등에 활용할 수 있음
※완전성: 진술이 옳은 경우, 정직한 증명자는 진술 사실이 옳다고 정직한 검증자 설득 가능 ※ 건실성: 진술이 거짓인 경우, 거짓된 증명자는 진술이 정확하다고 정직한 검증자를 설득할 수 없음 ※영지식: 진술이 정확한 경우 검증자는 단지 진술이 옳다는 사실만 확인 가능

(6) 연합학습(Federated Learning)
▶ 데이터로부터 자동화된 학습모델 훈련을 지원하는데 연합학습을 이용
• 연합학습은 여러 위치에 분산 저장된 데이터를 직접 공유하지 않으면서, 협력하며 AI 학습할 수 있는 분산형 머신러닝 기법


• 일반적으로 클라이언트가 보유한 데이터를 중앙서버에 모아서 일괄적으로 AI 모델을 학습하지만, 연합학습에서는 데이터를 중앙서버로 전송하지 않고, 중앙서버의 AI 모델을 클라이언트로 보내 각각의 데이터로 모델을 훈련