본문바로가기

한겨레21

기사 공유 및 설정

악마는 ‘가명’의 디테일에 있다

개인정보와 익명정보 사이에 가명정보 영역 만드는 ‘데이터 3법’, 시행령 단계에서 2차전 가능성
등록 2019-12-10 10:04 수정 2020-05-03 04:29
노동시민사회단체 관계자들이 12월4일 서울 종로구 참여연대에서 ‘데이터 3법’에 반대하는 기자회견을 열었다. 연합뉴스

노동시민사회단체 관계자들이 12월4일 서울 종로구 참여연대에서 ‘데이터 3법’에 반대하는 기자회견을 열었다. 연합뉴스

‘데이터 3법’이 국회 통과를 눈앞에 두고 있다. 데이터 3법은 2018년 11월 정부가 만들고 여당 의원들이 대표 발의한 데이터 관련 3개 법률 개정안(개인정보보호법, 신용정보법, 정보통신망법)을 말한다. 여야 합의로 일부 수정을 거쳐 국회 상임위원회를 통과했고, 12월5일 현재 법제사법위원회에 계류돼 있다. 반대 의견을 내는 국회의원이 거의 없어 이변이 없다면 곧 본회의에 상정되고 통과될 것으로 보인다.

알아볼 수 있다, 없다

데이터 3법은 국민의 개인정보 보호 수준을 일부 낮춰 공공과 산업적 목적으로 활용도를 높이는 법이다. 그 핵심은 개인정보와 익명정보 사이에 ‘가명정보’라는 회색지대를 신설하고, 가명정보를 “새로운 기술·제품·서비스의 개발 등 산업적 목적을 포함하는 과학적 연구, 통계 작성, 공익적 기록 보존 등의 목적”으로 활용할 수 있게 하는 것이다.

데이터 3법이 통과되면 국민의 개인정보를 보유한 공공기관·기업·단체 등이 각 개인(정보주체)에게 동의를 구하지 않고도 개인정보를 가명 처리해 제3자에게 제공할 수 있다. 신용·금융·통신·의료·질병·소득·소비 등 대부분 영역의 개인정보를 포함한다. 제한적인 방식으로 다른 기관의 가명정보와 서로 결합해 사용할 수도 있다. 현재는 개인정보를 가명 처리하더라도 정보주체의 동의를 구하지 않고 제3자에게 제공하면 법적 처벌을 받는다.

이 법은 산업계와 정부, 여야 국회의원 다수가 찬성하고 있다. 특히 산업계에선 소비자 맞춤형 서비스와 타깃마케팅 등으로 경제가 활성화된다며 반기고 있다. 반대하는 쪽은 주로 참여연대, 경제정의실천시민연합, 진보네트워크센터, 민주사회를위한변호사모임 등 진보 계열 시민단체들이다. 법이 통과되면 개인정보 유출과 악용이 빈번할 것이라고 우려한다.

찬반 논쟁에 여러 쟁점이 있지만 특히 ‘가명정보의 안전성’에 대해 주장이 엇갈린다. 찬성쪽은 추가 정보를 사용하지 않고는 가명정보로 특정 개인을 알아볼 수 없으며, 가명정보와 추가 정보로 개인을 식별하려는 사람을 처벌하는 규정이 있다고 강조한다. 반대쪽은 가명정보로도 얼마든지 특정 개인을 알아볼 수 있다고 반박한다. 양쪽 주장이 서로 모순되는 상태로 수많은 기사가 만들어지고 있다.

왜 이런 논란이 벌어지는 걸까. 기존 개인정보와 익명정보를 나누는 기준이 모호한데 여기에 가명정보까지 더해지며 불확실성을 높이기 때문이다. 가명정보는 개인정보의 하나로 포함됐는데도 익명정보처럼 산업적 활용이 가능하다. 이런 복잡성 때문에 찬성과 반대의 주장도 엇갈린다.

박근혜 정부, 개인정보 변환 사용

좀더 자세히 살펴보자. 개인정보는 현행법상 ①성명, 주민등록번호, 영상 등을 통해 개인을 알아볼 수 있는 정보와 ②해당 정보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합해 알아볼 수 있는 정보를 뜻한다.

익명정보는 개인정보의 반대 개념이다. 쉽게 결합할 수 있는 다른 정보를 더해도 누구인지 알아볼 수 없는 정보다. 그런데 ‘쉽게 결합할 수 있는 다른 정보’가 사람마다 상황마다 다르기 때문에, 익명정보를 엄격히 정의하면 ‘현실에서 동일 정보값을 가진 사람이 2명 이상인 정보’라고 할 수 있다. 예를 들어 {서울 마포구, 25살, 남성}에 해당하는 사람은 최소 2명 이상이라 익명정보라고 할 수 있다.

박근혜 정부도 기업이 개인정보를 산업 목적으로 활용할 수 있게 정책을 폈다. 이때는 가명정보 개념을 도입하지 않고 개인정보를 익명정보로 변환해 사용하게끔 했다. 그 방법은 2016년 6월 국무조정실 등 6개 정부 부처가 공동으로 펴낸 ‘개인정보 비식별 조치 가이드라인’(이하 가이드라인)에 자세히 나와 있다. 기본 모델은 ‘k(케이)-익명성’이다. 개인정보를 익명화해서 공개할 때는 동일 정보값을 가진 사람이 최소 k명 이상 존재하도록 하라는 지침이다.

가이드라인은 ‘k=3’이 안전도를 보장하는 최소한의 수준이라고 밝힌 미국 교육부 기준을 소개하고 있다. 이 말은 ‘{서울 마포구 망원동 거주, 1994년 12월5일 출생, 남성, 고졸, 공인중개사}인 사람의 질병 정보’처럼 구체적인 정보를 제3자에게 제공할 때, 괄호 안의 정보와 일치하는 사람이 해당 데이터 집합에서 최소 3명 이상 되는지 확인하고 제공하라는 뜻이다. 만약 3명 이상 되지 않는다면 개인이 특정될 위험이 있으므로 출생일을 ‘1990년대’로 뭉뚱그리든지 성별을 삭제해 정보의 정확도를 떨어뜨려야 한다.

가이드라인을 보면 ‘k-익명성’을 지켰더라도 개인정보가 노출될 위험은 있으며, ‘엘(l)-다양성’과 ‘티(t)-근접성’ 등 다른 지표를 이용해 보완해야 한다고 안내한다. 그만큼 개인정보를 익명정보로 바꾸기 어렵다는 뜻이다.

개인정보 결합 많아지면 개인정보에 가까워져

데이터 3법은 현행법의 개인정보(앞의 정의①②)에 더해 가명정보를 개인정보의 하나로 포함하고 있다. 가명정보는 “(개인정보를) 가명 처리함으로써 원래의 상태로 복원하기 위한 추가 정보의 사용·결합 없이는 특정 개인을 알아볼 수 없는 정보”다. 여기서 ‘추가 정보’는 “식별자를 임의의 값으로 대체하는 과정에서 사용된 규칙 또는 암호화 방식 등”을 의미한다(2018년 12월 국회 정무위원회 조용복 수석전문위원 ‘신용정보법 검토보고서’).

쉽게 말해 가명정보는 개인정보에서 이름과 연락처 등을 ‘추가 정보’(암호 규칙)를 이용해 알아볼 수 없게 바꾼 것이다. ‘신용정보법 검토보고서’는 해시함수를 통해 이름과 연락처(이순신, 010-4567-9876)를 조합해 암호값(DACE2CCC9459387EAE890D85344)으로 바꾼 예를 들고 있다.

찬반 양쪽은 가명정보를 서로 다르게 인식하고 있다. 찬성쪽은 가명정보가 ‘다른 정보와 쉽게 결합해 특정 개인을 알아볼 수 있는 정보’(개인정보 ②번 정의)를 포함하지 않는다고 말한다. 반대쪽은 그런 정보도 일부 포함할 것이라고 우려한다. 문제는 ‘다른 정보와 쉽게 결합해 특정 개인을 알아볼 수 있는 정보’라는 정의 자체가 워낙 범주가 넓고 모호해 어느 쪽이 맞다고 단정하기 힘들다는 데 있다.

.

.

반대쪽 의견부터 들어보자. 온라인에는 나도 모르는 사이 공개된 내 개인정보가 조각조각 퍼져 있다. 학교 졸업생 명단, 종교단체·동호회·학회 명단, 선거인명부, 공공기관·지방자치단체 공개 기록물, 물건 구매 후기, 언론 기사 등이 게시돼 있다. 여기서 이름, 나이, 성별, 생년월일, 주소, 연락처, 전자우편, 출신학교, 소셜네트워크서비스(SNS) 아이디, 소속 회사 등을 손쉽게 구할 수 있다. 이런 정보를 결합하면 {서울 마포구 망원동 거주, 1994년 12월5일 출생, 남성, 고졸, 공인중개사}라는 정보를 가진 개인을 손쉽게 특정지을 수도 있다.

특히 사회적으로 소수에 속하는 특성을 가진 사람일수록 개인 식별 위험이 크다. 대표적으로 희소질환자가 있다. 예를 들어 {제주, 12살, 남, 백혈병} 정보를 가진 사람은 한두 명으로 특정될 가능성이 높다. 소수자가 꼭 사회적 약자를 의미하지는 않는다. ‘연소득 20억원 이상인 사람’이나 ‘20채 이상 다주택자’처럼 그 수가 적은 경우는 모두 해당된다. 평범한 정보라도 두 가지 이상 속성이 결합될 경우 범위가 급격히 좁아지기도 한다. 예를 들어 ‘건설 일용직, 대학원 졸업 이상 학력’이라든지 ‘간호사, 남성’ 등이다.

그래서 진보 계열 시민단체에선 데이터 3법에 포함된 ‘데이터 결합’을 크게 우려한다. 개정안은 개인정보 보호위원회 등이 지정하는 전문기관을 통해 서로 다른 기관의 가명정보를 결합할 수 있도록 하고 있다. 데이터가 많이 결합될수록 가명정보의 정확도가 높아져 개인정보에 가까워진다. 이런 결합정보가 민간에 돌아다니면 사생활 침해, 사회적 약자 차별, 보이스피싱 범죄 피해 증가 등이 예상된다.

“익명화 기법 사용” vs “공식 문서에 반영해야”

찬성쪽이 이런 우려를 불식하려면 가명정보를 만들 때 앞서 소개한 익명화 기법(k-익명성, l-다양성)처럼 익명성이 확실히 보장되는 기술을 적용하도록 하면 된다. 정영수 행정안전부 개인정보보호정책과 사무관은 과 한 통화에서 “데이터를 결합한 뒤 개인이 특정될 위험이 있는 경우 익명화를 하거나, 데이터 사이의 상관관계만 기업에 제공하도록 시행령으로 규정할 수 있다”고 말했다.

하지만 반대쪽은 정부의 말을 신뢰하지 않는다. 오병일 진보네트워크센터 대표는 “데이터 3법 개정안을 보면 결합된 데이터베이스를 가명정보 상태 그대로 가져갈 수 있도록 돼 있다”면서 “담당자가 구두로 말하는 것은 믿을 수 없고, 법안이나 공식 문서에 반영되도록 해야 한다”고 했다. 데이터 3법이 통과되더라도 가명정보에 어느 수준의 익명화 기법을 적용할지를 놓고 시행령 단계에서 2차전이 벌어질 가능성이 있다. 산업계는 정확도가 높은(익명성이 낮은) 가명정보를 원할 것이고, 시민단체는 익명성이 높은(정확도가 낮은) 가명정보를 원할 것이다.

데이터 3법에는 찬반 양쪽이 모두 긍정하는 부분이 있다. 현재 정부에 종속된 개인정보보호위원회를 독립적 중앙행정기구로 승격해 개인정보 보호 수준을 높이는 것이다. 이로 인해 법이 통과되면 한국이 유럽연합의 일반개인정보보호법(GDPR)의 적정성 평가 심사를 통과할 가능성이 높아져, 한국 기업들이 유럽인을 상대로 개인정보를 수집할 때 비용과 시간을 줄일 수 있다. 또 가명정보를 학술 연구, 통계 작성, 공익적 기록 보존 등에 활용할 경우 사회 전반의 정보값을 높이고 발전을 이끌 수 있다. 진보 계열 시민단체에서는 데이터 3법에서 ‘가명정보의 산업적 활용’과 ‘데이터 결합’ 등 독소조항을 제거하고 정보주체의 권리를 확대하는 데 주력하고 있다.

변지민 기자 dr@hani.co.kr
한겨레는 타협하지 않겠습니다
진실을 응원해 주세요
맨위로