
▲텔레그램 딥페이크 성폭력 대응 긴급 집회지난해 9월 6일 저녁 서울 종로 보신각 앞에서 한국여성의전화 주최로 열린 텔레그램 딥페이크 성폭력 대응 긴급 집회에서 참가자들이 구호를 외치고 있다. ⓒ 연합뉴스
딥페이크는 AI 알고리즘을 활용해 실제 사람의 얼굴이나 음성을 사실적으로 합성한 가짜 콘텐츠이다. 2019~2020년경에는 합성곱 신경망(CNN, 이미지에서 특징을 추출하는 모델)을 활용해 얼굴을 분할하고, 생성적 적대 신경망(GAN, 가짜 이미지를 생성하는 모델)으로 단일 프레임 이미지를 변형하는 수준이었다. 그러나 이후 영상 해상도가 높아지고 알고리즘이 정교해지면서 딥페이크 탐지가 점점 더 어려워지고 있다.
2024년 이후에는 트랜스포머(텍스트뿐만 아니라 영상과 음성을 함께 분석하는 기술) 기반 멀티모달 분석, 시계열 랜드마크 추적 같은 기법이 연구되고 있지만, 여전히 합성 데이터셋의 편향 문제나 초고화질 합성물의 일반화 한계 등 해결해야 할 과제가 남아 있다.
딥페이크 악용과 법적 공백
딥페이크 기술이 발전하면서 이를 악용한 사회적 위험은 심각한 수준이다. 특정 정치인이나 연예인의 얼굴을 합성해 허위 정보를 퍼뜨리거나, 개인 이미지를 무단 활용해 협박 및 성적 이미지로 변조하는 사례가 대표적이다.
2023년 미국 사이버 보안 업체 시큐리티 히어로가 발표한 '2023 딥페이크 현황' 보고서에 따르면, 조사 대상 딥페이크 음란물 중 절반 이상이 한국인을 대상으로 제작된 것으로 나타났다. 이는 한국이 딥페이크 범죄의 주요 피해국임을 시사한다. 그러나 한국의 현행 법률만으로는 딥페이크 제작 및 유포자를 실질적으로 처벌하는 데 한계가 있다.
반면, 미국은 선거철 딥페이크 영상 유포를 규제하는 법안을 마련했고, 영국은 딥페이크를 활용한 아동 성착취물 제작 자체를 범죄로 규정하는 법안을 발의하는 등 강력한 대응을 추진하고 있다. 한국 역시 보다 효과적인 법적 규제 방안을 마련해야 한다.
딥페이크 탐지 기술과 데이터셋 개선 필요성
딥페이크 탐지를 위해서는 고도화된 탐지 알고리즘과 신뢰할 수 있는 데이터셋 구축이 필수적이다. 초기(2019~2020년)에는 FaceForensics++(FF++), Celeb-DF 등의 데이터셋을 활용해 CNN 기반 분류기를 학습했으나, 이들 데이터셋은 합성 방식이 한정적이고 얼굴 각도, 조명, 인종 분포 등이 충분히 다양하지 않아 실제 환경에서는 탐지 성능이 크게 떨어지는 문제가 있었다.
이를 해결하기 위해 최근(2024년 이후)에는 GAN을 활용한 다양한 표정, 조명, 안면 특성을 반영한 합성 데이터를 추가 확보하여, 탐지 모델의 일반화 성능을 높이려는 시도가 이루어지고 있다. 그러나 완전히 가상의 인물 이미지나 음성을 학습 데이터로 사용할 경우, 실제 딥페이크의 특유한 결함을 포착하는 능력이 떨어질 수 있어 합성 데이터셋의 품질 관리가 핵심 과제로 떠오르고 있다.
기술적으로는 단일 프레임 분석보다 연속된 프레임 간의 미세한 차이를 감지하는 동적 탐지 기법이 주목받고 있다. 예를 들어, 눈 깜빡임 주기나 심장박동에 따른 얼굴 색 변화와 같은 비자연스러운 움직임을 포착하는 방식이 효과적이다. 또한, 트랜스포머, 그래프 신경망(GNN, 데이터 간 연결 구조를 그래프로 표현 및 학습하는 모델) 등 최신 AI 모델을 활용해 텍스처, 주파수, 음성 스펙트럼 등 다양한 특성을 함께 분석하는 접근법도 연구되고 있다. 그러나 고화질 딥페이크나 긴 영상에서는 탐지 정확도가 떨어지는 문제가 여전히 존재한다. 전문가들은 단순히 '진짜 vs. 가짜'로 판별하는 것이 아니라, 딥페이크 합성 가능성을 확률적으로 제시하고 근거를 설명하는 XAI(eXplainable AI) 기법이 탐지의 새로운 표준이 될 것이라고 전망한다.
보안 위협과 법적 대응 강화 필요성
딥페이크 기술이 음란물과 허위 정보에만 악용되는 것은 아니다. 최근에는 합성 문서나 가짜 신분증 등을 이용한 금융 사기, 기업 기밀 유출, 범죄 조직의 신분 세탁 사례도 증가하고 있다. 이에 대응해 일부 기업은 FORGE 기법을 활용한 '가짜 내부 문서'를 섞어 넣어 해커를 교란하는 전략을 사용하기도 한다. 또한, 허위 졸업증명서나 은행 거래 명세표 등을 제작해 판매하는 사이트도 존재하며, 이를 단속할 법적 장치가 미흡한 실정이다. 특히 아동 및 청소년을 대상으로 한 딥페이크 범죄의 경우, 보다 강력한 처벌 기준을 마련해야 한다.
기술 발전과 법적 규제 강화가 함께 이루어져야
결국, 딥페이크 탐지 기술의 고도화와 함께, 신뢰할 수 있는 합성 데이터셋의 품질과 다양성을 확보하는 것이 탐지 성능 향상의 핵심이다. 또한, 생성형 AI가 허위 조작 콘텐츠를 만들지 못하도록 강력한 규제 장치를 마련하고, 사회적 피해를 예방하는 법적 대응도 병행되어야 한다.
기술적인 측면에서는 CNN이나 RNN 기반 방식의 한계를 극복하기 위해, 멀티모달 분석 및 시계열 주파수 도메인을 융합한 기법이 더욱 주목받을 것으로 보인다. 결론적으로, 기술적ㆍ법적 대응이 균형을 이루어야만 딥페이크로 인한 사회적 신뢰 훼손과 피해를 최소화할 수 있으며, AI 기술이 안전하게 활용될 수 있을 것이다.
덧붙이는 글 | 유도진 기자는 극동대학교 해킹보안학과 교수입니다.