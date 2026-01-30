큰사진보기 ▲2025년 12월 30일 국회 본회의에서 인공지능 발전과 신뢰 기반 조성 등에 관한 기본법 일부개정법률안이 통과되고 있다. ⓒ 연합뉴스 관련사진보기

덧붙이는 글 | 대학에서 인공지능 윤리를 강의하고 있습니다. 다음 회에서는 AI 학습 데이터 저작권 침해의 핵심 쟁점인 ‘공정이용’과 ‘변형적 사용’의 법리를 깊이 있게 살펴보겠습니다.

지난 22일, 한국은 세계 최초로 '인공지능 발전과 신뢰 기반 조성 등에 관한 기본법'(아래 AI 기본법)을 시행했다. 유럽연합(EU)보다 6개월 빠른 쾌거였지만, 정작 이 법이 해결해야 할 핵심 문제는 여전히 뜨겁다. 바로 "생성형 AI가 창작자의 저작물을 무단으로 학습해도 되는가"라는 질문이다. 전 세계 법정에서는 이미 치열한 AI 저작권 침해 소송으로 신음 중이다.2025년 8월, 미국 AI 기업 앤스로픽(Anthropic)은 작가들과 역사상 최대 규모의 저작권 합의에 도달했다. 합의금은 15억 달러(약 2조 원)였다. 앤스로픽의 AI 챗봇 '클로드(Claude)'가 46만5천여 부의 책을 무단으로 학습 데이터로 사용했다는 혐의였다.흥미로운 점은 판사의 판단이었다. 윌리엄 알섭(William Alsup) 연방지방법원 판사는 "합법적으로 구매한 책을 AI 훈련에 사용하는 것은 극도로 변형적(quintessentially transformative)"이라며 공정이용을 인정했다. 그러나 동시에 "해적판 사이트(LibGen, PiLiMi)에서 불법 복제한 책을 사용한 것은 명백한 침해"라고 판단했다. 합의금을 계산해보면, 작품당 평균 3,000달러(약 400만 원)였다. 베스트셀러 작가들에게는 턱없이 적은 금액이었지만, 이 합의는 중요한 메시지를 담고 있었다. AI 기업은 학습 데이터의 출처를 명확히 해야 하고, 해적판 사용은 어떤 경우에도 정당화될 수 없다는 것이다.2025년 11월 11일, 독일 뮌헨 지방법원은 더욱 강력한 판결을 내렸다. 오픈AI의 챗GPT가 독일 노래 가사 9곡을 '암기'해, 사용자가 간단한 프롬프트만 입력해도 거의 동일한 가사를 출력한다는 독일음악저작권협회(GEMA)의 주장을 받아들인 것이다.법원의 논리는 명확했다. AI 모델의 파라미터에 저작물이 영구적으로 체화(embodiment)된 것 자체가 저작권법상 복제권 침해라는 판단이었다. 유럽의 텍스트·데이터 마이닝(TDM) 예외 조항은 일시적 복제는 허용하지만, 영구적 고정까지 허용하지 않는다는 엄격한 해석이었다.특히 주목할 점은 오픈AI가 받은 명령이었다. 저작권 침해 중지는 물론, 손해배상 지급, 학습 데이터 이용 내역 정보 제공, 6개월 유예기간 거부 등 강력한 조치였다. 법원은 "훈련된 모델에서 데이터를 제거하는 것이 기술적으로 어렵다는 점을 인정하지만, 침해를 방지할 의무는 제공자에게 있으며, 실무적으로는 출력 필터, 모델 재훈련, 라이선스 전략 등 다층적 조치가 필요하다"라고 명시했다. 이는 미국의 '공정이용' 중심 접근과 명확히 대조된다. 독일과 유럽은 저작권자의 권리를 더 절대적으로 보호하는 태도를 취한 것이다.한국도 예외가 아니다. 2025년 1월, KBS·MBC·SBS 지상파 3사가 네이버를 상대로 국내 첫 AI 저작권 소송을 제기했다. 네이버의 생성형 AI '하이퍼클로바X'가 방송사의 뉴스 콘텐츠를 무단으로 학습 데이터로 사용했다는 주장이었다.2025년 11월 2차 변론에서 서울중앙지법 재판부는 핵심 쟁점을 명확히 했다. "저작권 침해를 청구원인으로 제시한 이상 구체적 침해는 개별 저작물을 통해 판단할 수밖에 없다"는 것이었다. 이는 단순한 법리가 아니라, 현실적인 증거 문제를 제기한 것이다. 네이버는 침해 대상을 특정하라고 요구했고, 방송사는 네이버가 어떤 콘텐츠를 학습에 사용했는지 공개하라고 맞섰다.바로 이 지점에서 답답함이 생겨난다. 왜냐하면 일반 사용자도, 법원도, 심지어 AI 개발사도 "정확히 어떤 데이터가 AI 학습에 사용되었는지" 알 수 없기 때문이다. AI 모델의 '블랙박스' 특성 때문이다. 이 소송은 2026년 1월 22일 3차 변론을 진행했다. 흥미롭게도 그 날짜는 바로 AI 기본법이 시행되는 날이다.AI 기본법은 분명 의미 있는 진전이다. 제31조는 생성형 AI 결과물에 'AI 생성 표시'를 의무화했다. 이는 AI 생성물과 인간 창작물을 구별하는 첫걸음이다. 2024년 11월 발의된 저작권법 개정안도 같은 방향을 제시했다. 더 중요한 것은 제34조다. AI 기본법은 '고영향 AI 사업자'(의료, 교통, 에너지, 채용, 공공서비스 등 10개 영역)에게 여러 의무를 부과했다. 그 중 하나가 "기술적으로 가능한 범위 내에서 학습데이터의 개요를 설명"하도록 하는 것이다. 투명성 확보 의무라고 할 수 있다.그런데 여기가 문제다. "기술적으로 가능한 범위"라는 표현이 애매하다. AI 개발사들은 이를 구실로 최소한의 정보만 공개할 가능성이 크다. 영업비밀, 기술 보호 등을 이유로 말이다. 세계 각국이 서로 다른 대답을 내놓고 있다. 미국은 사례별로 '공정이용' 4요소를 분석하여 유연한 판단을 한다. 독일과 유럽은 저작권자의 절대적 권리를 우선시하여 암기 자체를 침해로 본다. 일본은 2018년 저작권법 개정으로 "AI 학습 목적의 저작물 이용"을 명시적으로 허용했다.우리나라 AI 기본법은 이 문제에 명확한 답을 주지 못했다. 대신 "자율규제"를 택했다. 사업자 스스로 책임을 지게 하겠다는 것이다. 이는 EU AI 법이 강제적 규제와 막대한 과징금(전 세계 매출의 7%)으로 준수를 강제하는 것과 대조적이다. 과연 자율규제만으로 창작자의 권리를 보호할 수 있을까? 미국의 15억 달러 합의도, 독일의 판결도 결국 '소송'이라는 강압적 수단으로 이루어졌다. 한국은 이제 시작 단계다.지상파 3사 대 네이버 소송의 3차 변론은 AI 기본법 시행일과 같은 날 열린다. 우연의 일치일까, 아니면 상징적 메시지일까? 독일 법원이 오픈AI에 학습 데이터 정보 제공을 명령한 것처럼, 한국 법원도 투명성을 요구할 것인가. 앤스로픽처럼 대규모 합의로 끝날 것인가, 아니면 새로운 법리가 만들어질 것인가. "AI가 정말 학습 데이터를 무단으로 사용해도 되는가"라는 질문에 한국이 어떤 답변을 내놓을지 주목해야 한다. 그 답변이 앞으로 한국 AI 산업의 방향을 결정할 것이기 때문이다. 창작자의 권리와 AI 개발의 자유 사이에서, 한국 법정은 어떤 선택을 할 것인가.