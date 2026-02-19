큰사진보기 ▲AI ⓒ tinkerman on Unsplash 관련사진보기

덧붙이는 글 | 대학에서 인공지능 윤리를 강의하고 있습니다. 이번 편이 ‘AI가 무엇을 먹고 컸는가(학습데이터)’를 묻는 소송이었다면, 다음 편은 ‘AI를 어디에 세울 것인가(데이터센터)’를 둘러싼 행정소송으로 시선을 옮깁니다. 데이터센터 불허 처분을 둘러싼 용인시 행정소송, 전자파·소음·경관을 이유로 한 인허가 분쟁, 머스크의 xAI 데이터센터를 상대로 한 환경소송까지, AI 인프라가 행정법·환경법의 새로운 전장이 되고 있는 현장을 짚어보면서, 국가 AI 전략, 주민들의 우려, 그리고 법원이 선택한 기준 사이의 간격을 따라가보겠습니다.

미국과 유럽 법정에서 시작된 AI 저작권 전쟁이 이제 서울중앙지법으로 옮겨왔다. 앤트로픽의 15억 달러(약 2조 1760억 원) 합의와 독일 GEMA의 오픈AI 승소 판결이 훈련을 어디까지 허용하고, 그 대가와 통제를 어떻게 설계할 것인가라는 질문을 던졌다면, KBS·MBC·SBS가 네이버를 상대로 낸 국내 첫 AI 뉴스 학습 소송은, 인공지능기본법이 채우지 못한 학습 데이터·저작권의 빈틈을 한국 법정이 어떻게 메울 것인지를 가늠하게 만드는 첫 시험대가 되고 있다.2025년 9월, 챗봇 클로드 개발사 앤트로픽은 작가들이 제기한 집단소송(Bartz v. Anthropic)에서, 최대 15억 달러를 지급하는 내용으로 원고 측과 합의했다. 미국 법원은 이 합의를 예비 승인하며, 2026년 4월 최종 승인 심리를 예고했다. 재판부는 앤트로픽의 학습 방식이 공정이용에 해당할 여지가 있다는 점을 시사했지만, 앤트로픽은 거대 배상으로 분쟁을 청산하는 길을 택했다.같은 해, 독일 뮌헨 제1지방법원은 음악저작권 관리단체 GEMA가 제기한 소송에서 OpenAI의 GPT 모델이 노래 가사를 학습·기억·재현한 행위를 저작권 침해로 판단했다. 법원은 가사가 모델 파라미터에 암기된 채 남아 간단한 프롬프트만으로 동일한 가사를 재생산할 수 있다며, 이를 단순한 텍스트·데이터 마이닝이 아니라 복제·전송이라고 판단했다. 그 결과 OpenAI는 손해배상뿐 아니라, 같은 방식의 이용 중지와 어느 가사를 얼마나 어떻게 썼는지에 관한 정보제공·열람 의무까지 명령받았다. 앤트로픽이 돈으로 정리된 라이선스 구조를 선택했다면, GEMA 판결은 모델 내부에 남은 흔적과 출력을 기준으로 침해와 정보공개 의무를 강하게 설정한 것이다.이 두 사건은 서로 다른 길을 택했지만, 둘 다 AI 학습·출력이 저작권과 만나는 경계에서, 보상·중지·정보공개를 어떻게 엮어야 하는가라는 질문에 답하고 있다. 그 질문이 지금, 서울중앙지법 법정에서도 제기되고 있다.2025년 1월 KBS·MBC·SBS 지상파 3사는 네이버가 자사 뉴스를 생성형 AI 하이퍼클로바 학습에 무단 사용했다며, 저작권법 및 부정경쟁방지법 위반에 따른 손해배상과 학습금지 등을 청구했다. 'AI 시대 언론의 생존', '빅테크 vs. 저작권' 같은 거대 구호가 붙었지만, 법정 안 싸움은 기사 한 건, 문단 몇 줄, 프롬프트 한 줄에서 시작했다.2025년 11월 6일 열린 2차 변론에서 재판부는 지상파 3사가 저작권 침해를 주장하는 이상, 구체적 침해는 개별 기사·프로그램 단위에서 판단할 수밖에 없다며 침해 대상 기사와 문장을 한 건씩 특정해 오라고 요구했다. 네이버에게도, 제휴를 통해 제공받은 기사 중 실제로 AI 학습에 사용한 콘텐츠를 특정해 그 목록과 범위를 제출하라고 주문했다.2026년 1월 22일 3차 변론에서 지상파 3사는 약 9만 7천 개에 이르는 침해 주장 기사 목록을 제출했다. 네이버는 기사 제목만 나열된 형식이라 개별 검토 부담이 크다고 토로했다. 재판부는 이 목록을 전제로 공정이용 법리를 본격적으로 다룰 수밖에 없다며, 4월 9일 4차 변론까지 양측이 공정이용 주장과 근거를 정리해 제출하라고 요구했다. 지상파는 제휴약관상 뉴스 콘텐츠를 AI 학습에 사용하는 것은 무단 복제·이용에 가깝다고 주장하고, 네이버는 앤트로픽 사건을 근거로 AI 학습 자체는 위법이 아니라고 맞서고 있다. 이 4차 변론은 한국형 AI 저작권 기준, 특히 공정이용과 학습 데이터 범위를 가르는 첫 시험대가 될 가능성이 크다.지상파 3사는 저작권법과 부정경쟁방지법 위반을 주장하며, 손해배상과 AI 학습금지를 함께 청구했다. 여기서, 인공지능을 규율하는 인공지능기본법이 올해 세계 최초로 시행되었는데, 왜 아직도 저작권법으로 싸우는가라는 질문을 하게 된다.현행 인공지능기본법은 동의 없이 저작물을 AI 학습 데이터로 사용하는 행위를 금지하거나, 그에 따른 민사상 손해배상이나 침해금지 청구 조항을 두고 있지 않기 때문이다. 이 법은 고위험·생성형 AI를 이용한 제품·서비스 제공자에게 "AI 기반이라는 사실"과 "AI가 생성한 결과물이라는 사실"을 이용자에게 고지·표시할 의무만을 부과할 뿐이다.지상파 3사와 네이버의 소송은 결국, 인공지능기본법이 있음에도 AI 학습 데이터와 저작권 논쟁을 여전히 저작권법 해석에 의존하는 현실을 드러낸다. 이 사건은 현행 인공지능기본법의 공백을 전제로 진행되면서, 동시에 그 공백을 메우려는 입법 논의를 밀어올리는 시험대 역할도 수행하고 있다.이 공백을 메우려는 시도가 2025년 6월 발의된 인공지능기본법 일부개정법률안이다. 박수현 의원이 대표 발의한 이 개정안은 생성형 AI 사업자에게 학습데이터 정보 공개에 노력할 의무를 지우고, 저작권자가 요청하면 자신의 저작물이 학습에 쓰였는지 확인할 수 있는 절차를 마련하도록 요구한다. 구체적인 공개 범위와 방식은 시행령에서 정하도록 남겨두었지만, 적어도 완전한 블랙박스 상태는 더 이상 용인하기 어렵다는 인식만큼은 법률 차원의 원칙으로 끌어올린 셈이다.개정 인공지능기본법은 저작권법을 대체하는 법이 아니다. 저작권법이 '무엇을 하면 침해냐 아니냐'를 정하는 실체법이라면, 개정 인공지능기본법은 '그 침해 여부를 따지기 위해 AI 사업자가 학습 데이터를 어디까지 드러내야 하느냐'를 정하는 절차·투명성 법에 가깝다. GEMA 판결이 정보제공·열람 의무까지 명령하며 출력과 훈련 경로를 추적 가능한 상태로 만들 것을 요구한 것처럼, 한국의 개정 논의도 침해 판단의 전제인 정보 접근권을 제도화하려는 시도라고 볼 수 있다.법이 아직 닿지 못한 땅을 법정이 먼저 밟아가고 있다. 그리고 그 발자국을 따라 인공지능기본법과 저작권법의 다음 문장이 쓰일 것이다. 그 문장이 빅테크와 창작자 중 누구의 손을 들어줄지, 아니면 모두가 감당할 수 있는 절충이 될지는, 지금 이 소송을 지켜보는 우리 사회가 어떤 기준과 균형을 요구하느냐에 따라 달라질 것이다.