인공지능은 더이상 법의 사각지대에 놓인 새로운 기술이 아니라, 법정에 서서 심판받는 존재가 되었습니다. 법정 기록과 판결문, 각국의 입법과 행정지침을 토대로, 인공지능을 둘러싼 갈등이 실제로 어떻게 ‘사건’과 ‘판결’의 언어로 번역되는지를 따라가 보려 합니다.

잠깐, 그렇다면 나는?

여기서 잠깐, 오마이뉴스 독자들이 궁금해 할만한 문제를 같이 풀어보겠다.



Q. 내가 블로그에 올린 글도 AI가 학습했을까?



그렇다. 공개된 웹페이지는 대부분 AI 학습 대상이다. 당신의 일상 글, 취미 리뷰, 가족 이

야기 모두가 어딘가의 모델이 '읽고 있다'.



Q. 그럼 내 글을 학습한 AI가 비슷한 글을 쓴다면 나도 소송할 수 있을까?



지금은 '누가 피해를 입증하느냐'가 관건이다. 개인이 소송을 제기하려면, 자신의 글이 AI

학습에 사용되었고, 그 결과 자신의 창작물이 대체되었다는 인과관계를 입증해야 한다. 더구나

아직 우리나라에는 AI 학습을 둘러싼 명확한 판례가 없다.



대학에서 인공지능 윤리를 가르치고 있습니다. 다음 편에서는 시선을 한국 법정으로 옮깁니다. 네이버·여기어때·민다 등 국내 데이터·크롤링·데이터베이스 판례를 통해, '공개된 정보니까 마음대로 써도 된다'는 직관이 왜 더 이상 통하지 않는지, 그리고 이 판례들이 곧 AI 학습 데이터 논쟁과 어떻게 맞물리게 될지 살펴보겠습니다.

챗지피티(ChatGPT)에 "조앤 롤링 스타일로 단편소설 써줘"라고 입력했더니, <해리포터> 시리즈와 놀랍도록 비슷한 문장들이 쏟아졌다. 어둡고 마법 같은 분위기, 주인공의 자기 성찰, 우정의 가치에 관한 메시지. 롤링 특유의 문체까지 흉내냈다. 이건 학습일까, 표절일까?2025년 한 해에만 전 세계에서 70건이 넘는 생성형 AI 저작권 소송이 쏟아졌다. 이 가운데 상당수가 미국 연방 법원에 계류 중이다. 작가들은 "내 책 전체를 허락 없이 학습했다"고 주장하고, AI 기업들은 "우리는 그냥 통계 패턴만 뽑았을 뿐"이라고 반박한다. 그 싸움의 한가운데, '공정이용'과 '변형적 사용'이라는 낯선 법률 용어가 서 있다.미국 저작권법에서 '공정이용(fair use)'은 네 가지 질문으로 요약된다. 첫째, 사용의 목적과 성격은 무엇인가(상업적·변형적 사용 여부). 둘째, 원 저작물의 성질은 어떤가(사실 위주인지, 창작성이 강한지). 셋째, 어느 정도 중요한 부분을 사용했는가. 넷째, 그 사용이 원 저작물의 시장이나 가치에 어떤 영향을 미치는가.미국 법정은 이 질문에 '변형적 사용(transformative use)'이라는 개념을 가져와 답하고 있다. 인공지능은 책을 그대로 보여주기 위해 복제하는 것이 아니라, 통계적 패턴을 추출해 새로운 문장을 만들어내는 도구를 훈련하는 것이므로 목적과 성격이 원래 저작물과 다르다는 논리다. 이때 공정이용의 첫 번째 요소는 AI 개발사에 비교적 유리하게 기울어진다. '그냥 베낀 게 아니라, 완전히 다른 용도로 쓴 것 아니냐'는 주장에 힘이 실리는 것이다.그렇다면 미국 법원은 일관되게 AI 기업에 유리한 판단을 내리고 있을까? 2025년 6월 23일과 25일, 불과 이틀 간격으로 캘리포니아 북부지방법원에서 두 판결이 나왔다. 두 사건에서 모두 AI 기업이 승소했지만, 판사가 남긴 메시지와 이후 사건에 미치는 파장은 전혀 달랐다. 그 차이를 가른 것은 결국 '증거'였다.먼저 23일 윌리엄 알섭(William Alsup) 판사는 바르츠 대 앤트로픽 사건(Bartz v. Anthropic) 1심 판결에서 클라우드(Claude)의 AI 학습을 "우리가 평생 보게 될 가장 변형적인 기술"이라고 평가했다. 이 사건은 안드레아 바르츠(Andrea Bartz) 외 작가 2명이 클라우드 모델을 개발한 앤트로픽 주식회사를 상대로 저작권 침해 소송을 제기한 것으로, 이들은 AI 학습 데이터에 자신들의 책이 무단 사용됐다고 주장했다.그러나 법원은 "합법적으로 취득한 책을 이용한 LLM(Large Language Model: 대규모 언어 모델) 훈련은 본질적으로 변형적"이며, 원고들이 자신들의 책 시장이 실제로 어떻게 훼손됐는지를 구체적으로 입증하지 못했다고 판단했다. 그 결과, 앤트로픽이 승소했다.이틀 뒤인 25일 카드리 대 메타 사건(Kadrey v. Meta)에서도 빈스 차브리아(Vince Chhabria) 판사는 메타(Meta) AI가 라마(Llama: 메타 AI가 2023년 출시한 LLM) 모델 훈련에 작가들의 책을 사용한 것을 "고도로 변형적"이라고 보며 Meta의 손을 들어줬다.리차드 케드레이(Richard Kadrey) 외 작가 14명은 메타가 해적(불법복제) 사이트에서 가져온 책들까지 포함해 학습시켰다고 주장했지만, 차브리아 판사는 "원고들은 '메타가 작품을 복제해 비슷한 작품으로 시장을 범람시켜 시장 희석(market dilution)을 야기한다'고 말하면서도, Meta의 모델이 실제로 자기 작품 시장을 어떻게 잠식하는지에 대한 증거를 전혀 제시하지 않았다"고 말했다.그는 한 걸음 더 나아가 "이 판결은 메타의 저작물 사용이 항상 합법이라는 의미가 아니다. 단지 이 원고들이 잘못된 주장과 부족한 증거를 들고 왔다는 뜻일 뿐"이라고 덧붙였다. 이어 "원고들이 주장한 시장 희석 이론은 이 소송뿐 아니라 공정이용 전체에서 인간 저작권자의 승리를 이끌 수도 있었지만, 이번 사건에서는 그 이론을 뒷받침할 증거 기록을 만들지 못했다"고 적시했다. 즉, AI 기업이 이긴 것이 아니라, 원고가 '입증'에서 졌다는 메시지를 남긴 것이다.같은 해 다른 법원에서 만난 미국작가협회 대 오픈AI 사건(Authors Guild v. Open AI)의 판단은 달랐다. 2025년 10월 27일, 시드니 스타인(Sidney Stein) 판사는 오픈AI의 소송 기각 요청을 거부했다. 베스트셀러 작가 조지 마틴(George R.R. Martin)과 존 그리샴(John Grisham) 등 17명의 작가들은 "챗GPT가 내 책의 줄거리를 요약하고, 등장인물 이름까지 정확히 말한다"며 구체적 대화 기록과 스크린샷을 법정에 제출했다. 마틴은 챗GPT가 자신의 대표작 <왕좌의 게임(Game of Thrones)>의 줄거리와 인물 관계를 상세히 설명하는 장면을 그대로 제시했다.스타인 판사는 이를 보고 "분별력 있는 관찰자라면 챗GPT의 요약이 마틴의 원작 줄거리, 캐릭터, 주제를 그대로 모방(parroting)하면서 원작의 전반적인 톤과 분위기를 전달하기 때문에, 실질적으로 유사하다고 결론지을 수 있다"고 판시했다. 이는 "AI가 원작을 '기억하고 재현하고 있다'"는 작가들의 주장을 받아들인 것이다. 다시 말해, 여기서는 원고가 실질적 유사성과 잠재적 시장 대체 가능성을 보여주는 증거를 어느 정도 갖추었다고 본 것이다.정리하면, 바르츠 대 앤트로픽 사건이나 카드리 대 메타 사건 판결에서는 변형성 자체보다 '입증 실패'가 결정적이었고, 미국작가협회 대 오픈AI 사건에서는 작가들이 가져온 구체적 증거가 재판의 문을 열었다. 같은 'AI 학습'이라도, 법정에서는 결국 "AI가 얼마나 변형적인가"가 아니라 "누가 무엇을 어디까지 입증했는가"가 승패를 가른 셈이다.미국 법원은 'AI 훈련은 공정이용이다'라는 일반 원칙을 세운 것이 아니라, '이 사건에서 이 증거만 가지고는 침해를 단정하기 어렵다'는 정도의 신중한 입장을 보인다. 알섭 판사와 차브리아 판사가 '변형적'이라고 인정한 것은 사실이다. 하지만 그들이 더 강조한 것은 '원고들이 증거를 제시하지 못했다'는 점이었다. 즉, 변형성 주장만으로는 충분하지 않다. 증거가 전부다.특히 중요한 것은 '시장 희석' 이론이 떠오르고 있다는 점이다. 차브리아 판사가 예고한 대로라면, AI가 생성한 콘텐츠가 원작과 유사해 원작 시장을 실질적으로 대체하거나 희석시킨다는 것을 입증하는 원고가 나타나면, 공정이용 방어는 무너질 것이다.놀랍게도 같은 AI 학습 문제에 대해 미국과는 완전히 다른 접근을 하는 국가들이 있다. 독일 법원은 2025년 11월 독일음악저작권협회(GEMA)가 오픈AI를 상대로 제기한 저작권 침해 소송에서 인간 저작권자들의 손을 들어줬다. 챗GPT가 독일 인기곡 가사를 거의 정확히 재현한다는 이유였다.반면 일본의 문화청은 2024년 4월 발표한 'AI와 저작권에 관한 입장' 문서에서 AI 학습을 원칙적으로 허용하되, 특정 작가의 화풍을 모방하는 것만 저작권 침해로 인정될 수 있다며 경계했다. 미국의 '증거의 격차'와 유럽의 '암기 금지', 그리고 일본의 '화풍 모방 경계', 이 세 가지 접근이 우리나라에 시사하는 바는 무엇일까?