[2025년 6월 17일 먀 AI 뉴스레터로 발행한 글입니다.]
무인도에서 가장 빠르게 구조 받는 법을 아시나요?
무인도에 갇히면 모래 사장에 SOS 대신, 디즈니 캐릭터를 큼지막하게 그리라는 우스갯소리가 있습니다. 그러면 저작권에 예민한 디즈니가 누구보다 빠르게 찾아올 것이라는 의미의 농담인데요. 실제로 1987년, 일본의 한 초등학교에서 졸업을 기념해 어린이들이 수영장 바닥에 그린 미키마우스를 보고 디즈니가 항의한 사건이 있습니다. 아이들의 그림은 결국 페인트로 덮어야 했습니다.

당시 기사. 출처: 네이버 블로그 <아키의 애니저장소>
디즈니 캐릭터를 똑같이 만들어 활용한 이미지를 겁도 없이 배포하는 곳이 있습니다. 바로 이미지 생성형 AI의 선두주자 미드저니(Midjourney)인데요. 어린이들이 그린 그림에도 민감한 디즈니가 가만히 있을 리 없겠지요? 최근, 디즈니는 유니버설과 함께 미드저니를 저작권 침해로 고소했습니다.
디즈니는 참지 않아!
디즈니와 유니버설은 자신들이 100년 넘게 미국만의 창의적인 혁신을 이끌어왔다며 고소장의 포문을 엽니다.

고소장 서문 일부. 출처: 미국 연방 법원
그간 디즈니와 유니버설이 들인 노력과 투자에 대한 대가를 미드저니가 가로채고 있다고 주장하는데요. 미드저니는 허락받지 않은 콘텐츠를 AI를 활용해 무단 배포하는 ‘자판기’와 같다고 표현합니다. 단 한 푼도 투자하지 않고 디즈니와 유니버설의 인기 캐릭터를 활용해 수익을 내고 있다며, 미드저니를 전형적인 저작권 무임승차자(“quintessential copyright free-rider”)이자, 끝도 없는 표절의 구렁텅이(“bottomless pit of plagiarism”)라고 강하게 비판합니다.
실제로 고소장에 첨부한 수많은 자료 중 일부만 보아도, 미드저니가 생성한 이미지는 공식 이미지라고 속을 만큼 똑같습니다.

미드저니가 생성한 이미지와 디즈니&유니버설의 캐릭터 비교. 위는 <토이스토리>의 버즈 라이트이어, 아래는 <슈퍼배드>의 미니언즈다. 출처: 미국 연방 법원
디즈니와 유니버설은 미드저니가 위험하거나 선정적인 이미지를 만들어 달라는 요청은 거부하는 점을 근거로 들며, 미드저니는 모델을 학습시키고 이미지를 생성하는 과정에서 저작권이 걸린 데이터를 제외하고 차단할 능력이 충분함에도 하지 않았다고 주장합니다. 저작권 침해가 다분히 의도적이고 계산된 행동이라고 지적하지요.
혹시 비슷한 상황이 떠오르시나요?🤔
오픈AI가 몰고 온 지브리풍 사진 유행 당시에도 저작권 문제가 불거졌습니다. <침해다 vs. 아니다> 논쟁은 있었지만 명확한 결론은 없었는데요. 작가들의 저작권을 지키기 위한 기술들이 개발되고 있습니다. AI가 그림이나 사진 등, 이미지 작업물을 함부로 학습할 수 없도록 이미지에 워터마크(저작권 보호를 위한 디지털 표식)를 새기는 기술인 글레이즈와 나이트셰이드 등이 있지요.
생성형 AI와 저작권에 대한 문제는 비단 이미지 모델에만 국한되지 않습니다. 우리가 자주 쓰는 챗GPT나 제미나이와 같은 LLM도 마찬가지지요. ‘왕좌의 게임’ 작가 조지 R. R. 마틴을 필두로 한 작가 단체는 오픈AI를 상대로 저작권 소송을 진행 중입니다.
그림에 비해 덜 직관적인 텍스트는 표절이나 저작권 침해를 알아보는 데 상대적으로 시간이 필요합니다. 이처럼 텍스트는 AI 생성 여부를 판별하기 어려워, AI가 쓴 글이 실제 콘텐츠처럼 유통되는 문제가 커지고 있는데요. 이를 해결하기 위해, 텍스트에도 워터마크를 심어 AI가 생성한 것인지 아닌지를 판별하려는 연구가 진행되고 있습니다. 자세히 알아볼까요?🔎
텍스트에도 워터마크를 심을 수 있을까?
메릴랜드 대학의 연구팀은 사람이 읽기에는 전혀 눈치챌 수 없지만 알고리즘을 통해서는 명확하게 식별 가능한 워터마킹 기법을 제안합니다.
LLM이 텍스트를 생성할 때, 전체 어휘 중 일부를 ‘Green List’로 무작위로 지정한 후, 그 목록에 포함된 단어가 더 자주 선택되도록 확률을 미세하게 조정하는 방식인데요. 이렇게 생성된 텍스트는 겉보기엔 자연스럽지만, 통계적으로 분석하면 특정 단어가 예상보다 자주 등장하는 특유의 패턴을 띕니다. 이 패턴이 결국 워터마크가 되어, AI 사용 여부를 높은 확률로 검출할 수 있지요.🎯
연구진의 방식은 기존 모델을 재학습시키거나 모델 내부에 접근하지 않고도 워터마크를 감지할 수 있습니다. 실험에 따르면 25개의 토큰만 사용된 짧은 텍스트에서도 워터마크를 감지할 수 있을 정도로 민감하지요. 실험 방식과 예시를 보시죠!
먼저, 연구진은 아래의 프롬프트를 입력하여 AI가 뒷부분을 이어나가며 답하도록 유도합니다.

이번 연구에서는 언어 모델이 생성한 출력물에 워터마크를 삽입하는 방법을 다룬다. 워터마크란, 텍스트에 숨겨진 패턴으로, 사람 눈에는 보이지 않지만 알고리즘적으로는 해당 텍스트가 인공적으로 생성된 것임을 식별할 수 있도록 해주는 표시다.
[…]
우리가 추구하는 워터마크는 다음과 같은 특성을 갖는다:
아래는 위의 프롬프트에 대해 워터마크를 적용하지 않은 경우와 적용한 경우의 AI 답변입니다:

그린과 레드 리스트로 구분된 문장을 시각적으로 보여주는 이미지. 출처: 논문
워터마크를 남기기 위해 AI가 일부러 Green List에 있는 어휘를 상대적으로 더 자주 사용하도록 유도한다고 했지요?
위 예시를 보면, 워터마크가 삽입된 텍스트는 Green List 어휘를 유난히 많이 사용했다는 사실을 알 수 있습니다. 전체 36개 토큰 중 Green 단어가 무려 28개 등장했는데요. 연구진이 설정한 Green 비율(0.25)에 따르면, 사람이 쓴 글이라면 평균적으로 약 9개 정도 등장하는 것이 정상입니다. 하지만 실제로는 28개나 등장해 기대값을 크게 벗어났지요. 이런 편차가 우연히 발생할 확률은 약 6×10⁻¹⁴에 불과합니다. 즉, 이 기술을 활용하면 AI가 생성한 글인지 수학적으로 높은 정확도로 판단할 수 있다는 게 연구진의 설명입니다.🤖
최근 한 AI 감지 플랫폼이 1776년에 작성된 미국의 독립선언문의 99.99%가 AI로 쓰여졌다는 결과를 제공해 화제가 됐습니다.

미국 건국의 아버지들이 과연 어떤 챗봇을 썼는지 궁금하다는 사용자. 출처: X @TreungTPhan
저도 궁금해서 실험해 봤는데요. ZeroGPT라는 플랫폼에 독립선언문을 넣어본 결과, 내용의 96.54%를 AI가 썼다는 결과가 나왔습니다.

실제로 AI를 사용하지 않았는데도, AI가 쓴 글이라는 판정이 나와 억울함을 겪는 사례도 등장하고 있습니다. 이번에 살펴본 연구 역시 다양한 우회 공격에 대해서는 방어가 부족하다는 한계가 존재하는데요. 완전한 검출은 아직 한계가 큰 분야입니다.
소설 ‘쥬라기 공원’에서, 수학자 이안 말콤은 과학 기술을 물려받은 상속에 비유합니다. 무술을 오랜 기간 연마한 장인은 그 기술의 무게를 알기에 사람을 해치는 데 함부로 무술을 사용하지 않지만, 과학 기술은 마치 유산처럼, 노력 없이 앞에서 이룬 지식을 물려받기에 때론 무분별하게 사용된다는 의미입니다.

영화 <쥬라기 공원> 속 이안 말콤. 출처: Variety
이안은 너무도 빠르게 발전하는 과학에 대해, 인간은 준비가 되지 않았다고 말합니다. 소설 속 대사지만, 현실도 크게 다르지 않다는 생각이 듭니다. 잠시 숨을 고르고, 우리가 발전시키고 있는 기술의 무게를 되새겨볼 때입니다.
📝 참고자료
📮 먀 AI 뉴스레터 단순 트렌드 나열이 아닌, '진짜' 인공지능 이야기
👉🏼 구독하기: https://mmmya.stibee.com/