AI 이미지는 왜 원하는 대로 나오지 않을까?
AI 이미지를 제작하기 위해 많은 AI 서비스를 써보면 항상 원하는 대로 나오지 않아 답답합니다.
왜 이런 문제가 생길까요? AI의 한계점 때문일까요?
(드래프타입 프롬프트 교육 자료 발췌)
특히, 이미지 생성형 AI를 사용했을 때 위와 같은 어려움을 겪는 분들이 많으셨을 겁니다. 오늘 이야기할 주제들이 위와 같은 현상이 일어나는 주요한 원인이라고 이해하셔도 좋습니다.
여러분의 이미지 생성형 AI의 특성에 대한 이해도를 높이기 위해 오늘부터 아래 내용들에 대해 하나씩 콘텐츠로 풀어보려 합니다.
- AI 이미지는 왜 원하는 대로 나오지 않을까?
- 이미지 생성 프롬프트를 가장 적합하게 쓰는 방법
- 국내 1위 프롬프트 전문가가 대신 써주는 프롬프트
- AI 전문가들이 작성한 프롬프트 템플릿
오늘은 첫번째 주제인 'AI 이미지는 왜 원하는 대로 나오지 않을까?'에 대해 다뤄보겠습니다!
1. 이미지 생성형 AI 기술의 현재
사실 이미지 생성형 AI는 우리가 흔히 아는 챗GPT나 클로드 등의 챗봇형 서비스와는 약간 다른 점이 있습니다. 특히, 프롬프트 작성 방식이 조금 차이가 있을 수 있습니다.
다만, 생성형 AI들이 공통적으로 가지는 문제점에 대한 원인은 동일한 경우가 많습니다. 이 내용에 대해서 이해만 하더라도 이미지 뿐만이 아니라 다양한 분야의 AI 서비스를 쓰는 데에 큰 도움이 될 것입니다.
우리가 알아야 할 생성형 AI의 특성에 대해서는 크게 4가지가 존재하는데, 바로 하나씩 다뤄보겠습니다.
2. 생성형 AI는 아직 '어린아이'다.
(드래프타입 프롬프트 교육 자료 발췌)
저희는 생성형 AI를 어린아이에 비유하고는 합니다. 아직 걸음마 단계라고본다는 의미도 있지만 '순수하다.'는 의미에 더 중점을 둡니다.
어린아이는 보통 어른의 고정관념이 없습니다. 그렇기 때문에 어른이 보기에 기발한 창의성을 보여주지요. 생성형 AI도 같습니다. 인간이 마땅히 가지고 있는 고정관념을 아직 100% 이해하고 있지 않습니다.
그렇기에 뛰어난 결과물을 보일 때도 있지만 인간에게는 당연한 지점을 잘 도출하지 못하기도 합니다. 대표적으로 손가락을 잘 표현하지 못하는 특성이 그렇습니다. 우리에겐 손가락이 5개인 것이 당연하지만 생성형 AI에게는 아닙니다.
(출처: Open AI, Sora)
최근 론칭한 오픈AI의 'Sora'는 사람들의 실망감을 많이 샀습니다. 영상 자체의 퀄리티는 상당하지만 물리적인 법칙을 이해하지 못하기 때문이죠. 인터넷에서 'Sora'의 결과물을 찾아보면 물리 법칙을 이해하지 못하는 모습이 많이 보입니다. 실시간으로 인물의 크기와 부피가 변화하는 등의 문제가 있죠. 이런 부분이 모두 인간의 고정관념을 이해하지 못하기 때문입니다. (AI 전문 연구원들은 '공간 지능'이 부족하다고 표현하기도 합니다.)
3. 생성형 AI는 서양 사람?
(드래프타입 프롬프트 교육 자료 발췌)
AI 서비스를 써보면 아무리 이미지를 생성해도 서양인만 도출되는 특성이 있습니다. 사실 이 이유는 매우 단순합니다. 생성형 AI 기술이 태동하고 탄생한 곳이 서양이기 때문입니다.
모두가 알다시피 오픈 AI, 메타, 구글 등의 미국 기업들이 대부분의 거대 언어 모델을 개발했습니다. 사실상 윈도우, 맥과 같은 플랫폼을 미국에서 개발했다고 봐도 과언이 아닙니다. 현재 나오고 있는 AI 서비스들은 모두 이 플랫폼 위에서 어떤 어플리케이션을 만드느냐의 싸움이기 때문입니다.
안타깝게도 미국 기업들이 개발한 만큼의 퀄리티를 내는 국내 거대 언어 모델은 그리 많지 않습니다. 언론에서 한국이 AI 경쟁에 많이 뒤쳐졌다고 연일 보도하는 것도 이 때문입니다.
따라서, 현존하는 AI 서비스들의 근간은 대부분 미국 회사가 개발한 거대 언어 모델 기반이기 때문이며 그로 인해 우리가 접할 수 있는 생성형 AI들은 대부분 서양인이나 다름없다고 봐도 됩니다. 그렇기 때문에 이미지 생성형 AI 솔루션들이 동양인을 잘 그리지 못하거나 한국의 문화적 특성 등을 잘 이해하지 못하는 것입니다.
4. 트렌디한 생성형 AI가 트렌드를 모른다.
(드래프타입 프롬프트 교육 자료 발췌)
이미지 생성형 AI를 쓸 때, 대부분의 사람들은 AI가 당연히 모든 것을 알 것이라 가정합니다. 하지만 생성형 AI가 모르는 것은 아직 많습니다. 특히, 최신 트렌드에 대해 모를 때가 많지요.
Chat GPT를 예로 들어볼까요? 현존하는 생성형 AI 중 가장 똑똑하다고 평가 받는 GPT도 최신 트렌드를 즉각적으로 반영하지는 못합니다. 필연적인 학습 시간이 필요하기 때문입니다. (물론 최근에는 실시간 반영에 대한 기능들이 대폭 업데이트 되고 있습니다.)
이미지의 경우 학습해야 할 데이터 부피가 훨씬 큽니다. 따라서 시간이 더 걸릴 수 밖에 없습니다. 보통 사람들은 이미지 생성형 AI를 쓸 때도 지엽적인 브랜드 명이나 최신 트렌드에 대해 설명하며 AI에게 그려내라고 명령합니다.
하지만 서양에서 태어난 이미지 생성형 AI 입장에서는 국내 브랜드는 생소하고, 1년 전을 살고 있어 최근에 일어난 사건을 알기 어렵습니다. 그렇다 보니 잘 이해하지 못하게 되는 것입니다. 이 부분은 다음 콘텐츠에서 더 상세하게 다뤄보겠습니다.(해외의 코카콜라와 같은 유서 깊고 세계적인 브랜드는 알고 있습니다.)
5. 일관성 없이 이미지를 내놓는 AI
2024년, 콘텐츠 분야에서 생성형 AI를 상용화하기 가장 어려운 이유 중 하나는 '일관성'이었습니다. AI로 생성할 모델의 얼굴이나 마케팅 이미지로 쓸 제품의 디테일이 생성 버튼을 클릭할 때마다 달라지기 때문이었습니다.
생성형 AI는 생성을 할 때마다 빈 도화지 위에 그림을 새로 그립니다. 다양한 ControlNet이나 기능들을 써도 미묘하게 다른 이유가 이 특성 때문입니다.
생성형 AI를 개발하는 기업 모두 이 '일관성'을 잡기 위해 부단히 노력한 한 해였습니다. 하지만 아직은 100% 완벽하지 않기 때문에 생성할 때마다 미세하게 다른 것입니다.
위의 특징들로 인해 프롬프트의 중요성이 커지고 있습니다. 물론 프롬프트는 인간 입장에서 쉬운 방식은 아닙니다. 빈 바탕에 뭐라고 적어야 할지 막막하기 때문입니다.(기술의 발전으로 나중에는 프롬프트라는 것이 없어질 수도 있지 않을까 생각을 많이 하곤 합니다!)
드래프타입은 최대한 많은 분들이 손쉽게 생성형 AI를 통해 원하는 이미지를 만들도록 돕고 있습니다. 서비스만으로는 부족하기에 콘텐츠를 통해 도움이 될만한 정보나 템플릿들을 무료로 공개하려 합니다.
다음 시간에는 오늘 말씀드린 배경 지식을 바탕으로 '프롬프트를 작성하는 가장 적합한 방식과 가이드'에 대해 다뤄보겠습니다.
지금까지 AI 마케팅 콘텐츠 솔루션 드래프타입이었습니다!